Алгоритм общественной модерации -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [18.224.43.245]

правила раздела Алгоритмы

1. Помните, что название темы должно хоть как-то отражать ее содержимое (не создавайте темы с заголовком ПОМОГИТЕ, HELP и т.д.). Злоупотребление заглавными буквами в заголовках тем ЗАПРЕЩЕНО.
2. При создании темы постарайтесь, как можно более точно описать проблему, а не ограничиваться общими понятиями и определениями.
3. Приводимые фрагменты исходного кода старайтесь выделять тегами code.../code
4. Помните, чем подробнее Вы опишете свою проблему, тем быстрее получите вразумительный совет
5. Запрещено поднимать неактуальные темы (ПРИМЕР: запрещено отвечать на вопрос из серии "срочно надо", заданный в 2003 году)
6. И не забывайте о кнопочках TRANSLIT и РУССКАЯ КЛАВИАТУРА, если не можете писать в русской раскладке

Модераторы: Akina, shadeofgray

Новое голосование

Алгоритм общественной модерации

JoeUser

Сообщ. #1 , 23.05.20, 12:28

Unregistered

Буэнос диас, амигос!

Сразу должен предупредить - вопрос ну очень не простой, очень. На быстрые решения и не надейтесь. Но вопрос важный, гы-гы ... может когда нибудь спасет вашу или ваших близких жысть.

Постановка вопроса

Какими методами можно обеспечить получение наилучшего ответа на поставленный вопрос средствами сообщества (посетителей, незнакомых посетителей)?

Небольшая преамбула

Уже ну очень давно исследуются вопросы принятия коллективных решений. Даже я когда-то, в 1997 году, умудрился защитить диплом по проектированию локально-вычислительной сети автотранспортного предприятия на основе системного анализа и теории принятия решений. Чтобы не сеять туман - кратко. Выбрал пять предложений от пяти фирм-поставщиков решений, и прогнал их по "классике" (о ней позже). Нашел оптимальный вариант. Дипломное решение готово. Ну а, по-скольку, та тогдашнее время, диплом по системному анализу я защищал последним за последние 10 лет - я был в фаворе всей комиссии, но реально меня понимал только мой препод, по совместительству и рецензент.

Полезная ссылка по теории: «СОВРЕМЕННЫЕ ПРОБЛЕМЫ ПРИКЛАДНОЙ МАТЕМАТИКИ И ИНФОРМАТИКИ»

Суть вопроса

1) Когда мы говорим о системном анализе и теории принятия решения, мы подразумеваем базис:
a) Формулировка проблемы
б) Наличие ведущего и счетного количества экспертов
в) (Не обязательно) Но предполагаемую заранее компетентность эксперта Х по области Y
2) То топику - вопрос гораздо шире:
a) Эксперты и их компетентности - неизвестны
б) Эксперты могут "играть" в разрез результата - типа трололо или флешмоб для уничижения результата
в) Противодействие "стратегиям" неблагонадежных "экспертов". То же, что и предыдущий пункт, но организовано и локализовано по теме и времени

А нам нужно обеспечить коллективную оценку факту, в виде "да/нет" или "численной шкалы ценности 0..1"

Бытовой пример

Социальная сеть "Одноглазники". Для модерации новых картинок привлекаются все желающие. Каждая картинка предлагается для каждого "желающего общественного модератора". Если картина по теме - модератор ей говорит "да" и получает бал в свою "карму". По прошествии времени оцениваются все положительные и отрицательные решения. И если отрицательных решений больше - модератор потом получает -100 к своей карме. Типа "не вложился в коллективное решение". Не знаю - возможно по результатам там еще как-то выводится "коэффициент компетентности" в завизимости от бонусов и штрафов. Но эта система работала (может и сейчас работает)

Итог, чего хотелось бы

1) Формализовать алгоритм получения "коэффициентов компетентности" экспертов
2) Формализовать алгоритм фиксации прецедента начала флэш-моба по продвижению или дискредитации "события Х"
3) Ну и фильтации фэйк-модераторов (по времени регистрации, по уровню согласованности, по уровню следования среднему (арифметическому, матожиданию)
... &etc.

Я даю себе отчет - поднятый вопрос не простой. И я не жду готовых решений! Мне нужны постулаты, гипотезы, мэй би локальные выводы-решения, все что угодно. Я постараюсь это выстроить в систему, по мере сил.

Всем - щястья! :lol:

swf

Сообщ. #2 , 23.05.20, 16:38

Unregistered

Цитата

Формализовать алгоритм получения "коэффициентов компетентности" экспертов

Вы, как я поняла, предлагаете примерно следующее.

Есть группа экспертов, у каждого свой вес. Сумма всех весов должна быть нормирована каким-то образом. Ну пусть будет 1.
Главный вопрос - как приписать экспертам эти веса.
Организовать тестирование на специальных картинках, где правильный ответ заранее известен.
Тот кто отвечает правильно - получает больший вес, кто неправильно - меньший.

Может, нейросети здесь помогут, в автоматической настройке коэффициентов?

JoeUser

Сообщ. #3 , 24.05.20, 00:20

Unregistered

Цитата swf @ 23.05.20, 16:38

Организовать тестирование на специальных картинках, где правильный ответ заранее известен.
Тот кто отвечает правильно - получает больший вес, кто неправильно - меньший.

Да, примерно так. Но "картинки" это частный случай.
Но тут вопрос в другом - оценка не должна быть "предварительной". Она должна быть постоянной/перманентной.

Добавлено 24.05.20, 00:25

Цитата swf @ 23.05.20, 16:38

Сумма всех весов должна быть нормирована каким-то образом.

Ну нормирование обычное, от максимального. Например эксперты получили каким-то образом баллы:

600, 1000, 400

тогда нормированные коэффициенты будут, соответственно:

0.6, 1.0, 0.4

swf

Сообщ. #4 , 24.05.20, 10:48

Unregistered

Цитата JoeUser @ 24.05.20, 00:20

Обычно нормируют так.
Берут сумму 600+1000+400 = 2000
тогда нормированные коэффициенты будут, соответственно:
600/2000 = 0.3
1000/2000 = 0.5
400/2000 = 0.2
0.3+0.5+0.2 = 1.

JoeUser

Сообщ. #5 , 24.05.20, 11:21

Unregistered

swf, это не очень удобно - если параметров много, уходим в очень мелкие дроби. А при программном вычислении это нежелательно, может теряться точность. Опираться же на максимальный балл - выгоднее. И вычислений меньше, и дроби не такие мелкие. Для примера, пусть у нас не три "эксперта", а три миллиона. Если грубо, придется делить 600/2 000 000 000. А это не айс.

swf	Сообщ. #6 , 24.05.20, 11:40
Unregistered	Понятно. Размерность задачи = три миллиона. Что-то очень быстрое должно работать.

swf

Сообщ. #7 , 24.05.20, 12:06

Unregistered

Есть догадка. Эксперты - вершины графа. Если эксперты оценивают одно и то же одинаково - соединяем их ребром.
Если они оценивают с противоположными знаками - не соединяем. Ну тут надо как-то учитывать количество совпадений со знаком плюс и совпадений со знаком минус.
Флешмоб будет близок к клике.

Сообщение отредактировано: swf - 24.05.20, 16:30

Akina

Сообщ. #8 , 24.05.20, 14:08

Moderator

Профиль · PM

Поощрения: 35 Dgm

Рейтинг (т): 542

Цитата JoeUser @ 24.05.20, 11:21

это не очень удобно - если параметров много, уходим в очень мелкие дроби.

Компьютеру пофиг. Но если очень хочется точности, никто не запрещает хранить и обрабатывать абс. значения весов, а делить для нормализации в единицу уже после получения результата - как я понял, рассматриваются только линейные зависимости?

Кстати, если задача линейная, то она прекрасно решается с привлечением МНК, и всё ограничивается максимум квадратами от икса и общей 4-й степенью (сумм. x*x*y). Да, СЛАУ на 3кк переменных - не сахар, но если решать с выбором главного элемента, то должно быть достаточно точно. К тому же при 3кк факторов с нормальным распределением считай половина будет отброшена за незначительностью.

Black_Dragon

Сообщ. #9 , 25.05.20, 09:44

Full Member

Профиль · PM

Рейтинг (т): 5

Цитата JoeUser @ 23.05.20, 12:28

И если отрицательных решений больше - модератор потом получает -100 к своей карме.

Цитата JoeUser @ 24.05.20, 00:20

Но тут вопрос в другом - оценка не должна быть "предварительной". Она должна быть постоянной/перманентной.

Как-то не вяжется...
Карма и должна плавать.
Пример из Гугл Карт. Когда начинаешь рисовать, все твои действия проходят модерацию. Модераторами участвуют официальные модераторы и такие же выходцы, но с "большим" опытом.
Когда твой "опыт" подрастает, какие-то действия одобряются автоматически.
Но приведу пару отрицательных последствий (один из игрушки, второй из тех же Гугл карт)
1) Была игровая гильдия, играли совместно, для некоторых игровых мероприятий нужно было очень много игровых персонажей (кто знает, например, убить босса). Руководству гильдии (несколько человек) были переданы учетные записи, чтоб при необходимости (когда человек не мог сам присутствовать) вместо него играли другие. Время идет, состав руководство обновляется, и вот так один, с виду адекватный человек, стал главой гильдии. Получив доступ к чужим аккаунтам, он распродал все их игровое имущество...
2) Некая "компания" (в понимании: группа лиц) занималась рисованием чего-то на Гугл картах, получала свой "опыт". При достижении опыта, который позволял получать автоматические утверждения своих действий: ими были испорчены (очень много) данных на Картах (делали некрасивые приписки в названиях объектов на карте). После этого инцидента, лавочка по редактированию Карт (полноценному) была прикрыта.

Еще одна мысля, так же из Гугл карт. Так как, рисовать могли все, то все это делали. Ну в большинстве из благих намерений. Вот он видит, например, нет магазина, надо добавить. Молодец!!!
И что он делает? Пишет в названии: "Круглосуточный магазин Апельсин", хотя правильно надо, название: "Апельсин", категория: "Продуктовый магазин", режим работы: "Круглосуточно".
Т.е. у людей нет нужной компетенции, но они уверены (не все), что все делают правильно.

От пагубных действий (умышленных и нет) ни как не убережешься, если эксперты из народа и не получают ЗП и нет контракта.
Большое!!! количество "экспертов" (и не из одной деревни) должно нивелировать отрицательные всплески.
Ну и перманентный счетчик на количество ошибок (в абсолютных значениях), при достижении "лимита" НЕдоверия - удаляется (например, 100 ошибок), на всегда, из экспертов (счетчик продолжает в нем жить, чтоб обратно не брать)
При хорошей, продолжительной работе эксперта, можно так же делать "положительную" карму, но с не большим процентом дополнительного вклада, чтоб тоже нивелировать вредные действия.

Добавлено 25.05.20, 09:58
Теперь по поводу оценок.

А ИИ прикрутить нельзя?
Конечно, все зависит от того, что оценивать, что-то материальное (что за птица на фото) или человеческое (казнить или помиловать)
Если материальное, то один ИИ должен определять "что". В случае расхождения с "экспертами" сигналить админам. Возможно с обучением.
Еще один ИИ можно попробовать заточить на действия экспертов. Например, для вычисления "группировок".

JoeUser

Сообщ. #10 , 25.05.20, 10:01

Unregistered

Цитата Black_Dragon @ 25.05.20, 09:44

1) Была игровая гильдия, играли совместно, для некоторых игровых мероприятий нужно было очень много игровых персонажей (кто знает, например, убить босса). Руководству гильдии (несколько человек) были переданы учетные записи, чтоб при необходимости (когда человек не мог сам присутствовать) вместо него играли другие. Время идет, состав руководство обновляется, и вот так один, с виду адекватный человек, стал главой гильдии. Получив доступ к чужим аккаунтам, он распродал все их игровое имущество...
2) Некая "компания" (в понимании: группа лиц) занималась рисованием чего-то на Гугл картах, получала свой "опыт". При достижении опыта, который позволял получать автоматические утверждения своих действий: ими были испорчены (очень много) данных на Картах (делали некрасивые приписки в названиях объектов на карте). После этого инцидента, лавочка по редактированию Карт (полноценному) была прикрыта.

Вот об этом я и писал - либо чел с высокой кармой и съехавшей кукушкой (или намеренно), либо организованный саботаж. Сколько уже было таки прецедентов. Последний, который помню.

Цитата Black_Dragon @ 25.05.20, 09:44

От пагубных действий (умышленных и нет) ни как не убережешься, если эксперты из народа и не получают ЗП и нет контракта. Большое!!! количество "экспертов" (и не из одной деревни) должно нивелировать отрицательные всплески.

Все верно. Но речь не идет о 100% возможности предотвращения. Но если добиться 85-95% (без вмешательства "зарплатных" модеров), то это был бы хороший шаг вперед. ИМХО.

Это примерно тоже, что и борьба с почтовым спамом. Есть шкала признаков, по которой письмо улетает однозначно в спам. Есть письма, которым система приписывает подозрительный признак. Хорошо обученные анти-спам системы достаточно редко пропускают откровенный спам без пометок.

Black_Dragon

Сообщ. #11 , 25.05.20, 10:42

Full Member

Профиль · PM

Рейтинг (т): 5

Читал про это

Ключевое, как я вижу, это очень много экспертов. Что уменьшает 100% вовлеченность экспертов в саботаж.
Так же, система полностью автономна или будет возможность слать сигналы наверх об расхождении?

Примеры из моего студенчества, может на что-то натолкнет.
1) Мы с другом, если препода нет 15 минут, уходили. Однажды, остальные захотели так же поступить. В результате чего, на паре были только мы с другом. :rolleyes:

2) На перекличке все отвечали: я или здесь, кроме меня: тут. Или они все сговорились или просто подхватили чью-то случайную идею, но на одной паре все начали отвечать: тут. Но кроме меня: здесь. (ржачь у всего класса был долгий).

На вид, небольшая группа людей делала неправильные вещи. А по сути противоположные от большинства.
Может как идея, для выявления группировок или подтасовки результатов.

А вообще, универсального средства не бывает, сильно приближенному к идеалу, или узкая специализация может дать более качественный результат.
Может от задачи плясать?

amk

Сообщ. #12 , 25.05.20, 20:56

Guru

Профиль · PM

Поощрения: 4 Dgm

Рейтинг (т): 268

автоматически функционирующая система с большим числом экспертов более-менее устойчива, пока адекватные эксперты составляют подавляющее большинство. В таком случае неадекваты быстро лишаются голоса. Но возможна ситуация, когда именно такие неадекваты получат в каком-то вопросе большинство, и после этого вся система экспертизы может рухнуть.
Кроме того, эксперт в одной области может выдавать не вполне адекватное решение в другой.

JoeUser

Сообщ. #13 , 26.05.20, 00:06

Unregistered

Цитата Black_Dragon @ 25.05.20, 10:42

Согласен. И самое сложное - получается такую систему стартануть (набрать достаточно большое количество экспертов по тематикам).

Цитата amk @ 25.05.20, 20:56

Все верно!!! Примеров масса ... тот же стеровервлоу. Чел копит баллы, потом в абсолютно-незнакомой теме ему может творить дичь. А, имея репутацию в баллах, в периоде участия - он может косвенно влиять на остальных участников. Вот это самое неприятное для любой системы накопления "правильных" знаний/решений/etc.

Black_Dragon

Сообщ. #14 , 26.05.20, 03:13

Full Member

Профиль · PM

Рейтинг (т): 5

Проблема старта, это наличие экспертов, адекватных....
Всякие балбесы в первых рядах, очень активные.
Люди умные сомневаются, раздумывают, а надо ли принимать участие...

Почему систему не запустить в тестом режиме, на этапе которой и будет идти процесс вовлечение экспертов...
Опять все упирается про что это будет. Если это можно с какой-то долей вероятности просчитать (через ИИ например), то на тестовом этапе уже помечать балбесов

Добавлено 26.05.20, 03:22

Цитата amk @ 25.05.20, 20:56

Кроме того, эксперт в одной области может выдавать не вполне адекватное решение в другой.

Тоже очень ключевой момент.
Тогда придется вводить компетентность по разным направлениям.
Ситуация может быть такой, что какая-то область очень узкоспециализированная и почти большинство в ней просто совсем не компетентны. И результатом может быть не просто одно неправильное мнение, а куча неправильных мнения с одинаковым количеством голосов.

Все кино/сериалы смотрят? Американцы дома ходят в обуви, советские люди разуваются... Национальность или место проживание сильно сказывается на мировоззрение и поведение людей. И каждый со своей колокольни прав.

swf

Сообщ. #15 , 26.05.20, 09:37

Unregistered

Модный термин: коллаборация.
Эксперты в одной области - коллаборация.
В науке: Как определить специалистов в одной области по публикациям?
Все цитируют какие-то более старые фундаментальные работы, ну и на кого-то из членов коллаборации ссылаются.
И есть ложные коллаборации: когда друг другу накручивают индекс Хирша.
Всё это представляется графами, графы анализируются, отличают истинные коллаборации от ложных.
Это направление сейчас активно развивается, гуглите, возможно, там есть готовые методы, которые можно будет перенести на интернет-экспертов.

1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)

0 пользователей:

Страницы: (2) [1] 2 все

[ Script execution time: 0,0425 ] [ 14 queries used ] [ Generated: 27.07.24, 04:29 GMT ]