×
Google поняла, как искать «троллей»

Google профинансировала исследование Корнелльского и Стэнфордского университетов, которые создали алгоритм для определения «троллей», прежде чем они создадут слишком много проблем. Пока данные алгоритма не дают стопроцентной точности, но он уже показывает неплохие результаты по ликвидации вредителей.

 

Алгоритм анализирует онлайн-поведение, характерное для «троллей», по предмету разговора, культуре речи и антиобщественному поведению, в том числе фиксирует скорость постов и их количество в единицу времени.

 

Исследование определяло «троллей» в крупных социальных сетях и блогах. На примере CNN, которая имеет базу пользователей в 1 700 000 юзеров и около 40 миллионов сообщений, было изучено и классифицировано немало материала.

 

Мониторинг пользователей и вывел универсальный алгоритм, который может блокировать неугодных людей ради всеобщего спокойствия. При этом обычных пользователей алгоритм не трогает. Исследователи обнаружили, что «тролли», как правило, начинают беседу с нелитературных слов и качество их общения хуже, чем у рядовых пользователей. Они склонны использовать язык, вызывающий негативные отзывы. Алгоритм учитывает ругань и провокацию и научился их распознавать.

 

Кроме того, «тролли» создают посты гораздо чаще, чем обычные пользователи. Пользователи CNN, которые оказались под запретом, например, написали не менее 264 раз, прежде чем получили пожизненный бан. В то время как обычные пользователи в тот же промежуток времени оставляли около 22 сообщений.

 

«Тролли» часто также получают больше ответов от других пользователей, чем обычные пользователи, вероятно, из-за использования негативных высказываний и тому подобного. В конце концов ученые хотят довести алгоритм до 10 сообщений. Этого программе будет достаточно, чтобы определить «тролля» и убрать его с форума или другого общественного ресурса.

 

Автор: Степан Мазур