Системы автоматической модерации пользовательского контента

Дима аватар
405

Недавно прочитал заметку о том, что крупный новостной сайт http://www.huffingtonpost.com/ для того, чтобы модерировать 100 000 (?) комментариев в день, использует автоматизированные средства семантического анализа.

Цитата:

In order to address these issues we break up the indentification task into several sub-tasks. In practice, this means identifying sub-categories of abusiveness such as "Discriminatory", "Inflammatory", "Violent Threats", etc that are easier for a classifier to handle. We can then combine the input of all the sub-category classifiers and form more reliable and consistent conclusions using a meta-classifier. The same approach can be used to identify quality contributions as well with sub-categories such as "Congenial", "Insightful", and "Informative".

Источник: http://adaptivesemantics.com/home/tech

Более того, разработчик технологии, компания Adaptive Semantics, поставляет свое решение некоторым другим популярным сайтам http://adaptivesemantics.com/demo

Интересная идея стартапа, особенно в свете ажиотажа в рунете по поводу ответственности за комментарии на сайтах СМИ. На крупных форумах и в социальных сетях тоже остро стоят вопросы модерации, далеко за пределами фильтрации очевидного спама и мата.

В этой теме хотелось бы обсудить возможности автоматической модерации пользовательского контента.

Роман РуЛаб аватар
16

имхо возможно, но с большой долей условностей, то есть далеко от идеала, опять получится что-то вроде табу на мат в чата или онлайн играх, когда достаточно поставить пробел между буквами или написать слово с ошибкой и желаемый результат вполне достигается...