Системы автоматической модерации пользовательского контента
Недавно прочитал заметку о том, что крупный новостной сайт http://www.huffingtonpost.com/ для того, чтобы модерировать 100 000 (?) комментариев в день, использует автоматизированные средства семантического анализа.
In order to address these issues we break up the indentification task into several sub-tasks. In practice, this means identifying sub-categories of abusiveness such as "Discriminatory", "Inflammatory", "Violent Threats", etc that are easier for a classifier to handle. We can then combine the input of all the sub-category classifiers and form more reliable and consistent conclusions using a meta-classifier. The same approach can be used to identify quality contributions as well with sub-categories such as "Congenial", "Insightful", and "Informative".
Источник: http://adaptivesemantics.com/home/tech
Более того, разработчик технологии, компания Adaptive Semantics, поставляет свое решение некоторым другим популярным сайтам http://adaptivesemantics.com/demo
Интересная идея стартапа, особенно в свете ажиотажа в рунете по поводу ответственности за комментарии на сайтах СМИ. На крупных форумах и в социальных сетях тоже остро стоят вопросы модерации, далеко за пределами фильтрации очевидного спама и мата.
В этой теме хотелось бы обсудить возможности автоматической модерации пользовательского контента.
Похожие темы
Разделы форума
- Привлечение посетителей
- Интернет-магазины и корпоративные сайты
- Контент-проекты и сообщества
- Монетизация сайтов
- Реальные примеры, истории успеха
- Футурология и тренды
- Юридические и финансовые вопросы
- Тестирование сайтов, советы
- Технические вопросы
- Технические аспекты SEO
- Хостинг
- Реклама компаний и сервисов
- Объявления фрилансеров
- Работа, поиск исполнителей
- Сайты ищут рекламодателей
- Об этом сайте
Теги к теме Системы автоматической модерации пользовательского контента
имхо возможно, но с большой долей условностей, то есть далеко от идеала, опять получится что-то вроде табу на мат в чата или онлайн играх, когда достаточно поставить пробел между буквами или написать слово с ошибкой и желаемый результат вполне достигается...