Борьба со спамом
Наткнулся на статью: Как спасти свой блог от спама?. Выглядит вроде логично. Меня раньше удивляло откуда в блоге по программированию комментарии со ссылками на кулинарию и строительное дело.
Ваше мнение - действительно ли большинство спамеров приходят на сайт с поисковых систем и могут ли помочь борьбе с ними меры описанные в статье?
Похожие темы
Разделы форума
- Привлечение посетителей
- Интернет-магазины и корпоративные сайты
- Контент-проекты и сообщества
- Монетизация сайтов
- Реальные примеры, истории успеха
- Футурология и тренды
- Юридические и финансовые вопросы
- Тестирование сайтов, советы
- Технические вопросы
- Технические аспекты SEO
- Хостинг
- Реклама компаний и сервисов
- Объявления фрилансеров
- Работа, поиск исполнителей
- Сайты ищут рекламодателей
- Об этом сайте
Теги к теме Борьба со спамом
От части спамеров избавиться позволит, но не от всех. Выбор сайтов для спама действительно осуществляется при помощи парсинга. Но хочу отметить, что для того чтобы спамить, не обязательно находить на странице слово "комментировать" и т.п.
Возьмём стандартный движок WP, отпарсить сайты на этом движке можно довольно просто. Почти все сайты содержат файл: wp-login.php и другие отличительные черты.
Сделайте поиск расширенный по выдаче, чтобы в урле содержались эти строки, и вот вам сайты на WP (гугл выдал около 6 с лишним млн).
Дальше запрос к комментированию осуществляется к файлу: wp-comments-post.php
POST запрос, 4 поля: author, email, url, comment
Вот собственно и всё. И никакого слово "комментарий".
Есть некоторый опыт борьбы со спамом. Сейчас для блогов склоняюсь к такой схеме:
1. Чуть-чуть модифицируем математическую каптчу, чтобы боты ее не пробивали.
Некоторые боты пытаются честно считать пример. Для них нужно усложнить парсинг примера, добавив в выражение невидимые знаки и числа через span style="display: none;". Можно придумать и другие хитрости в этой области.
Другие боты выбирают одно число и долбят им каптчу, периодически попадая. Нужно отследить это число и исключить его из диапазона ответов.
В друпале всё это несложно сделать, потому что можно включить логгирование каптчи.
Конечно, все эти трюки не могут эффективно работать в глобальном масштабе. Но для нескольких сайтов такая доработанная защита может работать годами.
2. Некоторые блоги попадают в зону внимания "ручных" комментаторов. Например, распространены списки dofollow-блогов. От такого спама можно защититься, закрывая комментарии к старым постам.
Да, я вижу только в этом верное решение от наглого спама. Обычная капча, какой ни был замысловатый там узор, легко распознаётся через antigate, благодаря старательным рукам китайских школьников =).
Мне простенькая капча помогла решить проблему с сотнями комментов, приходящих ежедневно. Хотя судя по логам попытки до сих пор исчисляются сотнями.
Это понятно, что данный метод кардинально решить проблему не сможет. Надежда только на уменьшение потока спама.
Интересная мысль - надо будет попробовать.