Борьба со спамом

vikeng аватар
29

Наткнулся на статью: Как спасти свой блог от спама?. Выглядит вроде логично. Меня раньше удивляло откуда в блоге по программированию комментарии со ссылками на кулинарию и строительное дело.
Ваше мнение - действительно ли большинство спамеров приходят на сайт с поисковых систем и могут ли помочь борьбе с ними меры описанные в статье?

Snob аватар
320

От части спамеров избавиться позволит, но не от всех. Выбор сайтов для спама действительно осуществляется при помощи парсинга. Но хочу отметить, что для того чтобы спамить, не обязательно находить на странице слово "комментировать" и т.п.

Возьмём стандартный движок WP, отпарсить сайты на этом движке можно довольно просто. Почти все сайты содержат файл: wp-login.php и другие отличительные черты.
Сделайте поиск расширенный по выдаче, чтобы в урле содержались эти строки, и вот вам сайты на WP (гугл выдал около 6 с лишним млн).

Дальше запрос к комментированию осуществляется к файлу: wp-comments-post.php
POST запрос, 4 поля: author, email, url, comment

Вот собственно и всё. И никакого слово "комментарий".

Дима аватар
405

Есть некоторый опыт борьбы со спамом. Сейчас для блогов склоняюсь к такой схеме:

1. Чуть-чуть модифицируем математическую каптчу, чтобы боты ее не пробивали.

Некоторые боты пытаются честно считать пример. Для них нужно усложнить парсинг примера, добавив в выражение невидимые знаки и числа через span style="display: none;". Можно придумать и другие хитрости в этой области.

Другие боты выбирают одно число и долбят им каптчу, периодически попадая. Нужно отследить это число и исключить его из диапазона ответов.

В друпале всё это несложно сделать, потому что можно включить логгирование каптчи.

Конечно, все эти трюки не могут эффективно работать в глобальном масштабе. Но для нескольких сайтов такая доработанная защита может работать годами.

2. Некоторые блоги попадают в зону внимания "ручных" комментаторов. Например, распространены списки dofollow-блогов. От такого спама можно защититься, закрывая комментарии к старым постам.

Snob аватар
320

"Дима" писал(а):
1. Чуть-чуть модифицируем математическую каптчу, чтобы боты ее не пробивали.

Да, я вижу только в этом верное решение от наглого спама. Обычная капча, какой ни был замысловатый там узор, легко распознаётся через antigate, благодаря старательным рукам китайских школьников =).

SDaniL аватар
5

Мне простенькая капча помогла решить проблему с сотнями комментов, приходящих ежедневно. Хотя судя по логам попытки до сих пор исчисляются сотнями.

vikeng аватар
29

"Snob" писал(а):
Но хочу отметить, что для того чтобы спамить, не обязательно находить на странице слово "комментировать" и т.п.

Это понятно, что данный метод кардинально решить проблему не сможет. Надежда только на уменьшение потока спама.
"Дима" писал(а):
Чуть-чуть модифицируем математическую каптчу, чтобы боты ее не пробивали.

Интересная мысль - надо будет попробовать.