Перейти к публикации

Рекомендованные сообщения

Примерно раз в день-два приходит хотя бы одно письмо такого содержания:

ensji ksecn qrwec gcvdq onttj

percocet lgg

hydrocodone ooc

oxycodone sxy

ritalin ytw

cyclobenzaprine tea

dxmuzjb

в котором каждая строка, слово или символ может быть ссылкой. Хорошо бы усовершенствовать антиспамную систему, а то похоже, что она очень дырявая.

Есть такое предложение. Например, в русском языке имеется масса прав сочетания букв, их взаимосвязь, последовательность и т.д. Делал у себя фонетический разбор онлайн, могу подсказать, если нужно. Например, нет слов в русском языке, которые бы начинались на "ы" (кроме нескольких иностранных, нет слов, где подрят 2 и более гласных "ы", а также 3 любых гласных, более 4-х согласных (кроме нескольких исключений) и т.д. Полагаю, для англ. языка аналогично.

Можно сделать раскладку слов и букв м вычислить порог ошибок/опечаток. Если порог выше 15%, т.е. либо спамщик пишет, либо какой-то дебил, то такой комментарий не публиковать на сайте, а более 2-х комментариев, то вносить пользователя в бан.

Кто что думает по этому поводу?

Ссылка на сообщение
Поделиться на других сайтах

Вообще то достаточно включить в настройках групп запрет на публикацию кликабельный ссылок в комментариях и подобных комментариев не будет.

Есть такое предложение. Например, в русском языке имеется масса прав сочетания букв, их взаимосвязь, последовательность и т.д. Делал у себя фонетический разбор онлайн, могу подсказать, если нужно. Например, нет слов в русском языке, которые бы начинались на "ы" (кроме нескольких иностранных, нет слов, где подрят 2 и более гласных "ы", а также 3 любых гласных, более 4-х согласных (кроме нескольких исключений) и т.д. Полагаю, для англ. языка аналогично.

не все пишут в кирилице, т.к. не у всех есть русская клавиатура. И при транслитерации запросто могут быть три гласных. И если вы посмотрите на свой же текст, то там нет совпадений по вашим условиям кроме одного слова, что ниже 15%.

Да и ничего не мешает писать бессмыслецу с использованием реально существующих слов. Как в вашем же примере, большинство слов это нормальные реальные слова.

Ссылка на сообщение
Поделиться на других сайтах

И при транслитерации запросто могут быть...

Ой, не подумал, что можно чередовать англ./рус. буквы в спаме. Тогда "е" можно хоть на русском, хоть на английском написать и спам пройдет. Досадно.

Вообще то достаточно включить в настройках групп запрет на публикацию кликабельный ссылок в комментариях и подобных комментариев не будет.

М... не совсем то, что хотелось бы. Дело не в кликабельных ссылках, а в том, что их очень много бывает, а текста при этом или мало или вовсе нет. Например 2-3 ссылки - нормально, а вот 10 подряд без текста - уже что-то левое :)

П.С. м... имел в виду 3 одинаковых гласных (так же согласных), типа: длинношЕЕЕ - такие слова являются исключением, их всего несколько.

Эх, придется запретить тогда ссылки, если активность спама вырастит.

Ссылка на сообщение
Поделиться на других сайтах

zgr,

Любые подобные механизмы эффективны до тех пор, пока они только у вас на сайте, и алгоритм является закрытым и неизвестным. Эффективность таких алгоритмов в движках, имеющих массовое обращение равна нулю, т.к. достаточно будет посмотреть алгоритм и написать свой, который не будет подпадать под условия фильтрации.

Ссылка на сообщение
Поделиться на других сайтах

Любые подобные механизмы эффективны до тех пор, пока они только у вас на сайте, и алгоритм является закрытым и неизвестным. Эффективность таких алгоритмов в движках, имеющих массовое обращение равна нулю, т.к. достаточно будет посмотреть алгоритм и написать свой, который не будет подпадать под условия фильтрации.

Согласен, но неужели невозможно разработать гибкую систему защиту. Уникализировать защиту для каждого сайта.

Например: возможность изменять url для регистрации, добавление вопроса при добавлении комментариев/новостей.. и т.д.

Ссылка на сообщение
Поделиться на других сайтах

"Уникализировать защиту для каждого сайта" нельзя в принципе - это звучит бредово, не обижайтесь, пожалуйста.

Разработать же алгоритм можно, при чем очень гибкий, даже с учетом простенького ИИ (искусственного интеллекта). Проблема в том, что такие системы не популярны, весьма трудоемки и поэтому почти не развиваются. Есть даже спец.сайты, различные базы и т.д. Вордпресс работает с одной из таких баз, может, ДЛЕ тоже когда-нибудь работать с этими спам-базами начнет (проверяется аабсолютно всё: айпи, почта, страна, ник, текст комментария, ссылка на сайт и многое другое).

Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

×
×
  • Создать...