zgr 72 Опубликовано: 9 ноября 2010 Рассказать Опубликовано: 9 ноября 2010 Примерно раз в день-два приходит хотя бы одно письмо такого содержания: ensji ksecn qrwec gcvdq onttj percocet lgg hydrocodone ooc oxycodone sxy ritalin ytw cyclobenzaprine tea dxmuzjb в котором каждая строка, слово или символ может быть ссылкой. Хорошо бы усовершенствовать антиспамную систему, а то похоже, что она очень дырявая. Есть такое предложение. Например, в русском языке имеется масса прав сочетания букв, их взаимосвязь, последовательность и т.д. Делал у себя фонетический разбор онлайн, могу подсказать, если нужно. Например, нет слов в русском языке, которые бы начинались на "ы" (кроме нескольких иностранных, нет слов, где подрят 2 и более гласных "ы", а также 3 любых гласных, более 4-х согласных (кроме нескольких исключений) и т.д. Полагаю, для англ. языка аналогично. Можно сделать раскладку слов и букв м вычислить порог ошибок/опечаток. Если порог выше 15%, т.е. либо спамщик пишет, либо какой-то дебил, то такой комментарий не публиковать на сайте, а более 2-х комментариев, то вносить пользователя в бан. Кто что думает по этому поводу? Цитата Ссылка на сообщение Поделиться на других сайтах
celsoft 6 081 Опубликовано: 9 ноября 2010 Рассказать Опубликовано: 9 ноября 2010 Вообще то достаточно включить в настройках групп запрет на публикацию кликабельный ссылок в комментариях и подобных комментариев не будет. Есть такое предложение. Например, в русском языке имеется масса прав сочетания букв, их взаимосвязь, последовательность и т.д. Делал у себя фонетический разбор онлайн, могу подсказать, если нужно. Например, нет слов в русском языке, которые бы начинались на "ы" (кроме нескольких иностранных, нет слов, где подрят 2 и более гласных "ы", а также 3 любых гласных, более 4-х согласных (кроме нескольких исключений) и т.д. Полагаю, для англ. языка аналогично. не все пишут в кирилице, т.к. не у всех есть русская клавиатура. И при транслитерации запросто могут быть три гласных. И если вы посмотрите на свой же текст, то там нет совпадений по вашим условиям кроме одного слова, что ниже 15%.Да и ничего не мешает писать бессмыслецу с использованием реально существующих слов. Как в вашем же примере, большинство слов это нормальные реальные слова. Цитата Ссылка на сообщение Поделиться на других сайтах
zgr 72 Опубликовано: 9 ноября 2010 Рассказать Опубликовано: 9 ноября 2010 Автор И при транслитерации запросто могут быть... Ой, не подумал, что можно чередовать англ./рус. буквы в спаме. Тогда "е" можно хоть на русском, хоть на английском написать и спам пройдет. Досадно. Вообще то достаточно включить в настройках групп запрет на публикацию кликабельный ссылок в комментариях и подобных комментариев не будет. М... не совсем то, что хотелось бы. Дело не в кликабельных ссылках, а в том, что их очень много бывает, а текста при этом или мало или вовсе нет. Например 2-3 ссылки - нормально, а вот 10 подряд без текста - уже что-то левое П.С. м... имел в виду 3 одинаковых гласных (так же согласных), типа: длинношЕЕЕ - такие слова являются исключением, их всего несколько. Эх, придется запретить тогда ссылки, если активность спама вырастит. Цитата Ссылка на сообщение Поделиться на других сайтах
celsoft 6 081 Опубликовано: 9 ноября 2010 Рассказать Опубликовано: 9 ноября 2010 zgr, Любые подобные механизмы эффективны до тех пор, пока они только у вас на сайте, и алгоритм является закрытым и неизвестным. Эффективность таких алгоритмов в движках, имеющих массовое обращение равна нулю, т.к. достаточно будет посмотреть алгоритм и написать свой, который не будет подпадать под условия фильтрации. 1 Цитата Ссылка на сообщение Поделиться на других сайтах
ATHF 33 Опубликовано: 9 ноября 2010 Рассказать Опубликовано: 9 ноября 2010 Любые подобные механизмы эффективны до тех пор, пока они только у вас на сайте, и алгоритм является закрытым и неизвестным. Эффективность таких алгоритмов в движках, имеющих массовое обращение равна нулю, т.к. достаточно будет посмотреть алгоритм и написать свой, который не будет подпадать под условия фильтрации. Согласен, но неужели невозможно разработать гибкую систему защиту. Уникализировать защиту для каждого сайта. Например: возможность изменять url для регистрации, добавление вопроса при добавлении комментариев/новостей.. и т.д. Цитата Ссылка на сообщение Поделиться на других сайтах
zgr 72 Опубликовано: 9 ноября 2010 Рассказать Опубликовано: 9 ноября 2010 Автор "Уникализировать защиту для каждого сайта" нельзя в принципе - это звучит бредово, не обижайтесь, пожалуйста. Разработать же алгоритм можно, при чем очень гибкий, даже с учетом простенького ИИ (искусственного интеллекта). Проблема в том, что такие системы не популярны, весьма трудоемки и поэтому почти не развиваются. Есть даже спец.сайты, различные базы и т.д. Вордпресс работает с одной из таких баз, может, ДЛЕ тоже когда-нибудь работать с этими спам-базами начнет (проверяется аабсолютно всё: айпи, почта, страна, ник, текст комментария, ссылка на сайт и многое другое). Цитата Ссылка на сообщение Поделиться на других сайтах
Рекомендованные сообщения
Присоединяйтесь к обсуждению
Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.