Kolbaser 33 Опубликовано: 17 июля 2009 Рассказать Опубликовано: 17 июля 2009 Вижу, что сайт граббят, мне это не очень нравится, но поставить дополнительные поля у меня не получается по определённым причинам. Есть какой-нибудь другой способ от граббинга? http://vagonkino.ru/ Ссылка на сообщение Поделиться на других сайтах
celsoft 6252 Опубликовано: 17 июля 2009 Рассказать Опубликовано: 17 июля 2009 Способов 2 1. Запретить IP адреса, с которых идет граббинг новостей. 2. Отлючить сайт от интернета. Грабберы ничем не отличаются от обычных людей и обычных посетителей. То что видят посетители, то и видять программы для граббинга, и они представляют серверу точно такие же данные как и обычный браузер простого посетителя. Ссылка на сообщение Поделиться на других сайтах
Kolbaser 33 Опубликовано: 17 июля 2009 Рассказать Опубликовано: 17 июля 2009 Автор Тогда остаются дополнительные поля, не очень удобно когда сайт уже давно работает, зато ПС не видят ссылки в них, а это жирный + Ссылка на сообщение Поделиться на других сайтах
lifestar 18 Опубликовано: 17 июля 2009 Рассказать Опубликовано: 17 июля 2009 Kolbaser, а каким образом дополнительные поля защитят контент? Ссылка на сообщение Поделиться на других сайтах
Kolbaser 33 Опубликовано: 17 июля 2009 Рассказать Опубликовано: 17 июля 2009 Автор От граббера защитят полностью, вот тут у меня стоят доп.поля: http://vagonkino.ru/ http://vsefilmi.com/ можно попробовать их "зграбить" и будет видно, что та инфа, которая лежит в доп. поле не доступна грабберу, но ПС тоже не доступна( Ссылка на сообщение Поделиться на других сайтах
gosu 1 Опубликовано: 17 июля 2009 Рассказать Опубликовано: 17 июля 2009 I would recommend you to try replacing id='news-id-" with something else like: id="my-news-id-" Files to replace: modules/fullsearch.php modules/search.php show.full.php show.short.php Ссылка на сообщение Поделиться на других сайтах
Kolbaser 33 Опубликовано: 17 июля 2009 Рассказать Опубликовано: 17 июля 2009 Автор gosu Вы думаете эта замена поможет, вы пробовали так делать? Ссылка на сообщение Поделиться на других сайтах
Al-x 7 Опубликовано: 17 июля 2009 Рассказать Опубликовано: 17 июля 2009 Kolbaser, это изменит шаблон граббинга. Но те, кто тырят контент - тоже могут его изменить) Ссылка на сообщение Поделиться на других сайтах
gosu 1 Опубликовано: 17 июля 2009 Рассказать Опубликовано: 17 июля 2009 Kolbaser, Я думаю, не тестировал если работает Ссылка на сообщение Поделиться на других сайтах
lifestar 18 Опубликовано: 17 июля 2009 Рассказать Опубликовано: 17 июля 2009 От граббера защитят полностью, вот тут у меня стоят доп.поля: http://vagonkino.ru/ http://vsefilmi.com/ можно попробовать их "зграбить" и будет видно, что та инфа, которая лежит в доп. поле не доступна грабберу, но ПС тоже не доступна( какая именно инфа? всё доступно Ссылка на сообщение Поделиться на других сайтах
Captain 636 Опубликовано: 17 июля 2009 Рассказать Опубликовано: 17 июля 2009 'Kolbaser', NOFOLLOW так не ставится: <noindex><nofollow> ... </nofollow></noindex> Тока так: <a href=”…” rel="nofollow" />Ссылка</a> или так <a rel="nofollow" href=”…” />Ссылка</a> Ссылка на сообщение Поделиться на других сайтах
Kolbaser 33 Опубликовано: 17 июля 2009 Рассказать Опубликовано: 17 июля 2009 Автор Александр Медвед В моём случае ссылки на файлообменники и видеофайлы, они в доп. полях не дают ВС + те кто грабят предпочитают сграбить и забыть, а не добавлять потом после гриббинга ссылки ручками. Captain Вы уверены? Просто я тож так как вы написали всегда ставил, а потом в одной партнёрке увидел как они свой код заключали в <nofollow> ... </nofollow> ну и решил, что так тоже можно... Ссылка на сообщение Поделиться на других сайтах
lifestar 18 Опубликовано: 18 июля 2009 Рассказать Опубликовано: 18 июля 2009 В моём случае ссылки на файлообменники и видеофайлы, они в доп. полях не дают ВС + те кто грабят предпочитают сграбить и забыть, а не добавлять потом после гриббинга ссылки ручками.я не пойму о чём речь.. взять вот страницу http://vagonkino.ru/fantasy/9375-garri-pot...potter-and.html все ссылки мне видны, а значит и грабберу тоже Ссылка на сообщение Поделиться на других сайтах
КиберБулка 2 Опубликовано: 18 июля 2009 Рассказать Опубликовано: 18 июля 2009 Для начала можно отключить RSS. Ссылка на сообщение Поделиться на других сайтах
Captain 636 Опубликовано: 18 июля 2009 Рассказать Опубликовано: 18 июля 2009 Captain Вы уверены? Просто я тож так как вы написали всегда ставил, а потом в одной партнёрке увидел как они свой код заключали в <nofollow> ... </nofollow> ну и решил, что так тоже можно... Абсолютно уверен, в таком виде этот тег просто нерабочий (лишний код) и от гугла так ссылку не спрячешь. Ссылка на сообщение Поделиться на других сайтах
Kolbaser 33 Опубликовано: 20 июля 2009 Рассказать Опубликовано: 20 июля 2009 Автор В моём случае ссылки на файлообменники и видеофайлы, они в доп. полях не дают ВС + те кто грабят предпочитают сграбить и забыть, а не добавлять потом после гриббинга ссылки ручками.я не пойму о чём речь.. взять вот страницу http://vagonkino.ru/fantasy/9375-garri-pot...potter-and.html все ссылки мне видны, а значит и грабберу тоже Конечно вам они будут видны))) а грабберу нет. Граббер не видит ту инфу, которая лежит в доп. полях, поверьте, тем более, что у меня есть граббер и не один. Captain Спасибо, буду теперь снимать везде где понатыкал... Для начала можно отключить RSS Это значит потерять часть пользователей, не очень хорошее решение, особенно для моей тематики сайта. Ссылка на сообщение Поделиться на других сайтах
lifestar 18 Опубликовано: 20 июля 2009 Рассказать Опубликовано: 20 июля 2009 Конечно вам они будут видны))) а грабберу нет. Граббер не видит ту инфу, которая лежит в доп. полях, поверьте, тем более, что у меня есть граббер и не один.верю что ваш граббер не видит, а вот наш видит) робот видит точно тоже что и человек в браузере Ссылка на сообщение Поделиться на других сайтах
Al-x 7 Опубликовано: 20 июля 2009 Рассказать Опубликовано: 20 июля 2009 Kolbaser, грабберы снимают текст по указанным шаблонам. Видимо у тех воров нету цели лишать контента именно ваш сайт, в противном случае - исправление шаблона граббера - дело 5 минут) Ссылка на сообщение Поделиться на других сайтах
Kolbaser 33 Опубликовано: 20 июля 2009 Рассказать Опубликовано: 20 июля 2009 Автор Хм... хреновенько тогда... Тут спамеры, там грабберы... не дают жить честным вебмастерам Ссылка на сообщение Поделиться на других сайтах
flo.mAster 7 Опубликовано: 21 июля 2009 Рассказать Опубликовано: 21 июля 2009 Конечно вам они будут видны))) а грабберу нет. Граббер не видит ту инфу, которая лежит в доп. полях, поверьте, тем более, что у меня есть граббер и не один.верю что ваш граббер не видит, а вот наш видит) робот видит точно тоже что и человек в браузере вы не правы. Граббер грабит див который вставляет дле: ньювс-ид-*. А если я вставлю дом поле не в этот див? Предположим, что я его просто закрою в начале фуллстори ? Ссылка на сообщение Поделиться на других сайтах
celsoft 6252 Опубликовано: 21 июля 2009 Рассказать Опубликовано: 21 июля 2009 вы не правы. Граббер грабит див который вставляет дле: ньювс-ид-*. А если я вставлю дом поле не в этот див? Предположим, что я его просто закрою в начале фуллстори ? граббер грабит то что указано в шаблоне поиска а не какие то определенные дивы Ссылка на сообщение Поделиться на других сайтах
flo.mAster 7 Опубликовано: 21 июля 2009 Рассказать Опубликовано: 21 июля 2009 вы не правы. Граббер грабит див который вставляет дле: ньювс-ид-*. А если я вставлю дом поле не в этот див? Предположим, что я его просто закрою в начале фуллстори ? граббер грабит то что указано в шаблоне поиска а не какие то определенные дивы это заказные грабберы под определнный сайт. Стандартные через див дле Ссылка на сообщение Поделиться на других сайтах
celsoft 6252 Опубликовано: 21 июля 2009 Рассказать Опубликовано: 21 июля 2009 это заказные грабберы под определнный сайт. Стандартные через див дле Нет заказных грабберов, стандартный в DLE RSS импорт способен брать новости с любых сайтов, с любым оформлением, для этого в нем и задается шаблон поиска в его настройках. Да и вообще любой граббер построен на задании специальных шаблонов, по которым он получает контект. Ссылка на сообщение Поделиться на других сайтах
lifestar 18 Опубликовано: 22 июля 2009 Рассказать Опубликовано: 22 июля 2009 Граббер грабит див который вставляет дле: ньювс-ид-*так это смотря какой грабер) Ссылка на сообщение Поделиться на других сайтах
demon165 8 Опубликовано: 22 июля 2009 Рассказать Опубликовано: 22 июля 2009 в .htaccess прописывается следующий код: RewriteCond %{HTTP_USER_AGENT} ^BlackWidow [OR] RewriteCond %{HTTP_USER_AGENT} ^Bot\ mailto:craftbot@yahoo.com [OR] RewriteCond %{HTTP_USER_AGENT} ^ChinaClaw [OR] RewriteCond %{HTTP_USER_AGENT} ^Custo [OR] RewriteCond %{HTTP_USER_AGENT} ^DISCo [OR] RewriteCond %{HTTP_USER_AGENT} ^Download\ Demon [OR] RewriteCond %{HTTP_USER_AGENT} ^eCatch [OR] RewriteCond %{HTTP_USER_AGENT} ^EirGrabber [OR] RewriteCond %{HTTP_USER_AGENT} ^EmailSiphon [OR] RewriteCond %{HTTP_USER_AGENT} ^EmailWolf [OR] RewriteCond %{HTTP_USER_AGENT} ^Express\ WebPictures [OR] RewriteCond %{HTTP_USER_AGENT} ^ExtractorPro [OR] RewriteCond %{HTTP_USER_AGENT} ^EyeNetIE [OR] RewriteCond %{HTTP_USER_AGENT} ^FlashGet [OR] RewriteCond %{HTTP_USER_AGENT} ^GetRight [OR] RewriteCond %{HTTP_USER_AGENT} ^GetWeb! [OR] RewriteCond %{HTTP_USER_AGENT} ^Go!Zilla [OR] RewriteCond %{HTTP_USER_AGENT} ^Go-Ahead-Got-It [OR] RewriteCond %{HTTP_USER_AGENT} ^GrabNet [OR] RewriteCond %{HTTP_USER_AGENT} ^Grafula [OR] RewriteCond %{HTTP_USER_AGENT} ^HMView [OR] RewriteCond %{HTTP_USER_AGENT} HTTrack [NC,OR] RewriteCond %{HTTP_USER_AGENT} ^Image\ Stripper [OR] RewriteCond %{HTTP_USER_AGENT} ^Image\ Sucker [OR] RewriteCond %{HTTP_USER_AGENT} Indy\ Library [NC,OR] RewriteCond %{HTTP_USER_AGENT} ^InterGET [OR] RewriteCond %{HTTP_USER_AGENT} ^Internet\ Ninja [OR] RewriteCond %{HTTP_USER_AGENT} ^JetCar [OR] RewriteCond %{HTTP_USER_AGENT} ^JOC\ Web\ Spider [OR] RewriteCond %{HTTP_USER_AGENT} ^larbin [OR] RewriteCond %{HTTP_USER_AGENT} ^LeechFTP [OR] RewriteCond %{HTTP_USER_AGENT} ^Mass\ Downloader [OR] RewriteCond %{HTTP_USER_AGENT} ^MIDown\ tool [OR] RewriteCond %{HTTP_USER_AGENT} ^Mister\ PiX [OR] RewriteCond %{HTTP_USER_AGENT} ^Navroad [OR] RewriteCond %{HTTP_USER_AGENT} ^NearSite [OR] RewriteCond %{HTTP_USER_AGENT} ^NetAnts [OR] RewriteCond %{HTTP_USER_AGENT} ^NetSpider [OR] RewriteCond %{HTTP_USER_AGENT} ^Net\ Vampire [OR] RewriteCond %{HTTP_USER_AGENT} ^NetZIP [OR] RewriteCond %{HTTP_USER_AGENT} ^Octopus [OR] RewriteCond %{HTTP_USER_AGENT} ^Offline\ Explorer [OR] RewriteCond %{HTTP_USER_AGENT} ^Offline\ Navigator [OR] RewriteCond %{HTTP_USER_AGENT} ^PageGrabber [OR] RewriteCond %{HTTP_USER_AGENT} ^Papa\ Foto [OR] RewriteCond %{HTTP_USER_AGENT} ^pavuk [OR] RewriteCond %{HTTP_USER_AGENT} ^pcBrowser [OR] RewriteCond %{HTTP_USER_AGENT} ^RealDownload [OR] RewriteCond %{HTTP_USER_AGENT} ^ReGet [OR] RewriteCond %{HTTP_USER_AGENT} ^SiteSnagger [OR] RewriteCond %{HTTP_USER_AGENT} ^SmartDownload [OR] RewriteCond %{HTTP_USER_AGENT} ^SuperBot [OR] RewriteCond %{HTTP_USER_AGENT} ^SuperHTTP [OR] RewriteCond %{HTTP_USER_AGENT} ^Surfbot [OR] RewriteCond %{HTTP_USER_AGENT} ^tAkeOut [OR] RewriteCond %{HTTP_USER_AGENT} ^Teleport\ Pro [OR] RewriteCond %{HTTP_USER_AGENT} ^VoidEYE [OR] RewriteCond %{HTTP_USER_AGENT} ^Web\ Image\ Collector [OR] RewriteCond %{HTTP_USER_AGENT} ^Web\ Sucker [OR] RewriteCond %{HTTP_USER_AGENT} ^WebAuto [OR] RewriteCond %{HTTP_USER_AGENT} ^WebCopier [OR] RewriteCond %{HTTP_USER_AGENT} ^WebFetch [OR] RewriteCond %{HTTP_USER_AGENT} ^WebGo\ IS [OR] RewriteCond %{HTTP_USER_AGENT} ^WebLeacher [OR] RewriteCond %{HTTP_USER_AGENT} ^WebReaper [OR] RewriteCond %{HTTP_USER_AGENT} ^WebSauger [OR] RewriteCond %{HTTP_USER_AGENT} ^Website\ eXtractor [OR] RewriteCond %{HTTP_USER_AGENT} ^Website\ Quester [OR] RewriteCond %{HTTP_USER_AGENT} ^WebStripper [OR] RewriteCond %{HTTP_USER_AGENT} ^WebWhacker [OR] RewriteCond %{HTTP_USER_AGENT} ^WebZIP [OR] RewriteCond %{HTTP_USER_AGENT} ^Wget [OR] RewriteCond %{HTTP_USER_AGENT} ^Widow [OR] RewriteCond %{HTTP_USER_AGENT} ^WWWOFFLE [OR] RewriteCond %{HTTP_USER_AGENT} ^Xaldon\ WebSpider [OR] RewriteCond %{HTTP_USER_AGENT} ^Zeus RewriteRule ^.* - [F,L] это как раз известные граберы,доступ только для ботов поисковиков Ссылка на сообщение Поделиться на других сайтах
Рекомендованные сообщения
Архивировано
Эта тема находится в архиве и закрыта для публикации сообщений.