Перейти к публикации

Рекомендованные сообщения

Здраствуйте, яндекс проиндексировал сайт и появились дубли страниц

http://prazndnyte.ru/scen

http://prazndnyte.ru/scen/

со слешем и без слеша, как я понимаю со слешем в конце это дубли. Как в роботе закрыть эти дубли ?

у меня в роботе

User-agent: Yandex

# Added by add_robots.sh

Crawl-delay: 10

Disallow: /user/

Disallow: /backup/

Disallow: /engine/

Disallow: /favorites/

Disallow: /newposts/

Disallow: /lastnews/

Disallow: /catalog/

Disallow: /language/

Disallow: /tags/

Disallow: /*subaction=userinfo

Disallow: /*subaction=newposts

Disallow: /*do=lastcomments

Disallow: /*do=feedback

Disallow: /*do=register

Disallow: /*do=lostpassword

Disallow: /*do=addnews

Disallow: /*do=pm

Disallow: /*do=search

Disallow: /*group=*

Disallow: /addnews.html

Disallow: /search.html

Disallow: /rules.html

Disallow: /index.php?subaction=newposts

Disallow: /*.php*

Disallow: /*/page/

Disallow: /tags/*/page/

Disallow: /2013/

Disallow: /2014/

Disallow: /2015/

Disallow: /*rss.xml

Sitemap: http://prazndnyte.ru/sitemap.xml

Host: prazndnyte.ru

Изменено пользователем lepota
Ссылка на сообщение
Поделиться на других сайтах

У вас ссылки на сайте проставлены и со слешем и без. Верхнее горизонтальное без слеша, слева в вертикальном со слешем.

Исправляйте свой шаблон, в DLE правильно проставлять слеш на категории.

Ссылка на сообщение
Поделиться на других сайтах

в шаблоне категории - вот так прописаны

<li><a href="/opr">О праздниках</a><del> | </del></li>

и в категориях Альтернативное имя: :opr

откуда этот слеш взялся? Как исправить?

Все, я понял откуда слеш нарисовался, это с левого блока там слеш на конце

А вообще как лучше со слешем в конце или нет? Как я слышал со слешем в конце дает роботу понять что есть продолжение.

Что скажете?

Ссылка на сообщение
Поделиться на других сайтах

Я же написал, со слешем.

Вот это явно не к месту:

Disallow: /backup/

Disallow: /language/

Disallow: /*group=*

Disallow: /index.php?subaction=newposts

Disallow: /*.php*

Disallow: /*/page/

Disallow: /tags/*/page/

Disallow: /*rss.xml

Page закрывается просто:

Disallow: /page/

По ссылкам *.xml роботы не ходят.

Ссылка на сообщение
Поделиться на других сайтах

а почему лишнее?

Disallow: /*.php*

но ведь в результате чего одна и та же страница получается доступной по "ЧПУ-адресу" и по "движковому" адресу (т.к. длинная строка в урле с "коряболками" как раз и используется самим движком в его работе). Т.е. получаем дублирование страниц на сайте, что так любит АГС

Я добавил слеши, а что будет теперь со страницами без слеша, они же сейчас существуют, как теперь от них избавится? они же дубли.

Ссылка на сообщение
Поделиться на других сайтах

но ведь в результате чего одна и та же страница получается доступной по "ЧПУ-адресу" и по "движковому" адресу (т.к. длинная строка в урле с "коряболками" как раз и используется самим движком в его работе).

Поисковая система видит только те ссылки, которые есть на страничке, а не все, которые поддерживает каждая CMS

Ссылка на сообщение
Поделиться на других сайтах
  • 1 год спустя...

Поисковая система видит только те ссылки, которые есть на страничке, а не все, которые поддерживает каждая CMS

Если Ваш ответ еще не устарел...

Означает ли это, что слишком усердствовать в устранении дублей станиц не надо?

Как следует из ссылки в сообщении чуть выше?

Я, например, на свежем своем сайте в Инструменты для веб-мастеров Гугл увидел ошибку с ссылкой на страницу с датой новости... Хотя ЧПУ у меня - сайт//категория/заголовок-новости.html

Т.е., если вкратце - стандартных ограничений в robots.txt и .htaccess для роботов вполне хватает?

Ссылка на сообщение
Поделиться на других сайтах

Роботс TXT надо открыть весь. Я слышал что это не чего хорошего не дает, поисковик все равно заберет страницы. Вам надо использовать тег no-index, Я именно на верд прессе таким образом избавился от всех дублей.

Ссылка на сообщение
Поделиться на других сайтах

Роботс TXT надо открыть весь. Я слышал что это не чего хорошего не дает, поисковик все равно заберет страницы. Вам надо использовать тег no-index, Я именно на верд прессе таким образом избавился от всех дублей.

Как тегом noindex можно избавиться от дублей страниц?

Этим тегом вы закрыли участки текста, который не желаете отдавать в индексацию?

Но noindex годен только для Яндекса?

Для Гугла что есть?

Нашел такую конструкцию для:

Google

<!--googleoff: index--> text <!--googleon: index-->

Yandex

<!--noindex--> text <!--/noindex-->

Вместе Google & Yandex

<!--googleoff: index--> <!--noindex--> text <!--/noindex--> <!--googleon: index-->

Но это закрыть участки текста всего-лишь.

Как в ДЛЕ избавиться от дублей страниц? Это задача.

Такой вот казус - пробовал избавиться от дублей по методу Алаева. Сайт был под АГС в Яндексе, в индексе были 2 страницы всего.

При обновлении скрипта ДЛЕ (долго не обновлял) конструкцию Алаева избавления от дублей не применил, оставил как есть. Через месяц сайт полностью проиндексировался и вышел из-под АГС. Сейчас все в порядке.

Совпадение или нет?

Ссылка на сообщение
Поделиться на других сайтах

Как в ДЛЕ избавиться от дублей страниц?

В DLE нет дублей страниц. Приведите конкретные примеры именно с дублями страниц.

Ссылка на сообщение
Поделиться на других сайтах

<!--googleoff: index-->text<!--googleon: index-->

Этот тег не используется в общем поиске Google, он предназначен для Google Search Appliance, грубо говоря корпоративный поиск в локальной сети. Так что текст вы им не спрячете от индексации.

Ссылка на сообщение
Поделиться на других сайтах

Как в ДЛЕ избавиться от дублей страниц?

В DLE нет дублей страниц. Приведите конкретные примеры именно с дублями страниц.

Я пришел на форум прояснить для себя то, что недопонимаю. У меня был случай, описанный мною выше, когда мой сайт попал под АГС и после снятия рекомендаций по удалению дублей через месяц снова восстановился в индексе.

Случайность это или нет - не знаю.

А на счет дублей, то они есть примерно по вот такой схеме:

Главная страница (http://site.ru/) Доступна также по адресам

http://site.ru/index.php

http://site.ru/page/1/

Страница категории (http://site.ru/category/) Доступна также по адресам

http://site.ru/category

http://site.ru/category/page/1/

Страница субкатегории, если есть вложенность (http://site.ru/cat/subcat/) Доступна также по адресам

http://site.ru/cat/subcat

http://site.ru/cat/subcat/page/1/

http://site.ru/subcat/

http://site.ru/subcat

http://site.ru/subcat/page/1/

Страница материнской категории, если есть вложенность (http://site.ru/cat/) Доступна также по адресам

http://site.ru/cat

http://site.ru/cat/page/1/

http://site.ru/subcat/cat/

http://site.ru/subcat/cat

http://site.ru/subcat/cat/page/1/

Страница полной новости, которая пусть принадлежит категории truecat (http://site.ru/truec...-news-name.html) Доступна также по адресам

http://site.ru/truec...a-bla-name.html ->

http://site.ru/123-news-name.html

http://site.ru/fakec...-news-name.html

http://site.ru/truec...-news-name.html

<!--googleoff: index-->text<!--googleon: index-->

Этот тег не используется в общем поиске Google, он предназначен для Google Search Appliance, грубо говоря корпоративный поиск в локальной сети. Так что текст вы им не спрячете от индексации.

Перерыл Интернет, но так и не нашел вразумительный ответ как закрыть текст от Гугла. Только Ява-скрипты, что не хотелось бы применять

Изменено пользователем nalex
Ссылка на сообщение
Поделиться на других сайтах

nalex, какой версией DLE пользуетесь? В актуальных версиях приведённых выше дублей нет, пофиксили уже давно.

1. Для страницы example.org/index.php DLE устанавливает атрибут:

<link rel="canonical" href="http://example.org/" />[/CODE]

2. Таких ссылок как example.org/page/1/ и example.org/category/page/1/ в навигации нет, откроются только если вбивать вручную, причём на странице site.ru/page/1/ будет атрибут rel="canonical". На крайняк можно прописать в robots.txt Disallow: /page/1/.

3. Для страниц как example.org/category без слеша применяется редирект на страницу со слешем example.org/category/.

4. Включите в настройках "Обрабатывать неверные URL ЧПУ", тогда для страниц полной новости с адресами типа example.org/id-любой текст.html,

example.org/бла-бла,id-любой текст.html и т.п. будет применяться 301-й редирект на верный адрес site.ru/id-имя новости.html.

Ссылка на сообщение
Поделиться на других сайтах

nalex, какой версией DLE пользуетесь? В актуальных версиях приведённых выше дублей нет, пофиксили уже давно.

Теперь все понятно. Благодарю за помощь и разъяснение.

Обновился, теперь последняя стоит, все время только читал что новенькое появляется.

ДЛЕ прогрессирует и постоянно улучшается, что радует каждый раз, каждая новая версия!!!

Еще раз порадовался, что новый сайт создал на ДЛЕ, а хотел на Вордпресс.

ДЛЕ шустрый, отличный движок!

А Ваш ответ, думаю, пригодится многим! Еще раз спасибо!

Ссылка на сообщение
Поделиться на других сайтах
  • 2 месяца спустя...

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

×
×
  • Создать...