CMS DataLife Engine - Система управления сайтами

Sign in to follow this  
radrigo

Склеивание слов в rss ленте

Recommended Posts

Всем привет.

 

Наверное с полгода назад обнаружил что некоторые мои из новостей не попадали в Яндекс.Новости. Переписываясь с техподдержкой, понял что это происходило из-за склеенных слов.

 

В техподдержке мне тогда ответили следующие:
"В Яндекс.Новостях работает алгоритм сопоставления текстов, который проверяет, весь ли транслированный текст новости есть на странице с новостью у вас на сайте; если в экспорте присутствует какой-то текст, который не найден у вас на сайте, такая новость автоматически блокируется в Яндекс.Новостях."

 

Также они прислали скрин, где были склеенные слова, и пояснили, что некоторые новости не проходит именно из-за этого.

 

Только сейчас разбираясь с rss лентой понял, что склейка слов происходила именно здесь, из-за этого алгоритм сопоставления текстов от Яндекса блокировал эту новость в Яндекс.Новостях. То есть, их алгоритм сравнивая полную новость из rss ленты с новостью на сайте, выявлял несоответствия.

 

Склеивание слов происходит в списках.

 

То есть если я добавлю на сайт следующий список

[list]
[*]аааааааааааааааа
[*]бббббббббббббббб
[*]вввввввввввввввввв
[/list]

То в Ленте rss он будет показан как

ааааааааааааааааббббббббббббббббвввввввввввввввввв

 

Не знаю баг это или так и должно быть , однако как мне кажется, надо всё-таки их разделять пробелами.

Edited by radrigo

Share this post


Link to post
Share on other sites

DLE не склеивает слова между собой, он лишь убирает HTML форматирование из текста как того и требует собственно сама спецификация яндекс новостей, а без HTML форматирования они у вас и становятся единым словом. Ставьте пробелы в самом списке, в начале или конце слова и у вас будут они разделенными пробелами.

Share this post


Link to post
Share on other sites
7 минут назад, celsoft сказал:

DLE не склеивает слова между собой, он лишь убирает HTML форматирование из текста как того и требует собственно сама спецификация яндекс новостей, а без HTML форматирования они у вас и становятся единым словом. Ставьте пробелы в самом списке, в начале или конце слова и у вас будут они разделенными пробелами.

Не лучше ли озадачить этим движок? Озадачивать этим контент-генераторов как минимум не целесообразно, да и вечные забыл / пропустил / не знал будут.

Share this post


Link to post
Share on other sites
15 часов назад, celsoft сказал:

Ставьте пробелы в самом списке, в начале или конце слова и у вас будут они разделенными пробелами.

Я так и делаю. Но к сожалению, не я один добавляю новости на сайт.

Share this post


Link to post
Share on other sites

Склеивание слов происходит не только в списках, а вообще любых слов начинающихся с новой строки.


Например если написать

Медицина – наш самый главный приоритет

В мае прошлого года во время своего первого ...

В rss будет как

Медицина – наш самый главный приоритетВ мае прошлого года во время своего первого ...

 

В этой статье ( https://gusev-online.ru/news/obshestvo/12214-itogi-vizita-gubernatora-kaliningradskoy-oblasti-antona-alihanova-v-gusev.html ) по тексту идут небольшие заголовки, поясняющие последующий текст. Изначально данная новость не попала в Яндекс новости, пришлось в конце каждого заголовка добавлять пробел. И данная статья сразу же попала в Яндекс новости.

Edited by radrigo

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

Sign in to follow this