Перейти к публикации

Рекомендованные сообщения

Импорт новостей по РСС это конечно хорошо! Но хотелось бы иметь модуль, который умеет брать новости не из РСС, а обычных HTML страниц. Кто сможет помочь? Есть ли готовое решение и какая цена?

Ссылка на сообщение
Поделиться на других сайтах

Такой модель есть по умолчанию в движке... правда ему для правильной работы таки нужен РСС для отслеживания изменений....

Ссылка на сообщение
Поделиться на других сайтах

Т.е. вы список УРЛ новых новостей будете сами куда-то забивать?

потому что для того что бы грабить новости (и не только) надо как минимум источник этой информации... т.е. линк на страницу (rss нам этот линк дает). Далее для того что бы грабить в массовом порядке, а не по одной странице надо что бы шаблон у всех страниц с которых надо грабить был однотипный...

т.е. на сайте должно быть хотя бы что-то что выдавало бы УРЛ страниц (и идеале + заголовок + дату размещения)... или писать отдельный парсер который этот список будет делать на основе главной страницы (или карты сайта, или списка новостей, или еще чего).

PS: готовое решений для первого - граббинг через список новых урл есть в движке - его быстро переделать, а вот готового решения для второго нет и не будет т.к. для каждого сайта нужен свой подход и т.д. и т.п.

Ссылка на сообщение
Поделиться на других сайтах
  • 8 месяцев спустя...

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

×
×
  • Создать...