Vivaldy 0 Опубликовано: 9 марта 2008 Рассказать Опубликовано: 9 марта 2008 Импорт новостей по РСС это конечно хорошо! Но хотелось бы иметь модуль, который умеет брать новости не из РСС, а обычных HTML страниц. Кто сможет помочь? Есть ли готовое решение и какая цена? Ссылка на сообщение Поделиться на других сайтах
Shinji 0 Опубликовано: 9 марта 2008 Рассказать Опубликовано: 9 марта 2008 Такой модель есть по умолчанию в движке... правда ему для правильной работы таки нужен РСС для отслеживания изменений.... Ссылка на сообщение Поделиться на других сайтах
Vivaldy 0 Опубликовано: 9 марта 2008 Рассказать Опубликовано: 9 марта 2008 Автор В данном случае речь идет не об РСС, а о HTML лентах, не имеющих РСС потока. Ссылка на сообщение Поделиться на других сайтах
Shinji 0 Опубликовано: 9 марта 2008 Рассказать Опубликовано: 9 марта 2008 Т.е. вы список УРЛ новых новостей будете сами куда-то забивать? потому что для того что бы грабить новости (и не только) надо как минимум источник этой информации... т.е. линк на страницу (rss нам этот линк дает). Далее для того что бы грабить в массовом порядке, а не по одной странице надо что бы шаблон у всех страниц с которых надо грабить был однотипный... т.е. на сайте должно быть хотя бы что-то что выдавало бы УРЛ страниц (и идеале + заголовок + дату размещения)... или писать отдельный парсер который этот список будет делать на основе главной страницы (или карты сайта, или списка новостей, или еще чего). PS: готовое решений для первого - граббинг через список новых урл есть в движке - его быстро переделать, а вот готового решения для второго нет и не будет т.к. для каждого сайта нужен свой подход и т.д. и т.п. Ссылка на сообщение Поделиться на других сайтах
MAGIK 0 Опубликовано: 16 ноября 2008 Рассказать Опубликовано: 16 ноября 2008 Может сможет помочь http://page2rss.com/ ? Ссылка на сообщение Поделиться на других сайтах
Рекомендованные сообщения
Архивировано
Эта тема находится в архиве и закрыта для публикации сообщений.