Перейти к публикации

проблема с utf и парсингом


Рекомендованные сообщения

UTF версия движка. Проблема с буквами Р итд, классические в общем буквы. Проблема возникает когда движок пытается парсить например такой текст:

<a href='#' title='Резиновые сапоги'>описание сапог</a>

парсинг обрывается на моменте когда доходит до русской буквы Р: title='Р и новость обрывается

Пока исправил эту проблему так. В файле parse.class.php после строки

function filterTags($source) {
добавить
		$source = urlencode($source);
перед строкой
		return $preTag;

	}
добавить
$preTag = urldecode($preTag);

Работает, но не уверен что это лучшее решение.

Ссылка на сообщение
Поделиться на других сайтах

с UTF тоже частенько с таким сталкиваюсь, в данном случае можно использовать перекодирование кирилицы на соответствующую кодировку, а не не кодировать урл. Правда, какой способ лучше и быстрей - не знаю, нужно в циклах гонять... В сложных смешанных текстах с различными символами iconv выдпёт в лучшем случае ошибку, в худшем - скрипт ломает, пользуюсь любимой mb_convert_encoding. :)

Изменено пользователем zgr
Ссылка на сообщение
Поделиться на других сайтах

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

×
×
  • Создать...