Перейти к публикации

Нужен ковертер для конвертирования HTML-сущностей вида &#1253 в UTF-8


Рекомендованные сообщения

Приветствую Вас!

Имеется сайт на ДЛЕ в кодировке win1251

Сайт выводит русский и японский текст.

Весь японский текст представлен на сайте в виде кода типа:


&#12540; &#31169;&#12399;&#28023;&#12398;&#12381;&#12400;&#12398;&#23567;&#12373;&#12394;&#30010;&#12395;&#12377;&#12415;&#12383;&#12356;&#12391;&#12377;&#12290;<br>

&#12414;&#12393;&#12363;&#12425;&#27598;&#26397;&#12362;&#12384;&#12420;&#12363;&#12394;&#28023;&#12434;&#35211;&#12383;&#12356;&#12391;&#12377;&#12290;<br>

&#12424;&#12427;&#12399;&#12365;&#12428;&#12356;&#12394;&#12422;&#12358;&#12420;&#12369;&#12434;&#12394;&#12364;&#12417;&#12383;&#12356;&#12391;&#12377;&#12290;<br>

&#12371;&#12398;&#32117;&#12434;&#35211;&#12390;&#12367;&#12384;&#12373;&#12356;&#12290;

На сайте данные символы отображаются уже в виде японских знаков так как нужно.

Также на сайте имеется модуль поиска иероглифов помещенных в базу данных.

На сервере вся база данных DLE и модуля поиска иероглифов в кодировке win1251

Мне необходимо перевести сайт DLE в кодировку UTF-8

При этом надо также переконвертировать имеющиеся HTML-сущности в кодировку UTF-8 для корректного отображения на сайте и работы поиска как по новостям так и по имеющейся базе иероглифов.

При переводе сайта в кодировку UTF-8 штатными средствами вопросов не вызывает, но хотелось бы чтобы и имеющийся японский текст также был переведен в эту кодировку...

Кто сможет помочь в этом вопросе?

Изменено пользователем kosen
Ссылка на сообщение
Поделиться на других сайтах

webair,

это человек и хочет. Ему нужно HTML сущности в БД, сконвертировать в нормальные UTF-8 символы.

Ссылка на сообщение
Поделиться на других сайтах

http://petrenco.com/php.php?txt=142 Может тут что то интересное найдете для себя.

Ссылка на сообщение
Поделиться на других сайтах

Благодарю...

Посмотрю на досуге...

Пока нашел онлайн вариант перекодировщика, который справляется с поставленной задачей, но только отдельными файлами или текстом... http://2cyr.com/decode/?lang=ru

А это довольно трудоемкое дело... вот бы пакетную обработку сделать...

Ссылка на сообщение
Поделиться на других сайтах

Вам файлы шаблона надо перекодировать? Файлы пакетно кодируйте UTFCast, указали папку исходную, указали папку назначения, кодирует файлы и все что во вложеных папках, только картинки не забудьте перекинуть потом.

Ссылка на сообщение
Поделиться на других сайтах

Я работаю на маке.

С перекодировкой шаблонов справляется достаточно нормально Coda - http://panic.com/coda/

Мне нужно перекодировать новости в которых одновременно находятся текст на русском и HTML-сущности (для отображения японского текста).

Все они - в исходной кодировке win-1251

Еще мне надо перевести в UTF-8 несколько таблиц БД (в которых также находятся текст на русском и HTML-сущности ) созданных для модуля поиски иерогрифов.

Пока решения не нашел, кроме как ручного способа перевода пользуясь вышеуказанным сервисом онлайн... а это очень трудоемкий и долгий процесс не застрахованный от ошибок...

Ссылка на сообщение
Поделиться на других сайтах
  • 2 месяца спустя...

Присоединяйтесь к обсуждению

Вы можете опубликовать сообщение сейчас, а зарегистрироваться позже. Если у вас есть аккаунт, войдите в него для написания от своего имени.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 эмодзи.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.

×
×
  • Создать...