Перейти к публикации

Нужен ковертер для конвертирования HTML-сущностей вида &#1253 в UTF-8


Рекомендованные сообщения

Приветствую Вас!

Имеется сайт на ДЛЕ в кодировке win1251

Сайт выводит русский и японский текст.

Весь японский текст представлен на сайте в виде кода типа:


&#12540; &#31169;&#12399;&#28023;&#12398;&#12381;&#12400;&#12398;&#23567;&#12373;&#12394;&#30010;&#12395;&#12377;&#12415;&#12383;&#12356;&#12391;&#12377;&#12290;<br>

&#12414;&#12393;&#12363;&#12425;&#27598;&#26397;&#12362;&#12384;&#12420;&#12363;&#12394;&#28023;&#12434;&#35211;&#12383;&#12356;&#12391;&#12377;&#12290;<br>

&#12424;&#12427;&#12399;&#12365;&#12428;&#12356;&#12394;&#12422;&#12358;&#12420;&#12369;&#12434;&#12394;&#12364;&#12417;&#12383;&#12356;&#12391;&#12377;&#12290;<br>

&#12371;&#12398;&#32117;&#12434;&#35211;&#12390;&#12367;&#12384;&#12373;&#12356;&#12290;

На сайте данные символы отображаются уже в виде японских знаков так как нужно.

Также на сайте имеется модуль поиска иероглифов помещенных в базу данных.

На сервере вся база данных DLE и модуля поиска иероглифов в кодировке win1251

Мне необходимо перевести сайт DLE в кодировку UTF-8

При этом надо также переконвертировать имеющиеся HTML-сущности в кодировку UTF-8 для корректного отображения на сайте и работы поиска как по новостям так и по имеющейся базе иероглифов.

При переводе сайта в кодировку UTF-8 штатными средствами вопросов не вызывает, но хотелось бы чтобы и имеющийся японский текст также был переведен в эту кодировку...

Кто сможет помочь в этом вопросе?

Ссылка на сообщение
Поделиться на других сайтах

webair,

это человек и хочет. Ему нужно HTML сущности в БД, сконвертировать в нормальные UTF-8 символы.

Ссылка на сообщение
Поделиться на других сайтах

http://petrenco.com/php.php?txt=142 Может тут что то интересное найдете для себя.

Ссылка на сообщение
Поделиться на других сайтах

Благодарю...

Посмотрю на досуге...

Пока нашел онлайн вариант перекодировщика, который справляется с поставленной задачей, но только отдельными файлами или текстом... http://2cyr.com/decode/?lang=ru

А это довольно трудоемкое дело... вот бы пакетную обработку сделать...

Ссылка на сообщение
Поделиться на других сайтах

Вам файлы шаблона надо перекодировать? Файлы пакетно кодируйте UTFCast, указали папку исходную, указали папку назначения, кодирует файлы и все что во вложеных папках, только картинки не забудьте перекинуть потом.

Ссылка на сообщение
Поделиться на других сайтах

Я работаю на маке.

С перекодировкой шаблонов справляется достаточно нормально Coda - http://panic.com/coda/

Мне нужно перекодировать новости в которых одновременно находятся текст на русском и HTML-сущности (для отображения японского текста).

Все они - в исходной кодировке win-1251

Еще мне надо перевести в UTF-8 несколько таблиц БД (в которых также находятся текст на русском и HTML-сущности ) созданных для модуля поиски иерогрифов.

Пока решения не нашел, кроме как ручного способа перевода пользуясь вышеуказанным сервисом онлайн... а это очень трудоемкий и долгий процесс не застрахованный от ошибок...

Ссылка на сообщение
Поделиться на других сайтах
  • 2 месяца спустя...

Архивировано

Эта тема находится в архиве и закрыта для публикации сообщений.

×
×
  • Создать...