Как перекодировать 1251 в UTF-8?, Пакетная смена кодировки файлов с windows-1251 на utf-8 |
Здравствуйте, гость ( Вход | Регистрация )
Как перекодировать 1251 в UTF-8?, Пакетная смена кодировки файлов с windows-1251 на utf-8 |
10.6.2012, 4:29
Сообщение
#1
|
|
Администратор Группа: Главные администраторы Сообщений: 14349 Регистрация: 12.10.2007 Из: Twilight Zone Пользователь №: 1 |
Как перекодировать 1251 в UTF-8? Пакетная смена кодировки файлов с windows-1251 на utf-8, массовая смена кодировки файлов.
© http://loco.ru/materials/92-paketnaya-smena-kodirovki Возникла задача перекодировать файлы сайта в формат UTF-8, а до этого данные файлы были созданы в кодировке WINDOWS-1251. Вроде бы задача тривиальная - берем любой кодировщик и кодируем из widows-1251 в utf-8, но не тут то было, так можно делать если у нас десяток файлов. А если файлов тысяча? Да и еще не скопом, а каждая группа в своей подкатегории. Сразу в голову приходит идея - берем пакетный перекодировщик файлов и кодируем одним мановением мыши. Кстати хочу заметить файлы у меня лежали на виртуальном сервере, и диск с файлами был подключен как обычный сетевой диск. Т.е. без всяких фтп и прочего, хотя конечно все это есть. И так, необходим конвертер для пакетной кодировки в UTF. И пакетной по-настоящему, а не выбрали кучу файлов и кодируем, чтобы можно было добавлять начальную директорию, а файлы кодировались рекурсивно. После тщательных поисков было найдено решение! Есть замечательный бесплатный конвертер для пакетного конвертирования в UTF - UTFCast Express - http://nemcd.com/wp-content/uploads/2010/0...ert/utfcast.exe. Он позволяет легко и быстро в автоматическом режиме перекодировать каталог и все файлы в подкаталогах. Но у него есть небольшая особенность! Так как версия Экспресс бесплатная - то она не имеет опции конвертировать в UTF-8 без BOM (BOM - Byte Order Mark, служит для идентификации кодировок UTF) Недостаток результата конвертирования такой, что ваши PHP скрипты скорее всего не будут работать! А вот для решения этой проблемы необходимо применить вторую программку - http://nemcd.com/wp-content/uploads/2010/0...bom-remover.exe - UTF-8 BOM Remover Эта тоже замечательная программа - прекрасно справляется с удалением BOM в UTF файлах. А главное рекурсивно все содержимое каталога и подкаталогов! Вот такой связкой можно решить такой важный вопрос. p.s. Решение предложенное автором мне понравилось, все рабочее. Так что решено было его немного усовершенствовать. В этом архиве вы найдете оригинальный UTFCast Express - UTFCast.7z ( 29,75 килобайт ) Кол-во скачиваний: 152 , который при перекодировке вставляет символы BOM (байты 0xEF, 0xBB, 0xBF) в начало любого документа, сохраняемого как UTF. А вот это - UTFCast_wo_BOM.7z ( 29,77 килобайт ) Кол-во скачиваний: 627 слегка модернизированная версия, которая символы BOM не добавляет. Так что при ее использовании дополнительная программа для удаления символов BOM не нужна. -------------------- |
|
|
Текстовая версия | Сейчас: 23.11.2024, 7:06 | |