
![]() |
Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
|
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[34.238.189.240] |
![]() |
|
Сообщ.
#1
,
|
|
|
"Кодировки... кодировки... а я маленький такой...". Просто и без особых затей просматривать
на своей машине файлы в любых кодировках. Для России это особенно актуально, т.к. в дополнение к KOI8-R, ГОСТ (ISO), какие-то уроды из Редмонда разработали еще две -- cp866 и cp1251. Читай -- дос и виндовс кодировки. Хотя, справедливости ради, надо заметить, что cp866 разработали такие же уроды, но уже из IBM... Да еще и фирма Apple "отметилась". Есть еще альтернативная кодировка. Применявшаяся неизвестно где, но... она есть... :( Итого -- 6 (шесть!!!) кодировок для одной страны. Интересно, а как дела в Китае? :D И почему все так любят "осчастливливать" Россию? Сейчас сюда же еще и UTF-8 прется. :( Во веселья-то... :( Стандартов они что-ли не читают? Тогда на кой пень их разрабатывать? Кстати, KOI8-R закреплена на уровне RFC (номер не помню), спасибо А. Чернову -- http://nagual.pp.ru. Я один раз по этому поводу уже выражался... Но я хочу чтобы все поняли одну и очень простую вещь -- KOI8-R была еще тогда, когда M$ была мокреньким пятнышком на штанишках Билла Гейтса. И не стоит думать что "компьютинг" в России начался с "революционных идей и технологий" M$ в том числе и "инноваций" в области кодировок. А, коль скоро, UNIX-системы как правило являются основой сетей, то применяя какие-то другие кодировки по отношению к KOI8-R, мы рискуем заполучить проблемы еще и с представлением данных. Наверное, все помнят что творилось с кодировками e-mail некоторое время назад. Проще было перезвонить и просто спросить а что, собственно, хотели-то, нежели разобраться в как же это можно прочесть. Ну, и для всего остального мира у нас первалирующая кодировка -- KOI8-R. Да ну его на фиг... Бог бы с ним со всем... Агитировать за "светлое сетевое будущее" не хочется... Короче, для прочтения файла произвольной кодировки нужна прога -- recode. Ею нужно сконвертировать файл в предпочтительную кодировку. И потом спокойно с этим файлом работать. Не помню где она лежит в ИНете, но всегда можно натравить Гугля на поиск. Установка, компиляция и все прочее -- стандартно. Самое главное, что эта прога позволяет конвертировать файлы как угодно. Кроме того, по сути дела именно эта прога наиболее широко применяется в мире, своего рода, "технологический стандарт"... Т.е.: ![]() ![]() $ recode utf-8...koi8-r text $ recode koi8-r...cp1251 test В первом случае файл text был перекодирован из UTF-8 в KOI8-R, во втором -- из KOI8-R в CP1251. Причем, прошу заметить -- во втором случае в концы строк будут добавлены символы ^M для совместимости с отстоем M$'овского розлива. Первоначальный файл будет заменен результатами перекодировки. См. man recode. |
Сообщ.
#2
,
|
|
|
можно и стандартным iconv-ом, но он - не подарок
![]() |
Сообщ.
#3
,
|
|
|
Брять зверька тут (у него там норка...) -- http://recode.progiciels-bpi.ca/showfile.html?mode=archives.
|
Сообщ.
#4
,
|
|
|
Спасибо, взял.
|
Сообщ.
#5
,
|
|
|
the_Shadow, респектище. Вообще-то именно то, что recode параметры кушает в нестандартном виде, и заставило махнуть на него рукой. Хотя ман читал, там нет примеров, а инфо ошеломляюще большой (проще сверлом застрелиться сразу).
Разве что враппер для него напишу, чтобы работал "как iconv", а то путаюсь постоянно. |