На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
! Правила трёх "С"
Пожалуйста,
1. Соблюдайте правила Форума.
2. Слушайте советы Модераторов.
(например, http://forum.sources.ru/index.php?act=ST&f=7&t=80382 )
3. Сверяйтесь с учебником по Великому и Могучему
  
> Перекодировка через recode , Для того, чтобы не волноваться по поводу CP.
    "Кодировки... кодировки... а я маленький такой...". Просто и без особых затей просматривать
    на своей машине файлы в любых кодировках. Для России это особенно актуально, т.к. в
    дополнение к KOI8-R, ГОСТ (ISO), какие-то уроды из Редмонда разработали еще две -- cp866 и
    cp1251. Читай -- дос и виндовс кодировки. Хотя, справедливости ради, надо заметить, что
    cp866 разработали такие же уроды, но уже из IBM... Да еще и фирма Apple "отметилась". Есть еще
    альтернативная кодировка. Применявшаяся неизвестно где, но... она есть... :( Итого -- 6
    (шесть!!!) кодировок для одной страны. Интересно, а как дела в Китае? :D И почему все так
    любят "осчастливливать" Россию?

    Сейчас сюда же еще и UTF-8 прется. :( Во веселья-то... :( Стандартов они что-ли не читают?
    Тогда на кой пень их разрабатывать? Кстати, KOI8-R закреплена на уровне RFC (номер не помню),
    спасибо А. Чернову -- http://nagual.pp.ru. Я один раз по этому поводу уже выражался... Но
    я хочу чтобы все поняли одну и очень простую вещь -- KOI8-R была еще тогда, когда M$ была
    мокреньким пятнышком на штанишках Билла Гейтса. И не стоит думать что "компьютинг" в России
    начался с "революционных идей и технологий" M$ в том числе и "инноваций" в области кодировок.

    А, коль скоро, UNIX-системы как правило являются основой сетей, то применяя какие-то
    другие кодировки по отношению к KOI8-R, мы рискуем заполучить проблемы еще и с представлением
    данных. Наверное, все помнят что творилось с кодировками e-mail некоторое время назад. Проще
    было перезвонить и просто спросить а что, собственно, хотели-то, нежели разобраться в как
    же это можно прочесть. Ну, и для всего остального мира у нас первалирующая кодировка -- KOI8-R.
    Да ну его на фиг... Бог бы с ним со всем... Агитировать за "светлое сетевое будущее" не
    хочется...

    Короче, для прочтения файла произвольной кодировки нужна прога -- recode. Ею нужно
    сконвертировать файл в предпочтительную кодировку. И потом спокойно с этим файлом работать.

    Не помню где она лежит в ИНете, но всегда можно натравить Гугля на поиск. Установка, компиляция
    и все прочее -- стандартно. Самое главное, что эта прога позволяет конвертировать файлы как угодно.
    Кроме того, по сути дела именно эта прога наиболее широко применяется в мире, своего рода,
    "технологический стандарт"...

    Т.е.:
    ExpandedWrap disabled
       
      $ recode utf-8...koi8-r text
      $ recode koi8-r...cp1251 test


    В первом случае файл text был перекодирован из UTF-8 в KOI8-R, во втором -- из KOI8-R в CP1251.
    Причем, прошу заметить -- во втором случае в концы строк будут добавлены символы ^M для совместимости
    с отстоем M$'овского розлива. Первоначальный файл будет заменен результатами перекодировки.
    См. man recode.
      можно и стандартным iconv-ом, но он - не подарок :)
        Брять зверька тут (у него там норка...) -- http://recode.progiciels-bpi.ca/showfile.html?mode=archives.
          Спасибо, взял.
            the_Shadow, респектище. Вообще-то именно то, что recode параметры кушает в нестандартном виде, и заставило махнуть на него рукой. Хотя ман читал, там нет примеров, а инфо ошеломляюще большой (проще сверлом застрелиться сразу).

            Разве что враппер для него напишу, чтобы работал "как iconv", а то путаюсь постоянно.
            0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
            0 пользователей:


            Рейтинг@Mail.ru
            [ Script execution time: 0,0398 ]   [ 15 queries used ]   [ Generated: 18.04.24, 04:24 GMT ]