На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
Страницы: (6) [1] 2 3 ...  5 6 все  ( Перейти к последнему сообщению )  
> Transliterator на Исходниках.Ru
    Итак, транслитератор готов.
    Прежде, чем подключать его, хотелось бы обсудить пару моментов.
    1) существует пара вариантов транслитерации: англо-подобная и германо-подобная.
       Например, YA=Я  и JA=Я
       Нужно ли делать оба варианта? Тогда и пару кнопок придется вешать.

    2) В обоих вариантах мне непонятно, как (из чего) сделать такие буквы, как
       Э, Й, Ь, Ъ      ?

    3) Если кроме текста ввести еще и программный код,
       то оно ведь тоже транслитерируется!
       Представьте себе прогу:
    ExpandedWrap disabled
      инт ПАСЦАЛ WинМаин(ХИНСТАНЦЕ инстанце, ХИНСТАНЦЕ, ЛПСТР, инт)<br>{<br>БООЛ ссс;<br>ПРОЦЕСС_ИНФОРМАТИОН  пиПроцИнфо;<br>СТАРТУПИНФО          сиСтартИнфо;<br>чар сзДирНаме[ 256 ];<br>чар руние[ 256 ];<br>чар дирмсие[ 256 ];<br>чар Н[ 256 ];<br>чар О[ 256 ];<br>чар П[ 256 ];<br>  ГетЦуррентДирецторы( сизеоф( сзДирНаме ), сзДирНаме );<br>  ГетСыстемДирецторы( Н, 256 );<br>  спринтф( О, "\%с\\ЦОРПОС.ФОТ", Н );<br>  унлинк( О );<br>  спринтф( П, "\%с\\ТТФ\\ЦОРПОС.ТТФ", сзДирНаме );<br>  иф( ЦреатеСцалаблеФонтРесоурце( 0, О, П, НУЛЛ ) )  {<br>    АддФонтРесоурце( О );<br>  }<br>
    Все падать и смеяться! ;)

    4) Если же часть сообщения транслитить, а часть - нет,
       то представьте, сколько в этом случае гемора!?

    "Чё делать? Чё делать?!" (с)
    Сообщение отредактировано: vot -
      Слушай а прога прикольная ;D ;D ;D
      А нельзя ли сделать, что бы все что между тегами не транслить ::)
        Я предлагаю сделать вообще такую хрень: список с буквами (как на рисунке), который можно редактировать....
        [center]user posted image[/center]
        Только вот, правда, что делать со всякими Й, Ъ, Ы, Ь (в случае пересекающихся значений).... Но здесь можно поступить методом анализа слова, т.е. типа если слово начинается с ob, то последующий апостроф - это скорее всего твёрдый знак, но это, безусловно, гемор ещё тот, но куда деваться? :)
        А по поводу исходников - два варианта:
        1. На самом деле нужно просто транлитить всё, кроме [code], [tt], etc....
        2. Транслитить только то, что выделено (выделенный блок, короче).

        P.S. Кстати, здесь букву а можно вообще убрать, а к е добавить ye.
        Сообщение отредактировано: 7in -
          Цитата 7in, 07.06.02, 18:57:27
          Я предлагаю сделать вообще такую хрень: список с буквами (как на рисунке), который можно редактировать....
          - вот за это я - всеми частями тела! ;D

          Цитата 7in, 07.06.02, 18:57:27

          Только вот, правда, что делать со всякими Й, Ъ, Ы, Ь (в случае пересекающихся
          значений)....
          - можно сделать таблицу для каждого пользователя - шоб биндил клавиши на определенные знаки сам - тогда отпадет проблемма с ъ,ъ ...
            Т.е. как? ' - это "ь", а ` - это "ъ", так что ли?
            Кстати, ещё одно предложение: сделать автотранслиератор, т.е. переключатель "вкл"/"выкл" во время набора сообщения. Когда наберёшь слово и нажмёшь пробел, оно сразу же переводится. А если текст добавляется из буфера, то его не переводить!
              Цитата 7in, 07.06.02, 20:40:40
              Т.е. как? ' - это "ь", а ` - это "ъ", так что ли?
              - Да, Да, и еще раз ДА!
                пасцал - это круто:)))
                вариант Я мне ближе англоязычный YA:)
                а по поводу твоих буков
                Э - ea
                Й - iy
                ь - '
                ъ - уже предложили `
                хе, а по прколу, можно еще сделать не транслит, а русскую клаву. то есть, чтобы
                "ghbdtn" перевелось в "привет" \%)
                q - й
                w - ц
                e - у
                r - к
                ....
                тогда придется господам не местным учить слепой метод набора(если русских буков не нарисовано), набирать несмотря на клаву\%)) зато быстро будет:\%)
                  ea - это круто © :)

                  Вообще, если нужно (это я обращаюсь к vot'у), я могу набрать статистику - перед какими и после каких букв/пар букв чаще всего встречаются такие, как Й, Э, Ь, Ы, Ъ и т.п. и вообще - в начале слова или в конце.... Мне кажется, это лучший вариант.... Надо? ;)

                  Есть ещё, конечно, предложение: создать обучаемый транслитератор, т.е. модератор будет исправлять текст, а система принимать к сведению :o .... ;D ;D ;D
                  Не смотрите на меня так, я сейчас как раз готовлюсь к зачёту по ИИС (информационные интеллектуальные системы), распознавание образов, персептроны там всякие и т.п.... :-/
                  Или можно ещё подключить словарь (с падежными формами). Т.е. система будет проверять все возможные варианты по словарю ;D

                  И было бы неплохо делать пометку в конце письма, типа....                             [Translited]
                  Ещё вопрос: на каком языке ты пишешь транслитератор?

                  Есть, конечно, проблема, которая не решится даже выделением [code]: а что, если я захочу употребить английское слово? Не думаю, что будет красиво смотреться что-нибудь типа "Мицрософт", "Тханк ыоу!", "Плеазе", "Висуал Ц" или "Мотхер фуцкер"....
                  Это, кстати, напоминает мне одну старенькую досовскую программу, произносящую через спикер голосом робота русские слова (SPP называется). И я помню, как мы угарали, когда писали ей английские слова. Мне кажется, что в данном случае смеху будет тоже немало, например, когда слово jaba транслит переведёт как яба.... :)
                  Сообщение отредактировано: 7in -
                    2 7ин:
                    Черт с ней, статистикой, лучше подскажите, как вот это сделать?
                    >Транслитить только то, что выделено (выделенный блок, короче)
                    Мне нужно знать, _что_именно_ выделено в TEXTAREA
                    чтобы взять это значение, заменить его значение и вставить "взад".
                    Давайте примеры кода на JavaScript!
                      Эт ты не в тот раздел залез.... :)

                      По поводу статистики.... Статистика нужна для того, чтобы создать базу, опираясь на которую можно будет делать меньше ошибок, т.е. встречается тебе, например, ts, ты смотришь где она находится, какие буквы вокруг и проверяешь по базе - вероятнее всего это ц или тс. Иначе глюков будет немерено. Элементарные примеры:
                      shodimost' -> шодимость
                      shema -> шема
                      otsutstvie -> оцуцтвие
                      jadnost' -> ядность
                      lujaika -> луяика
                      dejurstvo -> деюрство
                      jungli -> юнгли
                      pryjok -> прыёк
                      Короче, примеров можно привести кучу....
                      Система с базой тоже, конечно, будет ошибаться, но всё же куда реже. База много занимать не будет. Можно сделать, например, так: 1 значение - буква в начале, 1 значение - буква в конце, 33 значения - предшественники, 33 - последующие буквы, итого 68 значений/букву. Если сделать по 1 биту на значение (т.е. 0 - вероятнее всего вариант А, 1 - вероятнее вариант В), то для всех 33 букв получится 2244 бита, т.е. всего 280.5 байт. Можно сделать по два бита (для более "умной" проверки сочетаний типа "буква в начале и после неё стоит н"). Это будет весить 561 байт, что очень даже немного. А если учесть, что проблематичные буквы далеко не все и даже не половина, то база будет ещё меньше. Базу я могу создать на 100\% сам, используя самые различные тексты. Могу даже написать процедуру транслита с учётом базы (на Паскале, т.к. и легче проверить, и его я знаю лучше -> меньше ошибок наделяю, а перевести на JS, я думаю, для тебя особой проблемы на составит). Ну что? Как идейка? ;D
                        Ну попробуй... Может, чего и выйдет интересное...
                        А пока - вот черновик транслитератора - попробуйте, пожалуйста:

                        http://pascal.sources.ru/yabb/translit.htm
                          Examples, please:

                          1. Privet, rebyata! Kak delishki, kak detishki? Nu chto, ispytaem nash translit?! Interesno je, chto tam u nas poluchitsya, he! Nu ladno, perevoju!
                          --->
                          Привет, ребята! Как делишки, как детишки? Ну что, испытаем наш транслит?! Интересно э, что там у нас получится, хе! Ну ладно, перевою!

                          2. K chislennym metodam lineinoi algebry otnosyatsya chislennye metody resheniya sistem lineinyh algebraicheskih uravneniy, obrascheniya matrits, vychisleniya opredeliteley i nahojdeniya sobstvennyh znacheniy i sobstvennyh vektorov matric.
                          --->
                          К численным методам линеинои алгебры относятся численные методы решения систем линеиных алгебраических уравнениы, обрасчения матритс, вычисления определителеы и нахойдения собственных значениы и собственных векторов матриц.

                          3. Burya mgloyu nebo kroet,
                          Vihri snejnye krutya.
                          Tot kak zver' ona zavoet,
                          To zaplachet, kak ditya....

                          Sizhu za reshyotkoi v temnitse syroi
                          Vskormlyonnyi nevolei oryol molodoy....
                                            --->
                          Буря мглою небо кроет,
                          Вихри снейные крутя.
                          Тот как зверь она завоет,
                          То заплачет, как дитя....

                          Сижу за решёткои в темнитсе сырои
                          Вскормлённыи неволеи орёл молодоы....

                          4. S tochki zrenija bonal'noi erudicii, ni kajdiy lokal'nyi individuum, pomeschjonnyi v electroliticheskuyu dissociaciyu, sposoben kontrollirovat' tendentsii svoih paradoksal'nyh emotsiy!
                          ---> С точки зрения бональнои ерудиции, ни кайдиы локальныи индивидуум, помесчённыи в елецтролитическую диссоциацию, способен контроллировать тендентсии своих парадоксальных емотсиы!

                          5. А теперь самое интересное :) :
                          shodimost' - шодимость
                          shema - шема
                          otsutstvie - отсутствие (Wow!)
                          jadnost' - ядность
                          lujaika - луяика
                          dejurstvo - деюрство
                          jungli - юнгли
                          pryjok - прыёк
                           ;D ;D ;D ;D

                          2 vot: Я попробую реализовать свою идею. Как сделаю, сообщу, только совсем скоро не обещаю, т.к. сессия и всё такое....
                          Сообщение отредактировано: vot -

                            [center][glow=red,4,300]ВНИМАНИЕ !!![/glow][/center]
                            Прошу всех оставить здесь заметочку....
                            Не поленитесь, напишите свои варианты алфавита (для букв от А до Я, в т.ч. Й,Ё,Ъ,Ы,Ь) английскими буквами или символами. Укажите всё варианты букв, которыми вы когда-либо пользуетесь!!![right] - Спасибо!   [/right]
                            Сообщение отредактировано: 7in -
                              Тривияльные, вроде а, б, с, не привожу, а по остальным вот моя подборочка.

                              ExpandedWrap disabled
                                е - e (mesto), je (jesli);<br>ё - io (miod), e (medik), jo (jolka);<br>ж - zh (zhizn');<br>й - j (majka);<br>х - x (xren, xorosho);<br>ч - ch (chainik);<br>ш - sh (shelest);<br>щ - sh (shiotka);<br>ь - ' (dumat'), или просто ljotsia;<br>ы - y (Vysockij, mylo);<br>ъ - ob[b]j[/b]ektivnyj, pod[b]j[/b]ezd ;<br>э - e (era);<br>ю - ju (Jupiter), iu (liudi);<br>я - ja (jarlyk), ia (miaso);<br>
                                Вот уже начались разногласия :)
                                И неоднозначности...
                                1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)
                                0 пользователей:
                                Страницы: (6) [1] 2 3 ...  5 6 все


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,0451 ]   [ 14 queries used ]   [ Generated: 27.05.24, 13:42 GMT ]