Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[3.144.173.144] |
|
Страницы: (6) [1] 2 3 ... 5 6 все ( Перейти к последнему сообщению ) |
Сообщ.
#1
,
|
|
|
Итак, транслитератор готов.
Прежде, чем подключать его, хотелось бы обсудить пару моментов. 1) существует пара вариантов транслитерации: англо-подобная и германо-подобная. Например, YA=Я и JA=Я Нужно ли делать оба варианта? Тогда и пару кнопок придется вешать. 2) В обоих вариантах мне непонятно, как (из чего) сделать такие буквы, как Э, Й, Ь, Ъ ? 3) Если кроме текста ввести еще и программный код, то оно ведь тоже транслитерируется! Представьте себе прогу: инт ПАСЦАЛ WинМаин(ХИНСТАНЦЕ инстанце, ХИНСТАНЦЕ, ЛПСТР, инт)<br>{<br>БООЛ ссс;<br>ПРОЦЕСС_ИНФОРМАТИОН пиПроцИнфо;<br>СТАРТУПИНФО сиСтартИнфо;<br>чар сзДирНаме[ 256 ];<br>чар руние[ 256 ];<br>чар дирмсие[ 256 ];<br>чар Н[ 256 ];<br>чар О[ 256 ];<br>чар П[ 256 ];<br> ГетЦуррентДирецторы( сизеоф( сзДирНаме ), сзДирНаме );<br> ГетСыстемДирецторы( Н, 256 );<br> спринтф( О, "\%с\\ЦОРПОС.ФОТ", Н );<br> унлинк( О );<br> спринтф( П, "\%с\\ТТФ\\ЦОРПОС.ТТФ", сзДирНаме );<br> иф( ЦреатеСцалаблеФонтРесоурце( 0, О, П, НУЛЛ ) ) {<br> АддФонтРесоурце( О );<br> }<br> 4) Если же часть сообщения транслитить, а часть - нет, то представьте, сколько в этом случае гемора!? "Чё делать? Чё делать?!" (с) |
Сообщ.
#2
,
|
|
|
Слушай а прога прикольная ;D ;D ;D
А нельзя ли сделать, что бы все что между тегами не транслить : |
Сообщ.
#3
,
|
|
|
Я предлагаю сделать вообще такую хрень: список с буквами (как на рисунке), который можно редактировать....
[center][/center] Только вот, правда, что делать со всякими Й, Ъ, Ы, Ь (в случае пересекающихся значений).... Но здесь можно поступить методом анализа слова, т.е. типа если слово начинается с ob, то последующий апостроф - это скорее всего твёрдый знак, но это, безусловно, гемор ещё тот, но куда деваться? А по поводу исходников - два варианта: 1. На самом деле нужно просто транлитить всё, кроме [code], [tt], etc.... 2. Транслитить только то, что выделено (выделенный блок, короче). P.S. Кстати, здесь букву а можно вообще убрать, а к е добавить ye. |
Сообщ.
#4
,
|
|
|
Цитата 7in, 07.06.02, 18:57:27 - вот за это я - всеми частями тела! ;DЯ предлагаю сделать вообще такую хрень: список с буквами (как на рисунке), который можно редактировать.... Цитата 7in, 07.06.02, 18:57:27 - можно сделать таблицу для каждого пользователя - шоб биндил клавиши на определенные знаки сам - тогда отпадет проблемма с ъ,ъ ...Только вот, правда, что делать со всякими Й, Ъ, Ы, Ь (в случае пересекающихся значений).... |
Сообщ.
#5
,
|
|
|
Т.е. как? ' - это "ь", а ` - это "ъ", так что ли?
Кстати, ещё одно предложение: сделать автотранслиератор, т.е. переключатель "вкл"/"выкл" во время набора сообщения. Когда наберёшь слово и нажмёшь пробел, оно сразу же переводится. А если текст добавляется из буфера, то его не переводить! |
Сообщ.
#6
,
|
|
|
Цитата 7in, 07.06.02, 20:40:40 - Да, Да, и еще раз ДА!Т.е. как? ' - это "ь", а ` - это "ъ", так что ли? |
Сообщ.
#7
,
|
|
|
пасцал - это круто:)))
вариант Я мне ближе англоязычный YA:) а по поводу твоих буков Э - ea Й - iy ь - ' ъ - уже предложили ` хе, а по прколу, можно еще сделать не транслит, а русскую клаву. то есть, чтобы "ghbdtn" перевелось в "привет" \%) q - й w - ц e - у r - к .... тогда придется господам не местным учить слепой метод набора(если русских буков не нарисовано), набирать несмотря на клаву\%)) зато быстро будет:\%) |
Сообщ.
#8
,
|
|
|
ea - это круто ©
Вообще, если нужно (это я обращаюсь к vot'у), я могу набрать статистику - перед какими и после каких букв/пар букв чаще всего встречаются такие, как Й, Э, Ь, Ы, Ъ и т.п. и вообще - в начале слова или в конце.... Мне кажется, это лучший вариант.... Надо? Есть ещё, конечно, предложение: создать обучаемый транслитератор, т.е. модератор будет исправлять текст, а система принимать к сведению .... ;D ;D ;D Не смотрите на меня так, я сейчас как раз готовлюсь к зачёту по ИИС (информационные интеллектуальные системы), распознавание образов, персептроны там всякие и т.п.... :-/ Или можно ещё подключить словарь (с падежными формами). Т.е. система будет проверять все возможные варианты по словарю ;D И было бы неплохо делать пометку в конце письма, типа.... [Translited] Ещё вопрос: на каком языке ты пишешь транслитератор? Есть, конечно, проблема, которая не решится даже выделением [code]: а что, если я захочу употребить английское слово? Не думаю, что будет красиво смотреться что-нибудь типа "Мицрософт", "Тханк ыоу!", "Плеазе", "Висуал Ц" или "Мотхер фуцкер".... Это, кстати, напоминает мне одну старенькую досовскую программу, произносящую через спикер голосом робота русские слова (SPP называется). И я помню, как мы угарали, когда писали ей английские слова. Мне кажется, что в данном случае смеху будет тоже немало, например, когда слово jaba транслит переведёт как яба.... |
Сообщ.
#9
,
|
|
|
2 7ин:
Черт с ней, статистикой, лучше подскажите, как вот это сделать? >Транслитить только то, что выделено (выделенный блок, короче) Мне нужно знать, _что_именно_ выделено в TEXTAREA чтобы взять это значение, заменить его значение и вставить "взад". Давайте примеры кода на JavaScript! |
Сообщ.
#10
,
|
|
|
Эт ты не в тот раздел залез....
По поводу статистики.... Статистика нужна для того, чтобы создать базу, опираясь на которую можно будет делать меньше ошибок, т.е. встречается тебе, например, ts, ты смотришь где она находится, какие буквы вокруг и проверяешь по базе - вероятнее всего это ц или тс. Иначе глюков будет немерено. Элементарные примеры: shodimost' -> шодимость shema -> шема otsutstvie -> оцуцтвие jadnost' -> ядность lujaika -> луяика dejurstvo -> деюрство jungli -> юнгли pryjok -> прыёк Короче, примеров можно привести кучу.... Система с базой тоже, конечно, будет ошибаться, но всё же куда реже. База много занимать не будет. Можно сделать, например, так: 1 значение - буква в начале, 1 значение - буква в конце, 33 значения - предшественники, 33 - последующие буквы, итого 68 значений/букву. Если сделать по 1 биту на значение (т.е. 0 - вероятнее всего вариант А, 1 - вероятнее вариант В), то для всех 33 букв получится 2244 бита, т.е. всего 280.5 байт. Можно сделать по два бита (для более "умной" проверки сочетаний типа "буква в начале и после неё стоит н"). Это будет весить 561 байт, что очень даже немного. А если учесть, что проблематичные буквы далеко не все и даже не половина, то база будет ещё меньше. Базу я могу создать на 100\% сам, используя самые различные тексты. Могу даже написать процедуру транслита с учётом базы (на Паскале, т.к. и легче проверить, и его я знаю лучше -> меньше ошибок наделяю, а перевести на JS, я думаю, для тебя особой проблемы на составит). Ну что? Как идейка? ;D |
Сообщ.
#11
,
|
|
|
Ну попробуй... Может, чего и выйдет интересное...
А пока - вот черновик транслитератора - попробуйте, пожалуйста: http://pascal.sources.ru/yabb/translit.htm |
Сообщ.
#12
,
|
|
|
Examples, please:
1. Privet, rebyata! Kak delishki, kak detishki? Nu chto, ispytaem nash translit?! Interesno je, chto tam u nas poluchitsya, he! Nu ladno, perevoju! ---> Привет, ребята! Как делишки, как детишки? Ну что, испытаем наш транслит?! Интересно э, что там у нас получится, хе! Ну ладно, перевою! 2. K chislennym metodam lineinoi algebry otnosyatsya chislennye metody resheniya sistem lineinyh algebraicheskih uravneniy, obrascheniya matrits, vychisleniya opredeliteley i nahojdeniya sobstvennyh znacheniy i sobstvennyh vektorov matric. ---> К численным методам линеинои алгебры относятся численные методы решения систем линеиных алгебраических уравнениы, обрасчения матритс, вычисления определителеы и нахойдения собственных значениы и собственных векторов матриц. 3. Burya mgloyu nebo kroet, Vihri snejnye krutya. Tot kak zver' ona zavoet, To zaplachet, kak ditya.... Sizhu za reshyotkoi v temnitse syroi Vskormlyonnyi nevolei oryol molodoy.... ---> Буря мглою небо кроет, Вихри снейные крутя. Тот как зверь она завоет, То заплачет, как дитя.... Сижу за решёткои в темнитсе сырои Вскормлённыи неволеи орёл молодоы.... 4. S tochki zrenija bonal'noi erudicii, ni kajdiy lokal'nyi individuum, pomeschjonnyi v electroliticheskuyu dissociaciyu, sposoben kontrollirovat' tendentsii svoih paradoksal'nyh emotsiy! ---> С точки зрения бональнои ерудиции, ни кайдиы локальныи индивидуум, помесчённыи в елецтролитическую диссоциацию, способен контроллировать тендентсии своих парадоксальных емотсиы! 5. А теперь самое интересное : shodimost' - шодимость shema - шема otsutstvie - отсутствие (Wow!) jadnost' - ядность lujaika - луяика dejurstvo - деюрство jungli - юнгли pryjok - прыёк ;D ;D ;D ;D 2 vot: Я попробую реализовать свою идею. Как сделаю, сообщу, только совсем скоро не обещаю, т.к. сессия и всё такое.... |
Сообщ.
#13
,
|
|
|
[center][glow=red,4,300]ВНИМАНИЕ !!![/glow][/center] Прошу всех оставить здесь заметочку.... Не поленитесь, напишите свои варианты алфавита (для букв от А до Я, в т.ч. Й,Ё,Ъ,Ы,Ь) английскими буквами или символами. Укажите всё варианты букв, которыми вы когда-либо пользуетесь!!![right] - Спасибо! [/right] |
Сообщ.
#14
,
|
|
|
Тривияльные, вроде а, б, с, не привожу, а по остальным вот моя подборочка.
е - e (mesto), je (jesli);<br>ё - io (miod), e (medik), jo (jolka);<br>ж - zh (zhizn');<br>й - j (majka);<br>х - x (xren, xorosho);<br>ч - ch (chainik);<br>ш - sh (shelest);<br>щ - sh (shiotka);<br>ь - ' (dumat'), или просто ljotsia;<br>ы - y (Vysockij, mylo);<br>ъ - ob[b]j[/b]ektivnyj, pod[b]j[/b]ezd ;<br>э - e (era);<br>ю - ju (Jupiter), iu (liudi);<br>я - ja (jarlyk), ia (miaso);<br> |
Сообщ.
#15
,
|
|
|
Вот уже начались разногласия
И неоднозначности... |