Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[18.118.16.247] |
|
Страницы: (6) [1] 2 3 ... 5 6 все ( Перейти к последнему сообщению ) |
Сообщ.
#1
,
|
|
|
Попробуйте автоматическую переключалку раскладок для Linux.
X Neural Switcher (xneur)! Вышла новая версия xneur - 0.0.4. Так как прежние разработчики забросили проект и их сайт не доступен, то пришлось поработать напильником самому. Мною проделано следущее: - Изменен алгоритм распознавания языков (пока только русский-английский). - Улучшена работа со знаками препинания. Скачать можно здесь: http://xneur.narod.ru/xneur/xneur-0.0.4.tar.gz Сайт http://xneur.narod.ru |
Сообщ.
#2
,
|
|
|
Crew, а с разрабами пробовал состучаться или вывод сделан на основании того, что сайт упал?
|
Сообщ.
#3
,
|
|
|
Пробовал писать на мыло, но ящиков уже не существует.
Есть что-то на sourceforge, но там тоже как-то глухо. |
Сообщ.
#4
,
|
|
|
Изменил алгоритм работы со знаками препинания.
Исправленую версию качайте здесь: http://xneur.narod.ru/xneur/xneur-0.0.5.tar.gz |
Сообщ.
#5
,
|
|
|
Попробовал xneur-0.0.4.tar.gz симпотно Качаю xneur-0.0.5.tar.gz
|
Сообщ.
#6
,
|
|
|
Обновления идут постоянно.
Версия 0.0.6 Исправил проблему с переводом слов, начинающихся на "ю" и "б". Исправление доступно здесь: http://xneur.narod.ru/xneur/xneur-0.0.6.tar.gz |
Сообщ.
#7
,
|
|
|
Crew, молодца ! А гуевый настройщик появится? Как мне временно запретить автоматическое переключение ?
|
Сообщ.
#8
,
|
|
|
Надеюсь появится со временем, я пока новичек в linux, не умею gui делать.
Читайте FAQ на сайте или в дистрибутиве программы. Смотри параметр DefaultMode в конфиге. Его надо поменять на 1. |
Сообщ.
#9
,
|
|
|
Решил опубликовать алгоритм распознавания языка на случай, если у кого-то руки более прямые, чем у меня.
1. Однобуквенные слова - прямой выбор. у, к, в и тоиу подобные предлоги русские, остальные не переводятся. 2. Двубуквенные слова - использование "весов" двубуквенных буквосочетаний из латинского алфавита и символов на основе статистического рассчета. Т.е. попарно берутся буковки, и прогоняются по английским и русским текстам (русские переведены с помощью Punto в английскую кракозябру), считается удельный вес сочетания там и там, где больше, тому и предпочтение. У меня рассчет на текстах примерно в 3 Мб каждый, рассчет велся в Windows программой на Visual Basic, время обработки 30 минут. Могу ей поделиться, если надо. 3. Трех- и более буквенные слова - использование алгоритма "невозможности". Используется статистика, что данное трехбуквенное сочетание из анализируемого слова не встречается в английском языке, но встречается в русском. Анализ на 5 Мб текстах, время обработки 1 час. Программой на VB могу поделиться. Если все трехбуквенные сочетания из слова не попадают в перечень "невозможности", применяется алгоритм "весов" для всех двухбуквенных сочетаний из слова. Вычитая "русский" вес из "английского" (или наоборот), определяем язык. Вот, в кратце, и все. Если будет необходимость, напишу подробнее. |
Сообщ.
#10
,
|
|
|
Хммм. А не плохо... ;)
|
Сообщ.
#11
,
|
|
|
Цитата Crew @ Используется статистика По поводе алгоритма. А если применительно к "длинным" словам воспользоваться табличкой подстановок? Ну к примеру: Англ. -> Рус. "herf" -> "рука" И соответственно Рус. -> Англ. "Ыещз" -> "Stop" А к томуже если пользоваться не всем словом а к примеру отдельные его части (приставки, корни) должно получиться довольно неплохо. |
Сообщ.
#12
,
|
|
|
best_lamer, а теперь представь _размер_ сей таблицы.
|
Сообщ.
#13
,
|
|
|
Все слова не переберешь
Нужно именно эвристический анализатор. Пока думаю над словарем исключений, нужен ли? |
Сообщ.
#14
,
|
|
|
Цитата Crew @ Пока думаю над словарем исключений, нужен ли? Полюбому нужен. Статистика хорошо... а исключения все равно будут |
Сообщ.
#15
,
|
|
|
best_lamer, хорошая статистика сводит их к необходимому минимуму.
|