На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
! Правила трёх "С"
Пожалуйста,
1. Соблюдайте правила Форума.
2. Слушайте советы Модераторов.
(например, http://forum.sources.ru/index.php?act=ST&f=7&t=80382 )
3. Сверяйтесь с учебником по Великому и Могучему
Страницы: (6) [1] 2 3 ...  5 6 все  ( Перейти к последнему сообщению )  
> xneur - Punto Switcher for Linux , автоматический переключатель раскладок
    Попробуйте автоматическую переключалку раскладок для Linux.
    X Neural Switcher (xneur)!
    Вышла новая версия xneur - 0.0.4.

    Так как прежние разработчики забросили проект и их сайт не доступен, то пришлось поработать напильником самому.
    Мною проделано следущее:
    - Изменен алгоритм распознавания языков (пока только русский-английский).
    - Улучшена работа со знаками препинания.

    Скачать можно здесь:
    http://xneur.narod.ru/xneur/xneur-0.0.4.tar.gz

    Сайт http://xneur.narod.ru
      Crew, а с разрабами пробовал состучаться или вывод сделан на основании того, что сайт упал?
        Пробовал писать на мыло, но ящиков уже не существует.
        Есть что-то на sourceforge, но там тоже как-то глухо.
          Изменил алгоритм работы со знаками препинания.
          Исправленую версию качайте здесь:
          http://xneur.narod.ru/xneur/xneur-0.0.5.tar.gz
            Попробовал xneur-0.0.4.tar.gz симпотно :) Качаю xneur-0.0.5.tar.gz
              Обновления идут постоянно.

              Версия 0.0.6
              Исправил проблему с переводом слов, начинающихся на "ю" и "б".
              Исправление доступно здесь:
              http://xneur.narod.ru/xneur/xneur-0.0.6.tar.gz
                Crew, молодца ! А гуевый настройщик появится? Как мне временно запретить автоматическое переключение ?
                  Надеюсь появится со временем, я пока новичек в linux, не умею gui делать.

                  Читайте FAQ на сайте или в дистрибутиве программы. Смотри параметр DefaultMode в конфиге. Его надо поменять на 1.
                    Решил опубликовать алгоритм распознавания языка на случай, если у кого-то руки более прямые, чем у меня.

                    1. Однобуквенные слова - прямой выбор. у, к, в и тоиу подобные предлоги русские, остальные не переводятся.
                    2. Двубуквенные слова - использование "весов" двубуквенных буквосочетаний из латинского алфавита и символов на основе статистического рассчета. Т.е. попарно берутся буковки, и прогоняются по английским и русским текстам (русские переведены с помощью Punto в английскую кракозябру), считается удельный вес сочетания там и там, где больше, тому и предпочтение. У меня рассчет на текстах примерно в 3 Мб каждый, рассчет велся в Windows программой на Visual Basic, время обработки 30 минут. Могу ей поделиться, если надо.
                    3. Трех- и более буквенные слова - использование алгоритма "невозможности". Используется статистика, что данное трехбуквенное сочетание из анализируемого слова не встречается в английском языке, но встречается в русском. Анализ на 5 Мб текстах, время обработки 1 час. Программой на VB могу поделиться. Если все трехбуквенные сочетания из слова не попадают в перечень "невозможности", применяется алгоритм "весов" для всех двухбуквенных сочетаний из слова. Вычитая "русский" вес из "английского" (или наоборот), определяем язык.

                    Вот, в кратце, и все. Если будет необходимость, напишу подробнее.
                      Хммм. А не плохо... ;)
                        Цитата Crew @
                        Используется статистика

                        По поводе алгоритма.
                        А если применительно к "длинным" словам воспользоваться табличкой подстановок? Ну к примеру:
                        Англ. -> Рус.
                        "herf" -> "рука"

                        И соответственно
                        Рус. -> Англ.
                        "Ыещз" -> "Stop"

                        А к томуже если пользоваться не всем словом а к примеру отдельные его части (приставки, корни) должно получиться довольно неплохо.
                          best_lamer, а теперь представь _размер_ сей таблицы.
                            Все слова не переберешь :)
                            Нужно именно эвристический анализатор. Пока думаю над словарем исключений, нужен ли?
                              Цитата Crew @
                              Пока думаю над словарем исключений, нужен ли?


                              Полюбому нужен. Статистика хорошо... а исключения все равно будут :)
                                best_lamer, хорошая статистика сводит их к необходимому минимуму.
                                0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
                                0 пользователей:
                                Страницы: (6) [1] 2 3 ...  5 6 все


                                Рейтинг@Mail.ru
                                [ Script execution time: 0,0351 ]   [ 15 queries used ]   [ Generated: 16.05.24, 08:29 GMT ]