На главную Наши проекты:
Журнал   ·   Discuz!ML   ·   Wiki   ·   DRKB   ·   Помощь проекту
ПРАВИЛА FAQ Помощь Участники Календарь Избранное RSS
msm.ru
! правила раздела Алгоритмы
1. Помните, что название темы должно хоть как-то отражать ее содержимое (не создавайте темы с заголовком ПОМОГИТЕ, HELP и т.д.). Злоупотребление заглавными буквами в заголовках тем ЗАПРЕЩЕНО.
2. При создании темы постарайтесь, как можно более точно описать проблему, а не ограничиваться общими понятиями и определениями.
3. Приводимые фрагменты исходного кода старайтесь выделять тегами code.../code
4. Помните, чем подробнее Вы опишете свою проблему, тем быстрее получите вразумительный совет
5. Запрещено поднимать неактуальные темы (ПРИМЕР: запрещено отвечать на вопрос из серии "срочно надо", заданный в 2003 году)
6. И не забывайте о кнопочках TRANSLIT и РУССКАЯ КЛАВИАТУРА, если не можете писать в русской раскладке :)
Модераторы: Akina, shadeofgray
  
> Алгогритм soundex (1918г.) , упрощенный вариант
    Всем хай! Сходу к делу!

    Есть фонетический алгоритм soundex. Кстати, достаточно простой и понятный и ооочень давно разработанный вроде. Если что - вот он тут живет.

    Как я понимаю, когда два слова/фразы очень похоже звучат, то им назначается ОДИНАКОВЫЙ КОД (совпадают все 4-ре символа кода).

    Но, например, возьмем 2 слова: "аmmonium" и "еmmonium", то их коды будут соот-но: A555 и E555. Т е у них совпали 3 позиции из 4-рех.
    У меня вопрос: если полученные коды сравниваемых слов совпадают в 3-х позициях из 4-рех возможных, то их можно считать близкими по звучанию??
    Например, такие пары {a, b}: {F193, F113}, {Z100, Z200}, {B139, J139}, ...

    Или нужно считать лишь тогда фонет.совпадение, когда совпадают полученные коды во всех 4-рех позициях?

    P.S. MS SQL Server вроде еще их группируют как-то, назначая нумератор 1, 2, ..., n группа по совпадению.
    0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)
    0 пользователей:


    Рейтинг@Mail.ru
    [ Script execution time: 0,0138 ]   [ 15 queries used ]   [ Generated: 29.03.24, 13:34 GMT ]