Алгогритм soundex (1918г.) -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [18.119.104.238]

правила раздела Алгоритмы

1. Помните, что название темы должно хоть как-то отражать ее содержимое (не создавайте темы с заголовком ПОМОГИТЕ, HELP и т.д.). Злоупотребление заглавными буквами в заголовках тем ЗАПРЕЩЕНО.
2. При создании темы постарайтесь, как можно более точно описать проблему, а не ограничиваться общими понятиями и определениями.
3. Приводимые фрагменты исходного кода старайтесь выделять тегами code.../code
4. Помните, чем подробнее Вы опишете свою проблему, тем быстрее получите вразумительный совет
5. Запрещено поднимать неактуальные темы (ПРИМЕР: запрещено отвечать на вопрос из серии "срочно надо", заданный в 2003 году)
6. И не забывайте о кнопочках TRANSLIT и РУССКАЯ КЛАВИАТУРА, если не можете писать в русской раскладке

Модераторы: Akina, shadeofgray

Новое голосование

Алгогритм soundex (1918г.) , упрощенный вариант

FasterHarder

Сообщ. #1 , 11.12.18, 21:14

Master

Профиль · PM

Всем хай! Сходу к делу!

Есть фонетический алгоритм soundex. Кстати, достаточно простой и понятный и ооочень давно разработанный вроде. Если что - вот он тут живет.

Как я понимаю, когда два слова/фразы очень похоже звучат, то им назначается ОДИНАКОВЫЙ КОД (совпадают все 4-ре символа кода).

Но, например, возьмем 2 слова: "аmmonium" и "еmmonium", то их коды будут соот-но: A555 и E555. Т е у них совпали 3 позиции из 4-рех.
У меня вопрос: если полученные коды сравниваемых слов совпадают в 3-х позициях из 4-рех возможных, то их можно считать близкими по звучанию??
Например, такие пары {a, b}: {F193, F113}, {Z100, Z200}, {B139, J139}, ...

Или нужно считать лишь тогда фонет.совпадение, когда совпадают полученные коды во всех 4-рех позициях?

P.S. MS SQL Server вроде еще их группируют как-то, назначая нумератор 1, 2, ..., n группа по совпадению.

0 пользователей читают эту тему (0 гостей и 0 скрытых пользователей)

0 пользователей:

[ Script execution time: 0,0139 ] [ 15 queries used ] [ Generated: 19.04.24, 03:09 GMT ]