Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[18.119.104.238] |
|
Сообщ.
#1
,
|
|
|
Всем хай! Сходу к делу!
Есть фонетический алгоритм soundex. Кстати, достаточно простой и понятный и ооочень давно разработанный вроде. Если что - вот он тут живет. Как я понимаю, когда два слова/фразы очень похоже звучат, то им назначается ОДИНАКОВЫЙ КОД (совпадают все 4-ре символа кода). Но, например, возьмем 2 слова: "аmmonium" и "еmmonium", то их коды будут соот-но: A555 и E555. Т е у них совпали 3 позиции из 4-рех. У меня вопрос: если полученные коды сравниваемых слов совпадают в 3-х позициях из 4-рех возможных, то их можно считать близкими по звучанию?? Например, такие пары {a, b}: {F193, F113}, {Z100, Z200}, {B139, J139}, ... Или нужно считать лишь тогда фонет.совпадение, когда совпадают полученные коды во всех 4-рех позициях? P.S. MS SQL Server вроде еще их группируют как-то, назначая нумератор 1, 2, ..., n группа по совпадению. |