Наши проекты:
Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту |
||
ПРАВИЛА | FAQ | Помощь | Поиск | Участники | Календарь | Избранное | RSS |
[98.80.143.34] |
|
Сообщ.
#1
,
|
|
|
Недостатки различных методов машинного обучения
1) Дерево решений Недостаток: невозможно инкрементное обучение в процессе работы При поступлении новых данных надо перестраивать все дерево 2) Наивный Байесовский алгоритм Недостаток: Не может выявить зависимостей между разными переменными. Например, в анти-спам фильтре письмо-спам характеризует определенное сочетание слов, но эти слова по отдельности часто встречаются в нормальных письмах. Такую корреляцию наивный байес не выявит. Все входные данные должны хотя бы примерно обладать свойством независимости. 3) Нейронная сеть Недостаток: ненаглядна. Невозможно объяснить полученные результаты. Иногда бывает очень важно не просто предсказать результат процесса, но и составить алгоритм процесса. Дерево решений строит такой алгоритм, а НС – черный ящик! |
Сообщ.
#2
,
|
|
|
Цитата доктор Рагин @ Линейные модели, в принципе, неплохо ловят определённый тип спама 2) Наивный Байесовский алгоритм Недостаток: Не может выявить зависимостей между разными переменными. Например, в анти-спам фильтре письмо-спам характеризует определенное сочетание слов, но эти слова по отдельности часто встречаются в нормальных письмах. Такую корреляцию наивный байес не выявит. Все входные данные должны хотя бы примерно обладать свойством независимости. |
Сообщ.
#3
,
|
|
|
Цитата Линейные модели, в принципе, неплохо ловят определённый тип спама Это только если спам линейный |