Kaldi LSTM C++ -> Форум на Исходниках.Ру

	Наши проекты: Журнал · Discuz!ML · Wiki · DRKB · Помощь проекту

Здравствуйте, Гость ! [3.138.85.72]

Дорогие друзья! Поздравляем вас с днём Победы!

Модераторы: RaD, nsh

Новое голосование

Kaldi LSTM C++ , запустить обучение сети LSTM с помощью Kaldi

Abraziv

Сообщ. #1 , 10.10.18, 03:31

Junior

Профиль · PM

Рейтинг (т): нет

Доброго времени суток. Хочу использовать GPU для обучения сети LSTM, сейчас имеется полностью реализованный мной с нуля цикл обучения сети LSTM признаками MFCC+D+DD из WAV, но проблема в скорости обучения. Имеется огромное желание по сформированным мной признакам, обучить LSTM на GPU с помощью сторонней библиотеки. В нете пишут про Kaldi, но порог вхождения в эту библиотеку для меня высок, может кто нибудь поделиться опытом ???
https://github.com/dophist/kaldi-lstm

nsh

Сообщ. #2 , 10.10.18, 05:27

Moderator

Профиль · PM

Цитата Abraziv @ 10.10.18, 03:31

В нете пишут про Kaldi, но порог вхождения в эту библиотеку для меня высок, может кто нибудь поделиться опытом ???

Тут не сообщество анонимных алкоголиков, лучше задавать технические вопросы, если они есть.

Цитата

https://github.com/dophist/kaldi-lstm

Это левый экспериментальный код, lstm давно есть уже в самом kaldi, например здесь https://github.com/kaldi-asr/kaldi/blob/mas...tdnn_lstm_1c.sh

Abraziv	Сообщ. #3 , 10.10.18, 05:35
Junior Профиль · PM Рейтинг (т): нет	Так вопрос собственно очень прост, как использовать эти .sh Я работаю под Windows. Курить всё библиотеку несколько месяцев, потом упереться во что нибудь и всё.

nsh	Сообщ. #4 , 10.10.18, 05:40
Moderator Профиль · PM	Под Windows Kaldi можно использовать только для декодирования. Для тренировки нужно осваивать Линукс. Его можно установить в виртуальной машине, например, в Virtualbox. Для GPU рекомендуется установить на железе.

Abraziv

Сообщ. #5 , 10.10.18, 05:41

Junior

Профиль · PM

Рейтинг (т): нет

Технический вопрос: нужна быстрая библиотека для обучения LSTM из под C++, с возможностью переключения GPU на CPU если видеокарты с поддержкой CUDA нет. Если нет возможности переключения, то по крайней мере необходима возможность сохранения весов в одном из принятых видов.

Добавлено 10.10.18, 06:06
Походу адекватным решением будет, курение cuDNN.

XOOIOOX

Сообщ. #6 , 11.10.18, 07:24

Newbie

Профиль · PM

Рейтинг (т): нет

Цитата Abraziv @ 10.10.18, 05:41

быстрая библиотека для обучения LSTM из под C++

CNTK

Цитата Abraziv @ 10.10.18, 05:41

переключения GPU на CPU если видеокарты с поддержкой CUDA нет

Это руками придется детектить. К тому же, обученная на CPU сеть не будет работать на GPU и наоборот.

Цитата Abraziv @ 10.10.18, 05:41

адекватным решением будет, курение cuDNN

Плохая идея.

Abraziv

Сообщ. #7 , 11.10.18, 09:09

Junior

Профиль · PM

Рейтинг (т): нет

Цитата XOOIOOX @ 11.10.18, 07:24

Это руками придется детектить. К тому же, обученная на CPU сеть не будет работать на GPU и наоборот.

Почему??? Какая разница??? Float и Double это стандартизированные вещи. nsh вопрос к тебе как Гуру тоже.

Цитата XOOIOOX @ 11.10.18, 07:24

Плохая идея.

Ну согласен, я имел ввиду Caffe2 какую нибудь)

Сообщение отредактировано: Abraziv - 11.10.18, 09:42

XOOIOOX

Сообщ. #8 , 11.10.18, 15:02

Newbie

Профиль · PM

Рейтинг (т): нет

Цитата Abraziv @ 11.10.18, 09:09

Float и Double

Дело не в формате чисел с плавающей, а в структуре самой сети. По крайней мере, в CNTK это разные сети. Наверное сделано для оптимизации.

Цитата Abraziv @ 11.10.18, 09:09

Caffe2

Пробовал. Какая-то "потная" и не очевидная история. В случае Ц++, конечно.

Еще есть TensorFlow, но с LSTM оно медленнее, чем CNTK.

Abraziv	Сообщ. #9 , 11.10.18, 21:53
Junior Профиль · PM Рейтинг (т): нет	Спасибо за ответы. Цитата XOOIOOX @ 11.10.18, 15:02 Дело не в формате чисел с плавающей, а в структуре самой сети. По крайней мере, в CNTK это разные сети. Наверное сделано для оптимизации. Это точно? Вы не ошиблись не где?

nsh	Сообщ. #10 , 15.10.18, 08:50
Moderator Профиль · PM	LSTM вообще медленно, сейчас все, кто быстро хочет, использует transformer с многоголовым вниманием.

Abraziv	Сообщ. #11 , 15.10.18, 09:12
Junior Профиль · PM Рейтинг (т): нет	Цитата nsh @ 15.10.18, 08:50 Вообще я для своей задачи пытался применить "чистый ЦОС", как бы не экспериментировал, не получилось. НН в этом плане чудесном образом аппроксимируют искомую мной функцию )))

nsh	Сообщ. #12 , 15.10.18, 12:25
Moderator Профиль · PM	Цитата Abraziv @ 15.10.18, 09:12 НН в этом плане чудесном образом transformer это тоже нейросеть, но без циклов.

XOOIOOX	Сообщ. #13 , 15.10.18, 15:31
Newbie Профиль · PM Рейтинг (т): нет	Цитата Abraziv @ 11.10.18, 21:53 Это точно? Был не прав. В последних версиях (2.6) сделали полную взаимозаменяемость. В версии 2.1 все было раздельно и несовместимо друг с другом.

Abraziv	Сообщ. #14 , 15.10.18, 21:46
Junior Профиль · PM Рейтинг (т): нет	Цитата XOOIOOX @ 15.10.18, 15:31 Спасибо за ответ. Интересно , а в 2.5 тоже есть взаимозаменяемость...хм.

1 пользователей читают эту тему (1 гостей и 0 скрытых пользователей)

0 пользователей:

[ Script execution time: 0,0372 ] [ 14 queries used ] [ Generated: 13.05.24, 06:48 GMT ]