Долговременная кратковременная память - Long short-term memory

Ячейка долгосрочной краткосрочной памяти (LSTM) может обрабатывать данные последовательно и сохранять свое скрытое состояние во времени.

Долговременная кратковременная память (LSTM) является искусственным рекуррентная нейронная сеть (RNN) архитектура[1] используется в области глубокое обучение. В отличие от стандартных нейронные сети с прямой связью, LSTM имеет обратную связь. Он может обрабатывать не только отдельные точки данных (например, изображения), но и целые последовательности данных (например, речь или видео). Например, LSTM применим к таким задачам, как несегментированный, связанный распознавание почерка,[2] распознавание речи[3][4] и обнаружение аномалий в сетевом трафике или IDS (системы обнаружения вторжений).

Обычный блок LSTM состоит из клетка, входные ворота, выходной вентиль и забыть ворота. Ячейка запоминает значения за произвольные интервалы времени и три ворота регулировать поток информации в ячейку и из нее.

Сети LSTM хорошо подходят для классификация, обработка и делать прогнозы на основе Временные ряды данных, поскольку между важными событиями временного ряда могут быть запаздывания неизвестной продолжительности. LSTM были разработаны для работы с проблема исчезающего градиента с которыми можно столкнуться при обучении традиционных RNN. Относительная нечувствительность к длине зазора - преимущество LSTM перед RNN, скрытые марковские модели и другие методы обучения последовательности во многих приложениях.[нужна цитата ]

Преимущество ячейки LSTM по сравнению с обычным повторяющимся блоком - это блок памяти ячейки. Вектор ячейки имеет возможность инкапсулировать понятие забвения части его ранее сохраненной памяти, а также добавить часть новой информации. Чтобы проиллюстрировать это, нужно проверить уравнения ячейки и того, как она обрабатывает скрытые последовательности.

История

1995-1997: LSTM был предложен Зепп Хохрайтер и Юрген Шмидхубер.[5][6][1] Представляя блоки карусели с постоянными ошибками (CEC), LSTM решает проблема исчезающего градиента. Первоначальная версия блока LSTM включала ячейки, входные и выходные вентили.[7]

1999: Феликс Герс и его советник Юрген Шмидхубер и Фред Камминс ввел «ворота забывания» (также называемые «охраняемые ворота») в архитектуру LSTM,[8] позволяя LSTM сбрасывать собственное состояние.[7]

2000: Gers & Schmidhuber & Cummins добавили в архитектуру соединения-глазки (соединения от камеры к воротам).[9] Кроме того, отсутствовала функция активации выхода.[7]

2009: Модель на основе LSTM выиграла ICDAR связанный конкурс распознавания почерка. Три такие модели были представлены командой во главе с Алекс Грейвс.[10] Одна была самой точной моделью в конкурсе, а другая - самой быстрой.[11]

2013: Сети LSTM были основным компонентом сети, которая достигла рекордных 17,7%. фонема частота ошибок на классике ТИМИТ набор данных естественной речи.[12]

2014: Кёнхён Чо и др. выдвинул упрощенный вариант, названный Закрытый рекуррентный блок (ГРУ).[13]

2015: Google начал использовать LSTM для распознавания речи в Google Voice.[14][15] Согласно официальному сообщению в блоге, новая модель сократила ошибки транскрипции на 49%. [16]

2016: Google начал использовать LSTM, чтобы предлагать сообщения в приложении беседы Allo.[17] В том же году Google выпустил Нейронный машинный перевод Google система для Google Translate, которая использовала LSTM для уменьшения ошибок перевода на 60%.[18][19][20]

Apple объявила в своем Всемирная конференция разработчиков что он начнет использовать LSTM для быстрого ввода[21][22][23] в iPhone и для Siri.[24][25]

Amazon выпустила Полли, который генерирует голоса позади Alexa, используя двунаправленный LSTM для технологии преобразования текста в речь.[26]

2017: Facebook выполнял около 4,5 миллиардов автоматических переводов каждый день, используя сети долговременной краткосрочной памяти.[27]

Исследователи из Университет штата Мичиган, IBM Research, и Корнелл Университет опубликовал исследование на конференции Knowledge Discovery and Data Mining (KDD).[28][29][30] В их исследовании описывается новая нейронная сеть, которая работает с определенными наборами данных лучше, чем широко используемая нейронная сеть с долговременной краткосрочной памятью.

Microsoft сообщила о достижении точности распознавания 94,9% на Корпус коммутатора со словарным запасом в 165 000 слов. В подходе используется «диалоговая сессия на основе долговременной краткосрочной памяти».[31]

2019: Исследователи из Университет Ватерлоо предложила связанную архитектуру RNN, которая представляет непрерывные окна времени. Он был получен с использованием Полиномы Лежандра и превосходит LSTM в некоторых тестах, связанных с памятью.[32]

Модель LSTM поднялась на третье место в тесте сжатия большого текста.[33][34]

Идея

По идее классический (или «ванильный») RNN может отслеживать произвольные долгосрочные зависимости во входных последовательностях. Проблема с ванильными RNN носит вычислительный (или практический) характер: при обучении ванильных RNN с использованием обратное распространение, градиенты, которые распространяются в обратном направлении, могут "исчезнуть" (то есть они могут стремиться к нулю) или "взорваться" (то есть они могут стремиться к бесконечности), из-за вычислений, вовлеченных в процесс, которые используют числа конечной точности. RNN, использующие блоки LSTM, частично решают проблема исчезающего градиента, потому что блоки LSTM позволяют градиентам также течь без изменений. Однако сети LSTM все еще могут страдать от проблемы взрывного градиента.[35]

Архитектура

Существует несколько архитектур модулей LSTM. Общая архитектура состоит из клетка (часть памяти модуля LSTM) и три «регулятора», обычно называемых воротами, потока информации внутри модуля LSTM: входные ворота, выходной вентиль и забыть ворота. Некоторые варианты модуля LSTM не имеют одного или нескольких этих ворот или, возможно, имеют другие ворота. Например, закрытые повторяющиеся единицы (ГРУ) не имеют выходного вентиля.

Интуитивно клетка отвечает за отслеживание зависимостей между элементами входной последовательности. В входные ворота контролирует степень поступления нового значения в ячейку, забыть ворота контролирует степень, в которой значение остается в ячейке, и выходной вентиль контролирует степень, в которой значение в ячейке используется для вычисления активации вывода модуля LSTM. Функция активации LSTM ворота часто логистическая сигмовидная функция.

Есть соединения в LSTM и из него ворота, некоторые из которых повторяются. Веса этих связей, которые необходимо узнать во время обучение персонала, определите, как работают ворота.

Варианты

В приведенных ниже уравнениях переменные в нижнем регистре представляют векторы. Матрицы и содержат соответственно веса входной и рекуррентной связи, где нижний индекс может быть входным вентилем , выходной вентиль , ворота забыть или ячейка памяти , в зависимости от рассчитываемой активации. Таким образом, в этом разделе мы используем "векторные обозначения". Так, например, не просто одна ячейка одной единицы LSTM, но содержит Ячейки блока LSTM.

LSTM с воротами для забвения

Компактные формы уравнений для прямого прохода блока LSTM с затвором забывания:[1][9]

где начальные значения и и оператор обозначает Произведение Адамара (поэлементное произведение). Нижний индекс индексирует временной шаг.

Переменные

  • : входной вектор в модуль LSTM
  • : забыть вектор активации ворот
  • : ввод / обновление вектора активации ворот
  • : вектор активации выходного затвора
  • : вектор скрытого состояния, также известный как выходной вектор модуля LSTM
  • : вектор активации ввода ячейки
  • : вектор состояния ячейки
  • , и : весовые матрицы и параметры вектора смещения, которые необходимо изучить во время обучения

где верхние индексы и относятся к количеству входных функций и количеству скрытых единиц соответственно.

Функции активации

Глазок LSTM

А глазок LSTM блок со входом (т.е. ), вывод (т.е. ) и забыть (т.е. ) ворота. Каждый из этих ворот можно рассматривать как «стандартный» нейрон в нейронной сети с прямой связью (или многослойной): то есть они вычисляют активацию (с использованием функции активации) взвешенной суммы. и представляют активацию соответственно входных, выходных и забытых вентилей на временном шаге . 3 стрелки выхода из ячейки памяти к 3 воротам и представляют дверной глазок соединения. Эти соединения-глазки фактически обозначают вклад активации ячейки памяти. на временном шаге , т.е. вклад (и нет , как видно на картинке). Другими словами, ворота и рассчитать их активации на временном шаге (т.е. соответственно и ) также учитывая активацию ячейки памяти на временном шаге , т.е. . Единственная стрелка слева направо, выходящая из ячейки памяти: нет глазок соединения и обозначает . Маленькие кружки, содержащие символ представляют собой поэлементное умножение между его входами. Большие круги, содержащие S-подобная кривая представляет собой приложение дифференцируемой функции (например, сигмовидной функции) к взвешенной сумме. Есть много других типов LSTM.[7]

Рисунок справа - это графическое изображение блока LSTM с отверстиями для подключения глазка (то есть LSTM-глазка).[36][37] Соединения с глазком позволяют воротам получить доступ к карусели постоянных ошибок (CEC), активация которой является состоянием ячейки.[38] не используется, вместо этого используется в большинстве мест.

Сверточный глазок LSTM

Дверной глазок сверточный LSTM.[39] В обозначает свертка оператор.

Обучение персонала

RNN, использующий блоки LSTM, может быть обучен контролируемым образом, на наборе обучающих последовательностей, с использованием алгоритма оптимизации, например градиентный спуск, в сочетании с обратное распространение во времени для вычисления градиентов, необходимых во время процесса оптимизации, чтобы изменить каждый вес сети LSTM пропорционально производной ошибки (на выходном уровне сети LSTM) относительно соответствующего веса.

Проблема с использованием градиентный спуск для стандартных RNN заключается в том, что градиенты ошибок исчезнуть экспоненциально быстро с размером временного интервала между важными событиями. Это связано с если спектральный радиус из меньше 1.[40][41]

Однако с модулями LSTM, когда значения ошибок передаются обратно от выходного уровня, ошибка остается в ячейке модуля LSTM. Эта «карусель ошибок» непрерывно передает ошибку обратно каждому шлюзу модуля LSTM, пока они не научатся обрезать значение.

Функция оценки CTC

Многие приложения используют стеки LSTM RNN.[42] и обучить их коннекционистская временная классификация (CTC)[43] найти матрицу весов RNN, которая максимизирует вероятность последовательностей меток в обучающем наборе, учитывая соответствующие входные последовательности. СТС добивается согласованности и признания.

Альтернативы

Иногда может быть полезно обучить (части) LSTM с помощью нейроэволюция[44] или методами градиента политики, особенно когда нет «учителя» (то есть ярлыков обучения).

Успех

Было несколько успешных историй обучения без присмотра RNN с модулями LSTM.

В 2018 г. Билл Гейтс назвал это «огромной вехой в развитии искусственного интеллекта», когда боты, разработанные OpenAI смогли победить людей в игре Dota 2.[45] OpenAI Five состоит из пяти независимых, но скоординированных нейронных сетей. Каждая сеть обучается методом градиента политики без участия учителя и содержит однослойную долговременную память на 1024 единицы, которая видит текущее состояние игры и передает действия через несколько возможных заголовков действий.[45]

В 2018 г. OpenAI также обучил аналогичный LSTM с помощью градиентов политики для управления рукой робота, похожего на человека, который манипулирует физическими объектами с беспрецедентной ловкостью.[46]

В 2019 г. DeepMind Программа AlphaStar использовала глубокое ядро ​​LSTM, чтобы преуспеть в сложной видеоигре. Starcraft II.[47] Это рассматривалось как значительный прогресс на пути к общему искусственному интеллекту.[47]

Приложения

Приложения LSTM включают:

Смотрите также

Рекомендации

  1. ^ а б c Зепп Хохрайтер; Юрген Шмидхубер (1997). «Долговременная кратковременная память». Нейронные вычисления. 9 (8): 1735–1780. Дои:10.1162 / neco.1997.9.8.1735. PMID  9377276. S2CID  1915014.
  2. ^ Graves, A .; Liwicki, M .; Fernandez, S .; Bertolami, R .; Bunke, H .; Шмидхубер, Дж. (2009). «Новая система коннекционистов для улучшенного распознавания рукописного ввода» (PDF). IEEE Transactions по анализу шаблонов и машинному анализу. 31 (5): 855–868. CiteSeerX  10.1.1.139.4502. Дои:10.1109 / тпами.2008.137. PMID  19299860. S2CID  14635907.
  3. ^ Сак, хасим; Старший, Андрей; Бофэ, Франсуаза (2014). «Рекуррентные архитектуры нейронных сетей с кратковременной памятью для крупномасштабного акустического моделирования» (PDF). Архивировано из оригинал (PDF) на 2018-04-24.
  4. ^ Ли, Сянган; У, Сихун (2014-10-15). «Построение глубоких рекуррентных нейронных сетей на основе кратковременной памяти для распознавания речи с большим словарным запасом». arXiv:1410.4281 [cs.CL ].
  5. ^ Зепп Хохрайтер; Юрген Шмидхубер (21 августа 1995 г.), Долгосрочная краткосрочная память, Викиданные  Q98967430
  6. ^ Зепп Хохрайтер; Юрген Шмидхубер (1997), «LSTM может решить серьезные проблемы с длительным запаздыванием» (PDF), Достижения в системах обработки нейронной информации 9, Достижения в системах обработки нейронной информации, Викиданные  Q77698282
  7. ^ а б c d Клаус Грефф; Рупеш Кумар Шривастава; Ян Кутник; Бас Р. Стенебринк; Юрген Шмидхубер (2015). "LSTM: космическая одиссея поиска". Транзакции IEEE в нейронных сетях и обучающих системах. 28 (10): 2222–2232. arXiv:1503.04069. Bibcode:2015arXiv150304069G. Дои:10.1109 / TNNLS.2016.2582924. PMID  27411231. S2CID  3356463.
  8. ^ Герс, Ф.А. (1999). «Учимся забывать: постоянное предсказание с LSTM». 9-я Международная конференция по искусственным нейронным сетям: ICANN '99. 1999. С. 850–855. Дои:10.1049 / cp: 19991218. ISBN  0-85296-721-7.
  9. ^ а б Феликс А. Жерс; Юрген Шмидхубер; Фред Камминс (2000). «Учимся забывать: постоянное предсказание с LSTM». Нейронные вычисления. 12 (10): 2451–2471. CiteSeerX  10.1.1.55.5709. Дои:10.1162/089976600300015015. PMID  11032042. S2CID  11598600.
  10. ^ Graves, A .; Liwicki, M .; Fernández, S .; Bertolami, R .; Bunke, H .; Шмидхубер, Дж. (Май 2009 г.). «Новая система коннекционистов для неограниченного распознавания почерка». IEEE Transactions по анализу шаблонов и машинному анализу. 31 (5): 855–868. CiteSeerX  10.1.1.139.4502. Дои:10.1109 / тпами.2008.137. ISSN  0162-8828. PMID  19299860. S2CID  14635907.
  11. ^ Мергнер, Фолькер; Абед, Хайкал Эль (июль 2009 г.). «Конкурс распознавания арабского почерка ICDAR 2009». 2009 10-я Международная конференция по анализу и распознаванию документов: 1383–1387. Дои:10.1109 / ICDAR.2009.256. ISBN  978-1-4244-4500-4. S2CID  52851337.
  12. ^ Грейвс, Алекс; Мохамед, Абдель-Рахман; Хинтон, Джеффри (22 марта 2013 г.). «Распознавание речи с глубокими рекуррентными нейронными сетями». arXiv:1303.5778 [cs.NE ].
  13. ^ Чо, Кёнхён; ван Мерриенбоер, Барт; Гульчере, Чаглар; Богданов, Дмитрий; Бугарес, Фетхи; Швенк, Хольгер; Бенжио, Йошуа (2014). «Изучение представлений фраз с использованием кодировщика-декодера RNN для статистического машинного перевода». arXiv:1406.1078 [cs.CL ].
  14. ^ Бофайс, Франсуаза (11 августа 2015 г.). «Нейронные сети, лежащие в основе транскрипции Google Voice». Блог исследований. Получено 2017-06-27.
  15. ^ Сак, Хашим; Старший, Андрей; Рао, Канишка; Бофейс, Франсуаза; Шалквик, Йохан (24 сентября 2015 г.). «Голосовой поиск Google: быстрее и точнее». Блог исследований. Получено 2017-06-27.
  16. ^ «Неоновый рецепт ... вернее, Новая транскрипция для Google Voice». Официальный блог Google. Получено 2020-04-25.
  17. ^ Хайтан, Пранав (18 мая 2016 г.). "Умнее общайтесь с Allo". Блог исследований. Получено 2017-06-27.
  18. ^ Ву, Юнхуэй; Шустер, Майк; Чен, Чжифэн; Le, Quoc V .; Норузи, Мохаммад; Машери, Вольфганг; Крикун, Максим; Цао, юань; Гао Цинь (26.09.2016). «Система нейронного машинного перевода Google: устранение разрыва между человеческим и машинным переводом». arXiv:1609.08144 [cs.CL ].
  19. ^ Мец, Кейд (27 сентября 2016 г.). «Внедрение ИИ делает Переводчик Google более мощным, чем когда-либо | ПРОВОДНОЙ». Проводной. Получено 2017-06-27.
  20. ^ «Нейронная сеть для машинного перевода в промышленных масштабах». Блог Google AI. Получено 2020-04-25.
  21. ^ Эфрати, Амир (13 июня 2016 г.). «Машины Apple тоже могут учиться». Информация. Получено 2017-06-27.
  22. ^ Рейнджер, Стив (14 июня 2016 г.). «iPhone, AI и большие данные: вот как Apple планирует защитить вашу конфиденциальность | ZDNet». ZDNet. Получено 2017-06-27.
  23. ^ «Может ли глобальный семантический контекст улучшить модели нейронного языка? - Apple». Журнал Apple Machine Learning Journal. Получено 2020-04-30.
  24. ^ Смит, Крис (13.06.2016). «iOS 10: Siri теперь работает в сторонних приложениях, имеет дополнительные функции AI». BGR. Получено 2017-06-27.
  25. ^ Кейпс, Тим; Коулз, Пол; Конки, Алистер; Голипур, Ладан; Хаджитархани, Абие; Ху, Цюн; Хаддлстон, Нэнси; Хант, Мелвин; Ли, Цзянчуань; Нирахер, Матиас; Прахаллад, Кишор (2017-08-20). «Система преобразования текста в речь Siri на устройстве с помощью глубокого обучения и выбора устройства». Интерспич 2017. ISCA: 4011–4015. Дои:10.21437 / Interspeech.2017-1798.
  26. ^ Фогельс, Вернер (30 ноября 2016 г.). «Привнесение магии Amazon AI и Alexa в приложения на AWS. - Все распределено». www.allthingsdistributed.com. Получено 2017-06-27.
  27. ^ Онг, Туй (4 августа 2017 г.). «Переводы Facebook теперь полностью поддерживаются ИИ». www.allthingsdistributed.com. Получено 2019-02-15.
  28. ^ «Определение подтипов пациентов через сети LSTM, ориентированные на время» (PDF). msu.edu. Получено 21 ноя 2018.
  29. ^ «Определение подтипов пациентов через сети LSTM, ориентированные на время». Kdd.org. Получено 24 мая 2018.
  30. ^ «СИГКДД». Kdd.org. Получено 24 мая 2018.
  31. ^ Хариди, Рич (21 августа 2017 г.). «Система распознавания речи Microsoft теперь ничем не хуже человека». newatlas.com. Получено 2017-08-27.
  32. ^ Voelker, Aaron R .; Каич, Ивана; Элиасмит, Крис (2019). Единицы памяти Лежандра: представление в непрерывном времени в рекуррентных нейронных сетях (PDF). Достижения в системах обработки нейронной информации.
  33. ^ «Тест сжатия большого текста». Получено 2017-01-13.
  34. ^ Фабрис Беллар (2019) "Сжатие данных без потерь с помощью нейронных сетей "
  35. ^ братан, н. «Почему RNN с модулями LSTM также могут страдать от« взрывных градиентов »?». Перекрестная проверка. Получено 25 декабря 2018.
  36. ^ а б c Gers, F.A .; Шмидхубер, Дж. (2001). «Рекуррентные сети LSTM изучают простые контекстно-свободные и контекстно-зависимые языки» (PDF). IEEE-транзакции в нейронных сетях. 12 (6): 1333–1340. Дои:10.1109/72.963769. PMID  18249962.
  37. ^ а б c Gers, F .; Schraudolph, N .; Шмидхубер, Дж. (2002). «Изучение точного времени с помощью повторяющихся сетей LSTM» (PDF). Журнал исследований в области машинного обучения. 3: 115–143.
  38. ^ Gers, F.A .; Шмидхубер, Э. (ноябрь 2001 г.). «Рекуррентные сети LSTM изучают простые контекстно-зависимые и контекстно-зависимые языки» (PDF). IEEE-транзакции в нейронных сетях. 12 (6): 1333–1340. Дои:10.1109/72.963769. ISSN  1045-9227. PMID  18249962.
  39. ^ Синцзянь Ши; Чжуронг Чен; Хао Ван; Дит-Ян Юнг; Вай-кин Вонг; Ван-чун У (2015). «Сверточная сеть LSTM: подход машинного обучения для прогнозирования текущей погоды». Материалы 28-й Международной конференции по системам обработки нейронной информации: 802–810. arXiv:1506.04214. Bibcode:2015arXiv150604214S.
  40. ^ С. Хохрайтер. Untersuchungen zu Dynamischen Neuronalen Netzen. Дипломная работа, Institut f. Informatik, Technische Univ. Мюнхен, 1991 г.
  41. ^ Hochreiter, S .; Bengio, Y .; Frasconi, P .; Шмидхубер, Дж. (2001). «Градиентный поток в рекуррентных сетях: сложность изучения долгосрочных зависимостей (доступна загрузка PDF-файла)». In Kremer and, S.C .; Колен, Дж. Ф. (ред.). Полевое руководство по динамическим рекуррентным нейронным сетям. IEEE Press.
  42. ^ Фернандес, Сантьяго; Грейвс, Алекс; Шмидхубер, Юрген (2007). «Маркировка последовательностей в структурированных доменах с иерархическими рекуррентными нейронными сетями». Proc. 20-й Int. Совместная конф. Об искусственном интеллекте, Иджчай, 2007 г.: 774–779. CiteSeerX  10.1.1.79.1887.
  43. ^ Грейвс, Алекс; Фернандес, Сантьяго; Гомес, Фаустино (2006). «Временная классификация коннекционистов: маркировка несегментированных данных последовательности с помощью рекуррентных нейронных сетей». В материалах Международной конференции по машинному обучению, ICML 2006: 369–376. CiteSeerX  10.1.1.75.6306.
  44. ^ а б Виерстра, Даан; Schmidhuber, J .; Гомес, Ф. Дж. (2005). "Evolino: гибридная нейроэволюция / Оптимальный линейный поиск для последовательного обучения". Труды 19-й Международной совместной конференции по искусственному интеллекту (IJCAI), Эдинбург: 853–858.
  45. ^ а б Родригес, Хесус (2 июля 2018 г.). «Наука, лежащая в основе OpenAI Five, которая только что произвела один из величайших прорывов в истории искусственного интеллекта». К науке о данных. Получено 2019-01-15.
  46. ^ «Обучающая ловкость». Блог OpenAI. 30 июля 2018 г.. Получено 2019-01-15.
  47. ^ а б Стэнфорд, Стейси (25 января 2019 г.). «AI DeepMind и AlphaStar демонстрируют значительный прогресс на пути к AGI». Мемуары среднего уровня ML. Получено 2019-01-15.
  48. ^ Mayer, H .; Gomez, F .; Wierstra, D .; Nagy, I .; Knoll, A .; Шмидхубер, Дж. (Октябрь 2006 г.). Система для роботизированной кардиохирургии, которая учится связывать узлы с помощью рекуррентных нейронных сетей. 2006 Международная конференция IEEE / RSJ по интеллектуальным роботам и системам. С. 543–548. CiteSeerX  10.1.1.218.3399. Дои:10.1109 / IROS.2006.282190. ISBN  978-1-4244-0258-8. S2CID  12284900.
  49. ^ Graves, A .; Шмидхубер, Дж. (2005). «Покадровая классификация фонем с двунаправленным LSTM и другими архитектурами нейронных сетей». Нейронные сети. 18 (5–6): 602–610. CiteSeerX  10.1.1.331.5800. Дои:10.1016 / j.neunet.2005.06.042. PMID  16112549.
  50. ^ Фернандес, Сантьяго; Грейвс, Алекс; Шмидхубер, Юрген (2007). Применение рекуррентных нейронных сетей для распознавания ключевых слов. Материалы 17-й Международной конференции по искусственным нейронным сетям. ICANN'07. Берлин, Гейдельберг: Springer-Verlag. С. 220–229. ISBN  978-3540746935.
  51. ^ Грейвс, Алекс; Мохамед, Абдель-Рахман; Хинтон, Джеффри (2013). «Распознавание речи с глубокими рекуррентными нейронными сетями». Акустика, обработка речи и сигналов (ICASSP), Международная конференция IEEE 2013 г.: 6645–6649. arXiv:1303.5778. Дои:10.1109 / ICASSP.2013.6638947. ISBN  978-1-4799-0356-6. S2CID  206741496.
  52. ^ Эк, Дуглас; Шмидхубер, Юрген (28 августа 2002 г.). Изучение долгосрочной структуры блюза. Искусственные нейронные сети - ICANN 2002. Конспект лекций по информатике. 2415. Шпрингер, Берлин, Гейдельберг. С. 284–289. CiteSeerX  10.1.1.116.3620. Дои:10.1007/3-540-46084-5_47. ISBN  978-3540460848.
  53. ^ Schmidhuber, J .; Gers, F .; Eck, D .; Schmidhuber, J .; Герс, Ф. (2002). «Изучение нерегулярных языков: сравнение простых повторяющихся сетей и LSTM». Нейронные вычисления. 14 (9): 2039–2041. CiteSeerX  10.1.1.11.7369. Дои:10.1162/089976602320263980. PMID  12184841. S2CID  30459046.
  54. ^ Perez-Ortiz, J.A .; Gers, F.A .; Eck, D .; Шмидхубер, Дж. (2003). «Фильтры Калмана улучшают производительность сети LSTM в задачах, не решаемых традиционными повторяющимися сетями». Нейронные сети. 16 (2): 241–250. CiteSeerX  10.1.1.381.1992. Дои:10.1016 / s0893-6080 (02) 00219-8. PMID  12628609.
  55. ^ А. Грейвс, Дж. Шмидхубер. Распознавание рукописного ввода в автономном режиме с помощью многомерных рекуррентных нейронных сетей. Достижения в системах обработки нейронной информации 22, NIPS'22, стр 545–552, Ванкувер, MIT Press, 2009.
  56. ^ Грейвс, Алекс; Фернандес, Сантьяго; Ливицки, Маркус; Бунке, Хорст; Шмидхубер, Юрген (2007). Неограниченное распознавание рукописного ввода в Интернете с помощью рекуррентных нейронных сетей. Материалы 20-й Международной конференции по системам обработки нейронной информации.. НИПС'07. США: Curran Associates Inc., стр. 577–584. ISBN  9781605603520.
  57. ^ М. Баккуш, Ф. Мамалет, К. Вольф, К. Гарсия, А. Баскурт. Последовательное глубокое обучение для распознавания действий человека. 2-й Международный семинар по пониманию человеческого поведения (HBU), A.A. Салах, Б. Лепри изд. Амстердам, Нидерланды. С. 29–39. Конспект лекций по информатике 7065. Springer. 2011 г.
  58. ^ Хуанг, Цзе; Чжоу, Венган; Чжан, Цилинь; Ли, Хоуцян; Ли, Вэйпин (30.01.2018). «Распознавание жестового языка на основе видео без временной сегментации». arXiv:1801.10111 [cs.CV ].
  59. ^ Hochreiter, S .; Heusel, M .; Обермайер, К. (2007). «Быстрое определение гомологии белков на основе модели без выравнивания». Биоинформатика. 23 (14): 1728–1736. Дои:10.1093 / биоинформатика / btm247. PMID  17488755.
  60. ^ Thireou, T .; Рецко, М. (2007). "Двунаправленные сети долгосрочной краткосрочной памяти для прогнозирования субклеточной локализации эукариотических белков". IEEE / ACM Transactions по вычислительной биологии и биоинформатике. 4 (3): 441–446. Дои:10.1109 / tcbb.2007.1015. PMID  17666763. S2CID  11787259.
  61. ^ Малхотра, Панкадж; Виг, Ловекеш; Шрофф, Гаутам; Агарвал, Пунит (апрель 2015 г.). «Сети долгосрочной краткосрочной памяти для обнаружения аномалий во временных рядах» (PDF). Европейский симпозиум по искусственным нейронным сетям, вычислительному интеллекту и машинному обучению - ESANN 2015.
  62. ^ Налог, N .; Веренич, И .; La Rosa, M .; Дюма, М. (2017). Прогнозный мониторинг бизнес-процессов с помощью нейронных сетей LSTM. Труды Международной конференции по передовой инженерии информационных систем (CAiSE). Конспект лекций по информатике. 10253. С. 477–492. arXiv:1612.02130. Дои:10.1007/978-3-319-59536-8_30. ISBN  978-3-319-59535-1. S2CID  2192354.
  63. ^ Choi, E .; Bahadori, M.T .; Schuetz, E .; Стюарт, В .; Солнце, Дж. (2016). «Доктор AI: Прогнозирование клинических событий с помощью рекуррентных нейронных сетей». Материалы 1-й конференции по машинному обучению для здравоохранения. 56: 301–318. arXiv:1511.05942. Bibcode:2015arXiv151105942C. ЧВК  5341604. PMID  28286600.
  64. ^ Джиа, Робин; Лян, Перси (2016-06-11). «Рекомбинация данных для нейросемантического анализа». arXiv: 1606.03622 [cs].
  65. ^ Ван, Ле; Дуань, Сюйхуань; Чжан, Цилинь; Ню, Чжэньсин; Хуа, банда; Чжэн, Наньнин (22.05.2018). «Сегмент-трубка: пространственно-временная локализация действия в видео без обрезки с покадровой сегментацией» (PDF). Датчики. 18 (5): 1657. Дои:10,3390 / с18051657. ISSN  1424-8220. ЧВК  5982167. PMID  29789447.
  66. ^ Дуань, Сюйхуань; Ван, Ле; Чжай, Чанбо; Чжэн, Наньнин; Чжан, Цилинь; Ню, Чжэньсин; Хуа, Банда (2018). Совместная пространственно-временная локализация действий в видео без обрезки с покадровой сегментацией. 25-я Международная конференция IEEE по обработке изображений (ICIP). Дои:10.1109 / icip.2018.8451692. ISBN  978-1-4799-7061-2.
  67. ^ Орсини, Ф .; Гастальди, М .; Mantecchini, L .; Росси, Р. (2019). Нейронные сети, обученные с помощью трассировок Wi-Fi, для прогнозирования поведения пассажиров аэропорта. 6-я Международная конференция по моделям и технологиям интеллектуальных транспортных систем. Краков: IEEE. arXiv:1910.14026. Дои:10.1109 / MTITS.2019.8883365. 8883365.
  68. ^ Zhao, Z .; Chen, W .; Wu, X .; Chen, P.C.Y .; Лю, Дж. (2017). «Сеть LSTM: подход глубокого обучения для краткосрочного прогнозирования трафика». Интеллектуальные транспортные системы ИЭПП. 11 (2): 68–75. Дои:10.1049 / iet-its.2016.0208.
  69. ^ Гупта А., Мюллер А.Т., Хейсман Б.Дж., Фукс Дж.А., Шнайдер П., Шнайдер Г. (2018). «Генеративные рекуррентные сети для разработки лекарств De Novo». Мол Информ. 37 (1–2). Дои:10.1002 / минф.201700111. ЧВК  5836943. PMID  29095571.CS1 maint: несколько имен: список авторов (связь)

внешняя ссылка