《Scikit-Learn與TensorFlow機器學習實用指南》第14章 循環神經網絡

第14章 循環神經網絡

來源:ApacheCN《Sklearn 與 TensorFlow 機器學習實用指南》翻譯項目

譯者:@akonwang @alexcheen @飛龍

校對:@飛龍

擊球手擊出壘球,你會開始預測球的軌跡并立即開始奔跑。你追蹤著它,不斷調整你的移動步伐,最終在觀眾的一片雷鳴聲中抓到它。無論是在聽完朋友的話語還是早餐時預測咖啡的味道,你時刻在做的事就是在預測未來。在本章中,我們將討論循環神經網絡 -- 一類預測未來的網絡(當然,是到目前為止)。它們可以分析時間序列數據,諸如股票價格,并告訴你什么時候買入和賣出。在自動駕駛系統中,他們可以預測行車軌跡,避免發生交通意外。更一般地說,它們可在任意長度的序列上工作,而不是截止目前我們討論的只能在固定長度的輸入上工作的網絡。舉個例子,它們可以把語句,文件,以及語音范本作為輸入,使得它們在諸如自動翻譯,語音到文本或者情感分析(例如,讀取電影評論并提取評論者關于該電影的感覺)的自然語言處理系統中極為有用。

更近一步,循環神經網絡的預測能力使得它們具備令人驚訝的創造力。你同樣可以要求它們去預測一段旋律的下幾個音符,然后隨機選取這些音符的其中之一并演奏它。然后要求網絡給出接下來最可能的音符,演奏它,如此周而復始。在你知道它之前,你的神經網絡將創作一首諸如由谷歌 Magenta 工程所創造的《The one》的歌曲。類似的,循環神經網絡可以生成語句,圖像標注以及更多。目前結果還不能準確得到莎士比亞或者莫扎特的作品,但誰知道幾年后他們能生成什么呢?

在本章中,我們將看到循環神經網絡背后的基本概念,他們所面臨的主要問題(換句話說,在第11章中討論的消失/爆炸的梯度),以及廣泛用于反抗這些問題的方法:LSTM 和 GRU cell(單元)。如同以往,沿著這個方式,我們將展示如何用 TensorFlow 實現循環神經網絡。最終我們將看看及其翻譯系統的架構。

閱讀全文

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容