語音類
介紹了百度 Deep Voice(已經做到了實時的語音合成,這相比以前的 WaveNet 推理的實現有 400 倍的加速),端到端語音合成模型 Char2wav,谷歌端到端的文本轉語音合成模型 Tacotron(Tacotron 在美式英語測試里的平均主觀意見評分達到了 3.82 分(總分是 5 分),在自然感(naturalness)方面優于已在生產中應用的參數系統(parametric system)。此外,由于 Tacotron 是在幀(frame)層面上生成語音,所以快。)
一種全新的啟迪音樂創作的合成方法。
NSynth 可幫助音樂人憑直覺掌控音色、(音樂中的)力度強弱以及探索借由手動調節合成器而非常難或不可能實現的新聲音的能力。所學習樂器的聲學質量依賴于實用的模型和可用的訓練數據,
視覺類
涵蓋了傳統檢測算法核心、深度神經網絡框架、檢測技術難點等方面。
專欄 | 對比激光SLAM與視覺SLAM:誰會成為未來主流趨勢?
人工智能從入門到進階,機器之心高分技術文章全集(2017-01-29)
一、學習資源;二、基礎介紹文章;三、技術起點;四、繼續進階;五、前沿研究
文章建議了一個文件架構,合理的基礎框架。
先思考必須要做的是什么?根據思路總結出合理框架:
README,main.py 文件(獨特的 endpoint),數據文件夾(一個文件夾,包含一個腳本來下載數據集),模型文件夾(該文件夾用來放模型文件),__init__ file(python 助手,更容易找到模型),basic_model.py 文件( TensorFlow 中的大部分模型能共享一個通用架構),hysearch 文件夾(存放任何做自定義超參數搜索的助手),測試文件夾,結果文件夾。
1. 五大流派
①符號主義:使用符號、規則和邏輯來表征知識和進行邏輯推理,最喜歡的算法是:規則和決策樹
②貝葉斯派:獲取發生的可能性來進行概率推理,最喜歡的算法是:樸素貝葉斯或馬爾可夫
③聯結主義:使用概率矩陣和加權神經元來動態地識別和歸納模式,最喜歡的算法是:神經網絡
④進化主義:生成變化,然后為特定目標獲取其中最優的,最喜歡的算法是:遺傳算法
⑤Analogizer:根據約束條件來優化函數(盡可能走到更高,但同時不要離開道路),最喜歡的算法是:支持向量機
常見算法:(簡述了各自特點,優點,以及場景)
1. 決策樹(Decision Tree),2. 支持向量機(Support Vector Machine),3. 回歸(Regression),4. 樸素貝葉斯分類(Naive Bayes Classification),5. 隱馬爾可夫模型(Hidden Markov model),6. 隨機森林(Random forest),7. 循環神經網絡(Recurrent neural network),8. 長短期記憶(Long short-term memory,LSTM)與門控循環單元神經網絡(gated recurrent unit nerual network),9. 卷積神經網絡(convolutional neural network)
數據
各領域公開數據集下載? (2017/02/08)
公開課
蒙特利爾大學開放MILA 2017夏季深度學習與強化學習課程視頻
吳恩達Deeplearning.ai課程學習全體驗:深度學習必備課程
其實這篇文章是對課程的總結和學習技巧的分享。作者也是沒讀博士的碼農,比較了幾個可能直接的學習技巧。十分值得借鑒。
CS231n: Convolutional Neural Networks for Visual Recognition 李飛飛
Kaggle
Kaggle 是一個流行的數據科學競賽平臺,已被谷歌收購。為了幫助初學者入門 Kaggle,EliteDataScience 發表了一篇入門介紹文章,解答了一些初學者最常遇到的問題。機器之心2017-07-22
搞公司
機器學習: 如何成為ML-ready的公司?(有很好的指示圖幫你分析)
我的業務是否適合機器學習模型?我可以從機器學習模型中獲得什么收益?這是一個降低成本的問題,還是增加收入的問題?我現在的數據積累足夠嗎,如果不夠的話該怎么辦?我需要什么樣的人才幫助我實現企業人工智能的升級?
題目???呵呵
end