2015-8-1 收集資料

各種機器學(xué)習(xí)的應(yīng)用場景分別是什么?例如,k近鄰,貝葉斯,決策樹,svm,邏輯斯蒂回歸和最大熵模型。

如何評價Python的深度學(xué)習(xí)框架DeepPy?

Logit回歸模型中的那個函數(shù)形式F是怎么被發(fā)現(xiàn)的?

為什么基于貝葉斯優(yōu)化的自動調(diào)參沒有大范圍使用?

概率圖模型(PGM)有必要系統(tǒng)地學(xué)習(xí)一下嗎?

如何用簡單易懂的例子解釋隱馬爾可夫模型?

【基于ConvnetJS的圖像前/背景分割】O網(wǎng)頁鏈接GitHub:O網(wǎng)頁鏈接

【幻燈+筆記:數(shù)據(jù)啟示 vs. 數(shù)據(jù)驅(qū)動】《Why data-informed beats data-driven》by Greg Reda, PyData Seattle 2015O網(wǎng)頁鏈接云:O網(wǎng)頁鏈接

【"Deep Learning for NLP: progress, challenges and opportunities"】經(jīng)過報告人同意,7月30日晚@魯東東胖在清華的報告《Deep Learning for NLP@Noah: progress, challenges and opportunities》演示文稿可以在此下載:OTsinghuaTalkJ_July30.pdf感謝正東的精彩報告,感謝到場的同學(xué)們。:)

【高效的Python數(shù)據(jù)分析框架Ibis】O網(wǎng)頁鏈接GitHub:O網(wǎng)頁鏈接通過IPN了解Ibis:O網(wǎng)頁鏈接? Slide:《Ibis: Scaling the Python Data Experience》O網(wǎng)頁鏈接云:O網(wǎng)頁鏈接

【論文+代碼:面向網(wǎng)絡(luò)級規(guī)模的并行流標(biāo)記EM-tree聚類算法】《Parallel Streaming Signature EM-tree: A Clustering Algorithm for Web Scale Applications》C Vries, L Vine, S Geva (WWW2015)O網(wǎng)頁鏈接LMW-tree:O網(wǎng)頁鏈接GitHub:O網(wǎng)頁鏈接

【幻燈:(nVIDIA深度學(xué)習(xí)課程)GPU深度學(xué)習(xí)介紹】《Introduction To Deep Learning With GPUs》O網(wǎng)頁鏈接云:O網(wǎng)頁鏈接

【免費書:機器學(xué)習(xí)資源精選匯編】《The Machine Learning Salon Starter Kit》by Jacqueline Isabelle ForienO網(wǎng)頁鏈接云:O網(wǎng)頁鏈接

【可重現(xiàn)數(shù)據(jù)驅(qū)動研究平臺REP】全稱是Reproducible Experiment Platform,統(tǒng)一封裝TMVA, Sklearn, XGBoost, Uboost等分類實現(xiàn),進行大數(shù)據(jù)集共享一致性對比試驗,可在集群上完成并行訓(xùn)練 GitHub:O網(wǎng)頁鏈接? REP(Reproducible Experiment Platform)文檔:O網(wǎng)頁鏈接

【狄利克雷分布/狄利克雷過程筆記】《Notes on the Dirichlet Distribution and Dirichlet Process》O網(wǎng)頁鏈接ipn:O網(wǎng)頁鏈接

《愛可可老師今日視野(15.07.29)》( 分享自@簡書O網(wǎng)頁鏈接

【數(shù)據(jù)降維技術(shù)完全指南】《A Complete Guide To Dimension Reduction Techniques》O網(wǎng)頁鏈接

【NYT:用算法判定人品】《Using Algorithms to Determine Character》O網(wǎng)頁鏈接@TECH2IPO提供的譯文《對抗偏見:用算法判定你的人品》O網(wǎng)頁鏈接

【視頻:深度學(xué)習(xí)在自動問答系統(tǒng)中的應(yīng)用】《(@infoQ)深度學(xué)習(xí)在自動問答系統(tǒng)中的應(yīng)用》by 李成華O網(wǎng)頁鏈接

【目標(biāo):又快又好的代碼】《Moving Fast With High Code Quality》by Nikhil Garg, QuoraO網(wǎng)頁鏈接

Reasoning about Linguistic Regularities in Word Embeddings using Matrix Manifolds】"O網(wǎng)頁鏈接Reasoning about Linguistic Regularities in Word Embeddings using Matrix Manifolds@劉知遠(yuǎn)THU之前劉老師在鵝廠講座時有提到embedding和mainfold這類思路,相比而言,當(dāng)然我的idea簡直弱爆了。。

【IPN:基于PyMC的Python概率編程】《Probabilistic Programming in Python using PyMC》O網(wǎng)頁鏈接? Slide: 《Probabilistic Programming in Python with PyMC3》O網(wǎng)頁鏈接云:O網(wǎng)頁鏈接

【(Trello)數(shù)據(jù)科學(xué)資源專題】O網(wǎng)頁鏈接

【論文:"NoBackTrack" RNN】《Training recurrent networks online without backtracking》Y Ollivier, G Charpiat (2015)O網(wǎng)頁鏈接

【論文+演示+代碼+數(shù)據(jù):簡筆畫自動識別】《How Do Humans Sketch Objects?》M Eitz, J Hays, M Alexa (SIGGRAPH 2012) GitXiv:O網(wǎng)頁鏈接O網(wǎng)頁鏈接Project Page:O網(wǎng)頁鏈接Code:O網(wǎng)頁鏈接

"在線最優(yōu)化求解(Online Optimization)"系列+FTRL詳解? 關(guān)于LR的稀疏性問題,發(fā)現(xiàn)幾個比較好的鏈接,非常清晰明了,O網(wǎng)頁鏈接O網(wǎng)頁鏈接O網(wǎng)頁鏈接O網(wǎng)頁鏈接O網(wǎng)頁鏈接O網(wǎng)頁鏈接

【W(wǎng)ord2Vec實戰(zhàn)教程】《Word2Vec: an introduction》by Folgert KarsdorpO網(wǎng)頁鏈接ipn:O網(wǎng)頁鏈接

【"技術(shù)債"綜述】《A Field Study of Technical Debt》by Neil ErnstO網(wǎng)頁鏈接參閱:O愛可可-愛生活

【(Python)深度學(xué)習(xí)框架/庫/工具匯總介紹】《Frameworks and Libraries for Deep Learning》Theano/Pylearn2/Blocks/Keras/LasagneO網(wǎng)頁鏈接

【避免誤用交叉驗證】《Cross Validation done wrong》by Alfredo MottaO網(wǎng)頁鏈接

【論文:深度學(xué)習(xí)模型演進】《Evolution of Deep learning models》 Ajit Jaokar (2015)O網(wǎng)頁鏈接pdf:O網(wǎng)頁鏈接

【《Learning to Generate Chairs with Convolutional Neural Networks》Alexey Dosovitskiy, Jost Tobias Springenberg, Thomas Brox】 通過訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(CNN),自動生成對象指定類型、角度和顏色的圖像 arXiv:O網(wǎng)頁鏈接PDF:O網(wǎng)頁鏈接? GitXiv:O網(wǎng)頁鏈接Code(Caffe):O網(wǎng)頁鏈接

【來自Facebook的圖像自動生成】《The Eyescream Project - NeuralNets dreaming natural images》by Soumith, Emily, Arthur & RobO網(wǎng)頁鏈接參閱O愛可可-愛生活? GitXiv:O網(wǎng)頁鏈接Code(Torch):O網(wǎng)頁鏈接//@愛可可-愛生活: 【(Lua)The Eyescream Project】GitHub:O網(wǎng)頁鏈接

【基于Pandas/Matplotlib的高收入數(shù)據(jù)分析】《Exploring the Top Incomes Database with Pandas and Matplotlib》by Ramiro GómezO網(wǎng)頁鏈接

【免費書:經(jīng)濟學(xué)者的差分方程指南】《Difference Equations for Economists》by Klaus Neusser (2015)O網(wǎng)頁鏈接

【論文+代碼:面向圖像分類的多列深度網(wǎng)絡(luò)(MCDNN)】《Multi-column Deep Neural Networks for Image Classification》D Cire?an, U Meier, J Schmidhuber (CVPR2012)O網(wǎng)頁鏈接Code(Theano):O網(wǎng)頁鏈接

【數(shù)據(jù)可視化框架/庫/軟件大列表】"Awesome dataviz"O網(wǎng)頁鏈接

【基于Lasagne/nolearn的Kaggle's Diabetic Retinopathy Detection競賽第二名方案分享】《Team o_O Solution Summary》O網(wǎng)頁鏈接參閱:O愛可可-愛生活O愛可可-愛生活

【R語言文本處理】《Text Processing in R》O網(wǎng)頁鏈接

【時序分析之序列相關(guān)/自相關(guān)】《Serial Correlation In Time Series Analysis》O網(wǎng)頁鏈接

【基于遺傳算法察言觀色自選字體/圖像/布局的數(shù)字廣告】《The artificial intelligence advert that writes itself》O網(wǎng)頁鏈接

【(Python)三行代碼實現(xiàn)Hinton's Dropout】《Hinton's Dropout in 3 Lines of Python - How to install Dropout into a neural network by only changing 3 lines of python》by TraskO網(wǎng)頁鏈接

【IPN:基于Sony Lifelog API數(shù)據(jù)的位置聚類/預(yù)測】《Using machine learning to cluster and predict locations from Sony Lifelog API》O網(wǎng)頁鏈接

論文《Navigating the massive world of reddit: Using backbone networks to map user interests in social media》O網(wǎng)頁鏈接介紹了其實現(xiàn)思路,值得借鑒? 《Navigating the massive world of reddit: using backbone networks to map user interests in social media》的最新版本:O網(wǎng)頁鏈接? 【可視化】《redditviz - reddit interest network》O網(wǎng)頁鏈接Reddit的聚類網(wǎng)絡(luò)化瀏覽,

【GoogLeNet類可視化】《Visualizing GoogLeNet Classes》O網(wǎng)頁鏈接GitHub(DeepDraw):O網(wǎng)頁鏈接

【Kaggle's Taxi Trajectory Prediction競賽第一名訪談(深度學(xué)習(xí)的"非主流"應(yīng)用)】《Taxi Trajectory Winners' Interview: 1st place, Team》O網(wǎng)頁鏈接

【"A Generative Word Embedding Model and its Low Rank Positive Semidefinite Solution"】終于刷出我們的paper:A Generative Word Embedding Model and its Low Rank Positive Semidefinite Solution的錄用通知,多虧一個reviewer在rebuttal之后把3改成了4…先把code放出來吧:O網(wǎng)頁鏈接,有train好的vector,歡迎大家試用

【Digital Research Tools (DiRT)的文本挖掘工具列表】O網(wǎng)頁鏈接

【視頻:深度學(xué)習(xí)并行訓(xùn)練算法淺析】@InfoQ發(fā)布的《如何讓機器學(xué)習(xí)得更快——深度學(xué)習(xí)并行訓(xùn)練算法淺析》by 鹿曉亮O網(wǎng)頁鏈接

《愛可可老師今日視野(15.07.30)》( 分享自@簡書O網(wǎng)頁鏈接

我們將在EMNLP 2015報告兩個成果:一個探索了如何在知識表示中考慮關(guān)系路徑信息,顯著提高了關(guān)系抽取等任務(wù)的性能,草稿已放在O網(wǎng)頁鏈接。另一個Online Learning of Interpretable Word Embeddings探索了可解釋詞表示的在線學(xué)習(xí)方法。稍后將呈上論文代碼和數(shù)據(jù)。歡迎交流。第一個成果由一年級直博生林衍凱完成,他今年初已在AAAI 2015報告過TansR算法,并發(fā)布了TransE/TransH/TransR源碼:O網(wǎng)頁鏈接。第二個成果由我組大三本科生羅鴻胤完成。青年才俊啊。

【視頻:Hinton在Cambridge介紹深度學(xué)習(xí)及其最新進展的報告】《(Cambridge)Deep Learning: Professor Geoffrey Hinton FRS, 25 June 2015》O網(wǎng)頁鏈接? 云:O網(wǎng)頁鏈接

【開源:(Python)方便的"One Pass"統(tǒng)計/回歸計算庫RunStats】"RunStats: Computing Statistics and Regression in One Pass"O網(wǎng)頁鏈接

【Chainer新增計算圖生成功能build_computational_graph()】《Visualization of Computational Graph》(附圖為inception in GoogLeNet示例)O網(wǎng)頁鏈接

【視頻:Hinton在Cambridge介紹深度學(xué)習(xí)及其最新進展的報告】《(Cambridge)Deep Learning: Professor Geoffrey Hinton FRS, 25 June 2015》O網(wǎng)頁鏈接? 講座給我的感覺:ReLU+dropout+反向傳播基本實現(xiàn)了神經(jīng)系統(tǒng)中信號傳播和學(xué)習(xí)方法的精髓,后面重點在網(wǎng)絡(luò)體系結(jié)構(gòu),和更多的數(shù)據(jù)及計算能力。不知道Hinton是不是真有這么樂觀。

【論文:基于段向量的文檔表示】《Document Embedding with Paragraph Vectors》AM Dai, C Olah, QV Le, GS Corrado (2014)O網(wǎng)頁鏈接筆記《Notes on Document Embedding with Paragraph Vectors》O網(wǎng)頁鏈接參考向量表示總結(jié):O愛可可-愛生活? arXiv:O網(wǎng)頁鏈接參閱:OCopper_PKU

Text, Topics, and Turkers: A Consensus Measure for Statistical TopicsO網(wǎng)頁鏈接

【幻燈:(PyData 2015)機器學(xué)習(xí)系統(tǒng)觀】《PyData 2015 Keynote: "A Systems View of Machine Learning"》by Joshua BloomO網(wǎng)頁鏈接云:O網(wǎng)頁鏈接

【對Stanford命名實體標(biāo)注工具NER Tagger的測試(和比較)】《Named Entity Recognition: Examining the Stanford NER Tagger》O網(wǎng)頁鏈接

【數(shù)據(jù)爬取核心技術(shù)系列】《Science of Crawl series》Part1.Deduplication of Web ContentO網(wǎng)頁鏈接Part2.Content FreshnessO網(wǎng)頁鏈接

【Kaggle代碼(Python):分類問題重要變量的篩選和可視化】《Visualizing important variables》by saihttam in Caterpillar Tube PricingO網(wǎng)頁鏈接

【(多媒體處理/信息抽取/數(shù)據(jù)挖掘/機器學(xué)習(xí)/...)國家安全局(NSA)專利集】"NSA Patents - A Searchable, Interactive and Fully-Visualizable Database of Patents Filed by the National Security Agency"O網(wǎng)頁鏈接

【布朗層次聚類調(diào)優(yōu)】《Tuning Brown Clustering》O網(wǎng)頁鏈接Paper:O網(wǎng)頁鏈接

【Python/dlib/OpenCV玩兒"變臉"】《Switching Eds: Face swapping with Python, dlib, and OpenCV》O網(wǎng)頁鏈接GitHub:O網(wǎng)頁鏈接

【用Python實現(xiàn)帶排序的搜索引擎】《Implementing a Search Engine with Ranking in Python》by Aakash JapiO網(wǎng)頁鏈接GitHub:O網(wǎng)頁鏈接

【Google翻譯為移動終端帶來深度學(xué)習(xí)能力】《How Google Translate squeezes deep learning onto a phone》O網(wǎng)頁鏈接

【如何檢驗網(wǎng)絡(luò)數(shù)據(jù)質(zhì)量】《How to Test the Quality of Web Data》O網(wǎng)頁鏈接

【DeepFace vs. DeepDream】《Defeating Facebook’s DeepFace with Deep Dreams》O網(wǎng)頁鏈接GitHub:O網(wǎng)頁鏈接

【幻燈:數(shù)據(jù)科學(xué)家之測試觀】《Testing for data scientists》O網(wǎng)頁鏈接

【開源:(Python)馬爾可夫鏈蒙特卡羅(MCMC)繪圖包】"Python package to plot MCMC samples"O網(wǎng)頁鏈接

【決策樹缺點與應(yīng)對(優(yōu)化)策略】《Decision Trees – Tree Development and Scoring》O網(wǎng)頁鏈接

【R/H2O集成學(xué)習(xí)預(yù)測社交網(wǎng)絡(luò)影響力】《Predict Social Network Influence with R and H2O Ensemble Learning》O網(wǎng)頁鏈接

【"Dependency Graph-to-String Translation"EMNLP2015】:都柏林城市大學(xué)(DCU)博士生李良友Liangyou Li的論文Dependency Graph-to-String Translation被錄用。該論文提出了一種基于Synchronous Edge Replacement Grammar的機器翻譯模型,該方法將依存樹轉(zhuǎn)換成圖形式,表達(dá)能力優(yōu)于依存樹到串模型,在中英和德英上的實驗都顯著超過目前最好模型。

【spaCy+Scikit-Learn的NLP實例介紹】《Intro to NLP with spaCy - An introduction to spaCy for natural language processing and machine learning with special help from Scikit-learn》O網(wǎng)頁鏈接

【論文:面向知識庫/文本推理的顯層特征vs.潛層特征】《Observed versus latent features for knowledge base and text inference》K Toutanova, D Chen (2015)O網(wǎng)頁鏈接pdf:O網(wǎng)頁鏈接

【面向數(shù)據(jù)重建(補齊)的樹模型】《Tree Models for Data Imputation》O網(wǎng)頁鏈接

【基于arrows/Pandas/TextBlob/Seaborn/Cartopy的美國大選候選人Tweets的時/空/語言分析】《Geospatially, Temporally, and Linguistically Analyzing Tweets about Top U.S. Presidential Candidates with Pandas, TextBlob, Seaborn, and Cartopy》O網(wǎng)頁鏈接GitHub:O網(wǎng)頁鏈接

【視頻:David Silver(DeeMind)的強化學(xué)習(xí)課程】《Reinforcement Learning course by DeeMind's David Silver》O網(wǎng)頁鏈接云:O網(wǎng)頁鏈接Slides&Info:O網(wǎng)頁鏈接? Clip.mn標(biāo)注的版本:O網(wǎng)頁鏈接

【(R)rvest/dplyr/ggplot2/GGally數(shù)據(jù)采集+分析實例】《r got good at scraping》O網(wǎng)頁鏈接

《愛可可老師今日視野(15.07.31)》( 分享自@簡書O網(wǎng)頁鏈接

【Python調(diào)參優(yōu)化庫Optunity】GitHub:O網(wǎng)頁鏈接Doc:O網(wǎng)頁鏈接? SVM with RBF kernel調(diào)參實例:O網(wǎng)頁鏈接

【開源:集成Stanford NER/DBpedia/OpenCalais/Zemanta/Freebase的自然語言解析/標(biāo)注/實體抽取服務(wù)(API)Parserbot】"Web-based synthesis of nifty NLP and entity extraction services"O網(wǎng)頁鏈接

【(Python)matplotlib/seaborn繪制NBA投籃情況統(tǒng)計分析圖】《How to Create NBA Shot Charts in Python》O網(wǎng)頁鏈接

【預(yù)測模型銀彈——廣義可加模型(GAM)】《GAM: The Predictive Modeling Silver Bullet》by Kim LarsenO網(wǎng)頁鏈接

【(MetaMind) Dynamic Memory Network(DMN)介紹】《Ask it anything: new deep learning model understands and answers questions》O網(wǎng)頁鏈接

【課程資料:(UC San Diego)數(shù)據(jù)挖掘與預(yù)測分析】《CSE 255: Data Mining and Predictive Analytics》by Julian McAuley 講義/源碼:O網(wǎng)頁鏈接筆記:O網(wǎng)頁鏈接課程設(shè)計集錦:O網(wǎng)頁鏈接

【Stanford社交網(wǎng)絡(luò)與信息網(wǎng)絡(luò)分析課程資料+課設(shè)+數(shù)據(jù)】《CS224W: Social and Information Network Analysis - Autumn 2014》by Jure LeskovecO網(wǎng)頁鏈接講義+閱讀材料(很多經(jīng)典論文):O網(wǎng)頁鏈接學(xué)期課程設(shè)計(2014):O網(wǎng)頁鏈接數(shù)據(jù)集+代碼:O網(wǎng)頁鏈接? 《Social and Information Network Analysis - Autumn 2013》的課設(shè)集錦:O網(wǎng)頁鏈接

【John Wittenauer的IPython notebooks系列】內(nèi)容包括數(shù)據(jù)科學(xué)常用庫使用/Andrew Ng機器學(xué)習(xí)課程練習(xí)/edX上Spark課程練習(xí)等,很不錯O網(wǎng)頁鏈接

【最新一期TalkingMachines:面向體育/政治和實時預(yù)測的機器學(xué)習(xí)】《Machine Learning for Sports and Real Time Predictions》O網(wǎng)頁鏈接

【數(shù)據(jù)科學(xué)8種Bias及應(yīng)對策略】《How Do I Avoid Bias In My Data Science Work?》O網(wǎng)頁鏈接

【李滔:搜狐基于Spark的新聞和廣告推薦實戰(zhàn)】@CSDN云計算O網(wǎng)頁鏈接

【數(shù)據(jù)分析、機器學(xué)習(xí)與物聯(lián)網(wǎng)】via@InfoQO網(wǎng)頁鏈接原文《 Analytics, Machine Learning, and the Internet of Things》O網(wǎng)頁鏈接

【CPPN-NEAT的JS實現(xiàn)(with karpathy's recurrent.js)】《Neurogram》by 大トロO網(wǎng)頁鏈接參閱《Compositional Pattern Producing Networks: A Novel Abstraction of Development》O網(wǎng)頁鏈接

【90行python搭一個音樂搜索工具 —— Song Finder】by@鄭淇木-COYGO網(wǎng)頁鏈接GitHub:O網(wǎng)頁鏈接參閱O愛可可-愛生活

【開源:跨語言(Python/Java/Go)布隆過濾器實現(xiàn)inbloom】"Cross language bloom filter implementation" GitHub:O網(wǎng)頁鏈接

【幻燈:數(shù)據(jù)流挖掘的問題與挑戰(zhàn)】《Mining from Data Streams: Issues and Challenges》by Jo?ao GamaO網(wǎng)頁鏈接云:O網(wǎng)頁鏈接

【面向數(shù)據(jù)科學(xué)的NumPy/SciPy/Pandas使用速查表】《NumPy/SciPy/Pandas Cheat Sheet》O網(wǎng)頁鏈接云:O網(wǎng)頁鏈接

【開源:跨語言(Python/Java/Go)布隆過濾器實現(xiàn)inbloom】"Cross language bloom filter implementation" GitHub:O網(wǎng)頁鏈接? 說道bloomfilter在實用起來我個人推薦O網(wǎng)頁鏈接又快又好用,順道推薦一下

【Python/Pandas/Bokeh數(shù)據(jù)分析/可視化實例】《Data Analysis with Python, Pandas, and Bokeh》by Chris MetcalfO網(wǎng)頁鏈接GitHub:O網(wǎng)頁鏈接

【論文:空間變化網(wǎng)絡(luò)(ST-CNN)】《Spatial Transformer Networks》M Jaderberg, K Simonyan, A Zisserman, K Kavukcuoglu [Google Deepmind] (2015)O網(wǎng)頁鏈接? 《Spatial Transformer Networks》Code:O網(wǎng)頁鏈接GitXiv:O網(wǎng)頁鏈接

【Spark快速入門】《The Essential Spark Cheat Sheet》O網(wǎng)頁鏈接云:O網(wǎng)頁鏈接

【八個工具看Python數(shù)據(jù)生態(tài)圈的最新趨勢】《Eight Tools That Show What’s on the Horizon for the Python Data Ecosystem》by Bo Moore Including:SFrame&SGraph/Bokeh/Dask/Ibis/Splash/Petuum/Flink/PyxleyO網(wǎng)頁鏈接

【開源:基于variational autoencoders (VAEs)的"漸變臉"】"Morphing Faces"O網(wǎng)頁鏈接Demo:O網(wǎng)頁鏈接GitHub:O網(wǎng)頁鏈接

【幻燈:圖的量子游走】《Quantum walks on graphs》by Andrew ChildsO網(wǎng)頁鏈接

"On Explainability of Deep Neural Networks"On Explainability of Deep Neural Networks,深度神經(jīng)網(wǎng)絡(luò)的可解釋性O網(wǎng)頁鏈接

【Kaggle代碼:上班時間vs.收入水平】《Wake me up, before you go go...》O網(wǎng)頁鏈接

【IPN:反向傳播梯度下降及其(Python)實現(xiàn)】《Gradient Descent with Backpropagation》O網(wǎng)頁鏈接

【視頻:(RLDM 2015)David Silver的深度強化學(xué)習(xí)教程】《Tutorial on "Deep Reinforcement Learning"》 by David Silver at RLDM 2015O網(wǎng)頁鏈接

【視頻:(RLDM 2015)計算強化學(xué)習(xí)入門】《Basics of Computational Reinforcement Learning》 by Michael Littman at RLDM 2015O網(wǎng)頁鏈接

【開源:(Python)NLP快速流程(原型)庫broca】"a Python library for rapidly experimenting with new natural language processing (NLP) approaches"O網(wǎng)頁鏈接GitHub:O網(wǎng)頁鏈接

《愛可可老師今日視野(15.08.01)》( 分享自@簡書O網(wǎng)頁鏈接

【視頻+講義:MLSS Sydney 2015】《Machine Learning Summer School Sydney 2015》O網(wǎng)頁鏈接(云端版稍后奉上)? "MLSS Sydney 2015"視頻 云:O網(wǎng)頁鏈接

【文本分析七個實用領(lǐng)域】《The Seven Practice Areas of Text Analytics》O網(wǎng)頁鏈接摘錄自《Practical Text Mining and Statistical Analysis for Non-Structured Text Data Applications》by G. Miner, D. Delen, J. Elder, A. Fast, T. Hill, and R. Nisbet, Elsevier, 2012

【開源:基于Theano的CNN實現(xiàn)(dropouts/adagrad/momentum/max-margin layer/...)】O網(wǎng)頁鏈接

【多層感知器反向傳播訓(xùn)練過程交互可視化(XOR Example)】O網(wǎng)頁鏈接

【CPPN-NEAT的JS實現(xiàn)(with karpathy's recurrent.js)】《Neurogram》by 大トロO網(wǎng)頁鏈接參閱《Compositional Pattern Producing Networks: A Novel Abstraction of Development》O網(wǎng)頁鏈接? More Sample Neurograms:O網(wǎng)頁鏈接

【專訪IBM蘇中:認(rèn)知計算關(guān)鍵技術(shù)解讀】via:@CSDN云計算O網(wǎng)頁鏈接

【工業(yè)互聯(lián)網(wǎng)需要更多的方法:Essence使得這些方法更強大】工業(yè)互聯(lián)網(wǎng)將對所有工業(yè)和商業(yè)產(chǎn)生巨大影響,現(xiàn)有軟件將進行修改和重新設(shè)計,并需要重新開發(fā)大量新軟件。一個直接結(jié)果就是軟件行業(yè)需要更新更好的開發(fā)方法。本文將通過案例來說明未來需要多種而不是單一的開發(fā)方法。O網(wǎng)頁鏈接

【A Visual Introduction to Machine Learning】O網(wǎng)頁鏈接在機器學(xué)習(xí)中,計算機應(yīng)用統(tǒng)計學(xué)習(xí)技術(shù)自動識別數(shù)據(jù)模式。這些技術(shù)可以用來作出非常準(zhǔn)確的預(yù)測。本文將機器學(xué)習(xí)的要素用可視化方式進行展示。轉(zhuǎn)需!A Visual Introduction to Machine LearningO網(wǎng)頁鏈接

The Brain vs Deep Learning Part I: Computational Complexity — Or Why the Singularity Is Nowhere Near | Deep LearningO網(wǎng)頁鏈接

【論文:面向非凸優(yōu)化的遞歸分解(IJCAI15杰出論文)】《Recursive Decomposition for Nonconvex Optimization》 A Friesen, P Domingos (IJCAI2015)O網(wǎng)頁鏈接IJCAI2015最佳論文給了 A Friesen和 P Domingos 的《Recursive Decomposition for Nonconvex Optimization》,論文觀察到the local modes of the objective function有combinatorial結(jié)構(gòu), 提出用combinatorial 優(yōu)化方式來解決局部最優(yōu)問題。Domingos就是牛啊,多個工作都非常有開創(chuàng)性?

【Kaggle's CrowdFlower搜索結(jié)果相關(guān)性競賽第一名訪談】《CrowdFlower Winner's Interview: 1st place, Chenglong Chen》O網(wǎng)頁鏈接? 轉(zhuǎn)一發(fā)吧。為了ensemble,前期花了很多時間在代碼重構(gòu)方面,慢慢分離出來preprocessing,feature extraction,model building,model evaluation這個pipeline,這個是挺有幫助的。

零代碼玩兒數(shù)據(jù)!COS沙龍第29期,李棟博士兩個小時的分享! 查看紀(jì)要以及幻燈片,請移步:O網(wǎng)頁鏈接

Detecting diabetic retinopathy in eye images,神一般的20多層的深度神經(jīng)網(wǎng)絡(luò)O網(wǎng)頁鏈接

CMU課程:Statistical Machine Learning 10-702/36-702O網(wǎng)頁鏈接

The Next Wave Of Enterprise Software Powered By Machine LearningO網(wǎng)頁鏈接

【一個著名但容易遺忘的訣竅: 對象池化】O網(wǎng)頁鏈接對象池是一種設(shè)計模式,和一組預(yù)先初始化的實體打交道,而不是根據(jù)需要處置或者重建這些實體。每當(dāng)對象池的客戶使用完對象,把這個對象還給對象池以便循環(huán)使用。比如線程池、連接池都有廣泛應(yīng)用。好文章,推薦

Open Access 和 Open Source 的親密接觸,我們可能熟悉arXiv,更熟悉GitHub,現(xiàn)在有一個這樣的模式:當(dāng)在arXiv 發(fā)表一篇計算機類的論文后,幾天后在GitHub上就出現(xiàn)了開源實現(xiàn),這樣就促生了 GitXiv: arXiv和GitHub鏈接體,arXiv + Github + Links + Discussion 模式, 不用看了,沒生物信息類

Gaussian process,in PythonO網(wǎng)頁鏈接

Research Blog: How Google Translate squeezes deep learning onto a phone# Google翻譯##深度學(xué)習(xí)#O網(wǎng)頁鏈接

Frameworks and Libraries for Deep Learning - Creative PunchO網(wǎng)頁鏈接

Cross Validation done wrong | Alfredo MottaO網(wǎng)頁鏈接

【Development Workflow using Docker and Docker Compose】O網(wǎng)頁鏈接介紹在Linux和Mac OSX平臺上利用Docker和Docker Compose搭建Hackathon開發(fā)環(huán)境的過程。轉(zhuǎn)需!

O網(wǎng)頁鏈接hpages一小步,#ChIPseeker#一大步,現(xiàn)在做一個超過800M的bed file注釋,竟然5分鐘不到就完成了,高手太給力。

【Karatsuba乘法算法詳解】O網(wǎng)頁鏈接Karatsuba乘法是一種快速乘法。此算法在1960年由Anatolii Alexeevitch Karatsuba 提出,并于1962年得以發(fā)表。此算法主要用于兩個大數(shù)相乘。普通乘法的復(fù)雜度是n2,而Karatsuba算法的復(fù)雜度僅為3nlog3≈3n1.585(log3是以2為底的)。轉(zhuǎn)需!

【John Horton Conway: 世界上最有魅力的數(shù)學(xué)家】O網(wǎng)頁鏈接約翰·何頓·康威(John Horton Conway,1937年12月26日-),生于英國利物浦,數(shù)學(xué)家,活躍于有限群的研究、趣味數(shù)學(xué)、紐結(jié)理論、數(shù)論、組合博弈論和編碼學(xué)等范疇。都來看看他傳奇的故事吧!

【A Gentle Introduction to Lockless Concurrency】O網(wǎng)頁鏈接本文描述了Java里的無鎖的問題,一個相當(dāng)有用并容易忽視的主題。實現(xiàn)無鎖算法和數(shù)據(jù)結(jié)構(gòu)需要一些基本原理的直覺,好吧,讓我們從簡單的開始吧!


科學(xué)網(wǎng)—泥沙龍筆記:從 sparse data 再論parsing乃是NLP應(yīng)用的核武器@西瓜大丸子湯@算文解字@好東西傳送門@白碩SH@王偉DL@zhazhabaO網(wǎng)頁鏈接? 我在討論中對parsing并未有負(fù)面看法,只是對設(shè)置parsing單獨環(huán)節(jié)的準(zhǔn)確率指標(biāo)是否有意義提出質(zhì)疑。

O網(wǎng)頁鏈接Reasoning about Linguistic Regularities in Word Embeddings using Matrix Manifolds@劉知遠(yuǎn)THU之前劉老師在鵝廠講座時有提到embedding和mainfold這類思路,相比而言,當(dāng)然我的idea簡直弱爆了。。 糾正一下 應(yīng)該是詞的語義結(jié)構(gòu) 類似于KB和ontology那類//@Copper_PKU: 恩 像這類Linguistic Regularities, log-bilinear model應(yīng)該足夠了 但我感覺像embedding這類方法應(yīng)該還要加Linguistic rules做正則,不然扁平model只是reveal了扁平的詞法結(jié)構(gòu)//@劉知遠(yuǎn)THU: 簡單的反而可能更好。

Word Embedding大家都會訓(xùn)練,但是在很多句子級別的任務(wù)中,如何更有效地使用詞級別的嵌入?我會在9月里斯本的#EMNLP2015#上介紹一種很簡單有效的詞嵌入Data Augmentation方法來自動增加有監(jiān)督學(xué)習(xí)的訓(xùn)練數(shù)據(jù)。另外,我們還通過推特進行了計算行為學(xué)的研究,分析了最讓別人討厭的行為。論文稍后送上。

ECML-PKDD2015 Accepted Papers List,ECML PKDD會議接收論文列表O網(wǎng)頁鏈接

我們將在EMNLP 2015報告兩個成果:一個探索了如何在知識表示中考慮關(guān)系路徑信息,顯著提高了關(guān)系抽取等任務(wù)的性能,草稿已放在O網(wǎng)頁鏈接。另一個Online Learning of Interpretable Word Embeddings探索了可解釋詞表示的在線學(xué)習(xí)方法。稍后將呈上論文代碼和數(shù)據(jù)。歡迎交流。第一個成果由一年級直博生林衍凱完成,他今年初已在AAAI 2015報告過TansR算法,并發(fā)布了TransE/TransH/TransR源碼:O網(wǎng)頁鏈接。第二個成果由我組大三本科生羅鴻胤完成。青年才俊啊。

Document Embedding with Paragraph Vectors, Quoc 又把P2V拉出來遛彎了。O網(wǎng)頁鏈接

[1507.06947] Fast and Accurate Recurrent Neural Network Acoustic Models for Speech RecognitionO網(wǎng)頁鏈接谷歌在語音搜索方面的工作,有跳過音素直接把語音識別成單詞的初步結(jié)果。雖然錯詞率仍不低,但例子中那幾個相近詞猜得還是挺像回事的。

[1507.07636] Reasoning about Linguistic Regularities in Word Embeddings using Matrix ManifoldsO網(wǎng)頁鏈接用格拉斯曼流形上的測地線來研究詞向量之間的關(guān)系,好高大上的學(xué)科交叉啊!

【大腦 vs. 深度學(xué)習(xí) Part I:計算復(fù)雜度】《The Brain vs Deep Learning Part I: Computational Complexity — Or Why the Singularity Is Nowhere Near》O網(wǎng)頁鏈接? 此文在 redditO網(wǎng)頁鏈接上引起了熱烈的討論。上月一篇長文O網(wǎng)頁鏈接的作者 jcannell 持相反觀點,但尚未和本文作者 timdettmers 直接辯論

【視頻:Hinton在Cambridge介紹深度學(xué)習(xí)及其最新進展的報告】《(Cambridge)Deep Learning: Professor Geoffrey Hinton FRS, 25 June 2015》O網(wǎng)頁鏈接? 講座給我的感覺:ReLU+dropout+反向傳播基本實現(xiàn)了神經(jīng)系統(tǒng)中信號傳播和學(xué)習(xí)方法的精髓,后面重點在網(wǎng)絡(luò)體系結(jié)構(gòu),和更多的數(shù)據(jù)及計算能力。不知道Hinton是不是真有這么樂觀。

Toward a reproducible machine learning community:O網(wǎng)頁鏈接非常好, 大家把自己最新的research paper放到 arXiv上, 然后把code放到 github上, 所以就有了這個社區(qū) gitxiv, 致力于可重復(fù)的實驗。上面有著名的 skip-thought, deepDream, neural machine translation, char-rnn的實現(xiàn)...

[1507.06149] Data-free parameter pruning for Deep Neural NetworksO網(wǎng)頁鏈接通過合并權(quán)重相近的神經(jīng)元,大大降低網(wǎng)絡(luò)模型的規(guī)模。比如用在 MNIST 訓(xùn)練出的 LeNet 上,約85%的參數(shù)可以去掉。

【在線最優(yōu)化求解(Online Optimization)"系列+FTRL詳解】【LR的稀疏性問題】,發(fā)現(xiàn)幾個比較好的鏈接,非常清晰明了,O網(wǎng)頁鏈接O網(wǎng)頁鏈接O網(wǎng)頁鏈接O網(wǎng)頁鏈接O網(wǎng)頁鏈接O網(wǎng)頁鏈接? 基本上都是在 Mirror Descent 的框架下做

【Python之父Guido談Python】O網(wǎng)頁鏈接Guido在EuroPython 2015O網(wǎng)頁鏈接高度評價了Django Girls運動。被問到喜歡的文本編輯器:主要用emacs,偶爾也用vi。除了Python外最喜歡的編程語言:C。

【pgcli:可自動補齊輸入和語法高亮的MySQL的開源命令行接口】O網(wǎng)頁鏈接Mycli 支持 MySQL, MariaDB 和 Percona。源代碼GitHub托管地址:O網(wǎng)頁鏈接附圖是效果演示動畫。@Linux中國@伯樂頭條@linux命令行精選網(wǎng)

#rust#各種編程語言終究逃脫不了 bioinformatics 的魔掌,Rust 也下手了 , rust-bio 提供了很多生物信息數(shù)據(jù)結(jié)構(gòu)和算法實現(xiàn),比如Suffix arrays 、BWT變換 、 FM/FMD-Index、Smith Waterman 算法、各種匹配算法, IO 這塊包括了 FASTA/FASTQ/BED 的接口,Rust 雄起!O網(wǎng)頁鏈接? 當(dāng)然社區(qū)比較好的, 比如 Python/R 解決問題第一位,性能第二位,興趣第三位。

On Explainability of Deep Neural Networks,深度神經(jīng)網(wǎng)絡(luò)的可解釋性O網(wǎng)頁鏈接

最近用大數(shù)據(jù)的方法,我跟朋友合伙在上海開了家精致火鍋店。看食品工程+大數(shù)據(jù)+生命科學(xué)如何顛覆傳統(tǒng)餐飲業(yè)。大數(shù)據(jù)選題、選址、運營。店內(nèi)定期有大數(shù)據(jù)沙龍和行業(yè)人士會晤。頗辣渝味火鍋,虹井路樂虹坊精致生活廣場2樓。閔行區(qū)美食大類綜合評價排名第二。歡迎光臨。

最強大的模型往往最簡單,每每看到把機器學(xué)習(xí)吹得巨高深巨復(fù)雜的人,我就塞一句其實Google廣告系統(tǒng)的主模型就是一個log regression, 你咬我啊。
Logistic Regression實現(xiàn)簡單、訓(xùn)練快、較容易并行化、可以online learning、輕松加任何特征,實乃居家旅游必備的......

悉尼機器學(xué)習(xí)暑期學(xué)校MLSS 2015的PPT和視頻,O網(wǎng)頁鏈接

近期一篇新的技術(shù)Paper《Occlusion Coherence Detecting and Localizing Occluded Faces》,在FDDB測試結(jié)果表明可以提高當(dāng)前人臉檢測的性能。該文提出一種級聯(lián)可變形部件模型(HPM)來進行人臉探測和關(guān)鍵點定位,該模型顯式的對部分遮擋進行了建模。Paper、Code、數(shù)據(jù)集下載參見:O網(wǎng)頁鏈接

Percentage of Natives across the US,Census Data Exploration,大Neveda亮瞎了#Kaggle#O網(wǎng)頁鏈接

《規(guī)模要素:數(shù)據(jù)平臺的組成和擴展》 演講很棒,PPT更贊,連我這個作客戶端的都一個字一個字的讀完了O網(wǎng)頁鏈接

【Docker Misconceptions】O網(wǎng)頁鏈接Docker大張旗鼓地襲擊了傳統(tǒng)的系統(tǒng)領(lǐng)域,盡管它取得令人激動不已的進步,但是目前圍繞它存在許多誤解。點擊前面鏈接了解詳情。

【在國際學(xué)術(shù)會議上如何社交?】羽田中山:1. 大牛們 各場大會報告(Plenary / Keynote)的大牛們一定要在coffee break期間捕捉住,用自己導(dǎo)師的title去打招呼,寒暄幾句即可,他們沒空鳥你。 2. 小牛們 這個…O網(wǎng)頁鏈接(分享自@知乎

【Cinatra:高性能現(xiàn)代C++ Web框架】Cinatra是由C++開源社區(qū)purecpp發(fā)起的一個開源項目,是一個現(xiàn)代C++寫的Web框架,旨在給用戶提供一個易用、靈活和高性能的Web框架,讓用戶能完全專注于核心邏輯而無需關(guān)注http細(xì)節(jié)。O網(wǎng)頁鏈接

大家有沒有好的基于室內(nèi)rgbd的平面檢測(plane detection)工作介紹?
paper is here:O網(wǎng)頁鏈接? 很贊的paper,只用了單張rgb, model architecture挺有意思。目前我想做的是從單張的depth去做室內(nèi)平面檢測,特別是地面

【如何讓機器學(xué)習(xí)得更快——深度學(xué)習(xí)并行訓(xùn)練算法淺析】近幾年,語音識別、圖像識別等感知智能的核心效果得到了長足的進展,然而其背后的超大規(guī)模深度學(xué)習(xí)平臺還不為眾人所知,本演講為大家揭開基于深度神經(jīng)網(wǎng)絡(luò)人工智能的深度學(xué)習(xí)平臺的神秘面紗。O網(wǎng)頁鏈接

福利:GATK 2013年 研討會幻燈片,O網(wǎng)頁鏈接Dropbox 地址:O網(wǎng)頁鏈接內(nèi)容講的很多,可以系統(tǒng)的學(xué)習(xí)下GATK 百度盤了 跟大家共享O網(wǎng)頁鏈接

ACL2015的最佳論文獎得主好像不懂Pearson Correlation有什么問題... 也不知道Spearman是nonparametric的。我建議大家了解一下Pearson和Spearman的區(qū)別和異同:O網(wǎng)頁鏈接? 沒有啊,我在大會上當(dāng)著1000人的面問了她Spearman correlation啊。回頭你們可以看視頻。純屬個人的看法,我沒有覺得這篇最佳論文特別的出色。對regression問題的評價大家都知道用MAE和Pearson吧。

【How to Create NBA Shot Charts in Python】O網(wǎng)頁鏈接本文介紹了如何抽取NBA球員的投籃數(shù)據(jù)然后用matplotlib和seaborn繪制統(tǒng)計圖。轉(zhuǎn)需!

【通過Mesos、Docker和Go,使用300行代碼創(chuàng)建一個分布式系統(tǒng)】雖然Docker和Mesos已成為不折不扣的Buzzwords,但是對于大部分人來說它們?nèi)匀皇悄吧模旅嫖覀兙鸵黄痤I(lǐng)略Mesos、Docker和Go配合帶來的強大破壞力,如何通過300行代碼打造一個比特幣開采系統(tǒng)。O網(wǎng)頁鏈接

Toward a reproducible machine learning community:O網(wǎng)頁鏈接非常好, 大家把自己最新的research paper放到 arXiv上, 然后把code放到 github上, 所以就有了這個社區(qū) gitxiv, 致力于可重復(fù)的實驗。上面有著名的 skip-thought, deepDream, neural machine translation, char-rnn的實現(xiàn)...

【Game Analytics 開源自己的Erlang集群調(diào)度器】O網(wǎng)頁鏈接該庫實現(xiàn)了一個通用的調(diào)度程序,用于處理集群中的任務(wù)。任務(wù)的生成和處理是專門為特定的應(yīng)用程序。客戶端通過一個回調(diào)來執(zhí)行,并返回一個消息,指示任務(wù)的狀態(tài)。

《一起寫一個Web服務(wù)器(3)》在本系列第二部分,你已經(jīng)創(chuàng)造了一個可以處理基本的 HTTP GET 請求的 WSGI 服務(wù)器。我還問了你一個問題,“怎么讓服務(wù)器在同一時間處理多個請求?”在本文中你將找到答案。O網(wǎng)頁鏈接(高世界 譯,歡迎加入翻譯組:O網(wǎng)頁鏈接

【Switching Eds: 應(yīng)用Python,dlib和OpenCV切換面孔】O網(wǎng)頁鏈接本文描述了如何編寫一個200行代碼的Python腳本自動將第二個臉孔圖像的面部特性替換掉第一個面孔圖像的面部特性。源代碼GitHub地址:O網(wǎng)頁鏈接有意思!

EMNLP2015:都柏林城市大學(xué)(DCU)博士生李良友Liangyou Li的論文Dependency Graph-to-String Translation被錄用。該論文提出了一種基于Synchronous Edge Replacement Grammar的機器翻譯模型,該方法將依存樹轉(zhuǎn)換成圖形式,表達(dá)能力優(yōu)于依存樹到串模型,在中英和德英上的實驗都顯著超過目前最好模型。

開源大戶Facebook又公布了一個開源項目——超高速數(shù)據(jù)傳輸工具WDT。可被視為一個嵌入式的庫或命令行工具,試圖利用多個TCP路徑提高兩個系統(tǒng)間傳送文件的效率。據(jù)透露,在Facebook內(nèi)部傳輸系統(tǒng)之間的RocksDB快照時,WDT通過長距離和高延遲的傳輸鏈路提供了高達(dá)600MB/s的傳輸速率。O網(wǎng)頁鏈接

剛讀到一篇關(guān)于metagenome的 Data Note 文章, GigaScience 做了一個很好的嘗試,基因組/元基因組的項目使用工具比較多,可重復(fù)性真的是個問題, 那好,把所有的東西都扔到Docker里完成運行整個流程,把Dockerfile 提交到 Docker Hub Registry,把腳本扔到Github,隨便重復(fù),O網(wǎng)頁鏈接? 這樣意味著科研服務(wù)這塊盡可能使用開源/免費的應(yīng)用可以增強可重復(fù)性,該Docker流程里出現(xiàn)了一個這樣的問題: KEGG 數(shù)據(jù)庫商業(yè)版本不能放進去,總感覺有瑕疵!

【論文:基于段向量的文檔表示】《Document Embedding with Paragraph Vectors》AM Dai, C Olah, QV Le, GS Corrado (2014)O網(wǎng)頁鏈接筆記《Notes on Document Embedding with Paragraph Vectors》O網(wǎng)頁鏈接參考向量表示總結(jié):O愛可可-愛生活 在6月版里arXiv實驗的最好結(jié)果是50維LDA,正確率85.8%。發(fā)上arXiv這版LDA就從100維開始做,正確率85%,然后結(jié)論是和段向量持平。話說這樣好嗎?//@愛可可-愛生活: arXiv:O網(wǎng)頁鏈接參閱:OCopper_PKU

【Visualizing GoogLeNet Classes 】O網(wǎng)頁鏈接想沒有想過深度神經(jīng)網(wǎng)絡(luò)應(yīng)該是樣子?醉經(jīng)發(fā)表一個帖子,描述如何使用深度神經(jīng)網(wǎng)絡(luò)來產(chǎn)生類的可視化和利用inceptionism方法來修改圖像。通過此方法也發(fā)表他們修改圖像,但是,他們沒有發(fā)表本帖顯示的類可視化的代碼。轉(zhuǎn)需!

AI還遠(yuǎn)沒實現(xiàn),但保護組織已經(jīng)有了,請善待強化學(xué)習(xí)算法!petrl.orgO網(wǎng)頁鏈接

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容