2015-8-1 收集資料

各種機器學習的應用場景分別是什么?例如,k近鄰,貝葉斯,決策樹,svm,邏輯斯蒂回歸和最大熵模型。

如何評價Python的深度學習框架DeepPy?

Logit回歸模型中的那個函數形式F是怎么被發現的?

為什么基于貝葉斯優化的自動調參沒有大范圍使用?

概率圖模型(PGM)有必要系統地學習一下嗎?

如何用簡單易懂的例子解釋隱馬爾可夫模型?

【基于ConvnetJS的圖像前/背景分割】O網頁鏈接GitHub:O網頁鏈接

【幻燈+筆記:數據啟示 vs. 數據驅動】《Why data-informed beats data-driven》by Greg Reda, PyData Seattle 2015O網頁鏈接云:O網頁鏈接

【"Deep Learning for NLP: progress, challenges and opportunities"】經過報告人同意,7月30日晚@魯東東胖在清華的報告《Deep Learning for NLP@Noah: progress, challenges and opportunities》演示文稿可以在此下載:OTsinghuaTalkJ_July30.pdf感謝正東的精彩報告,感謝到場的同學們。:)

【高效的Python數據分析框架Ibis】O網頁鏈接GitHub:O網頁鏈接通過IPN了解Ibis:O網頁鏈接? Slide:《Ibis: Scaling the Python Data Experience》O網頁鏈接云:O網頁鏈接

【論文+代碼:面向網絡級規模的并行流標記EM-tree聚類算法】《Parallel Streaming Signature EM-tree: A Clustering Algorithm for Web Scale Applications》C Vries, L Vine, S Geva (WWW2015)O網頁鏈接LMW-tree:O網頁鏈接GitHub:O網頁鏈接

【幻燈:(nVIDIA深度學習課程)GPU深度學習介紹】《Introduction To Deep Learning With GPUs》O網頁鏈接云:O網頁鏈接

【免費書:機器學習資源精選匯編】《The Machine Learning Salon Starter Kit》by Jacqueline Isabelle ForienO網頁鏈接云:O網頁鏈接

【可重現數據驅動研究平臺REP】全稱是Reproducible Experiment Platform,統一封裝TMVA, Sklearn, XGBoost, Uboost等分類實現,進行大數據集共享一致性對比試驗,可在集群上完成并行訓練 GitHub:O網頁鏈接? REP(Reproducible Experiment Platform)文檔:O網頁鏈接

【狄利克雷分布/狄利克雷過程筆記】《Notes on the Dirichlet Distribution and Dirichlet Process》O網頁鏈接ipn:O網頁鏈接

《愛可可老師今日視野(15.07.29)》( 分享自@簡書O網頁鏈接

【數據降維技術完全指南】《A Complete Guide To Dimension Reduction Techniques》O網頁鏈接

【NYT:用算法判定人品】《Using Algorithms to Determine Character》O網頁鏈接@TECH2IPO提供的譯文《對抗偏見:用算法判定你的人品》O網頁鏈接

【視頻:深度學習在自動問答系統中的應用】《(@infoQ)深度學習在自動問答系統中的應用》by 李成華O網頁鏈接

【目標:又快又好的代碼】《Moving Fast With High Code Quality》by Nikhil Garg, QuoraO網頁鏈接

Reasoning about Linguistic Regularities in Word Embeddings using Matrix Manifolds】"O網頁鏈接Reasoning about Linguistic Regularities in Word Embeddings using Matrix Manifolds@劉知遠THU之前劉老師在鵝廠講座時有提到embedding和mainfold這類思路,相比而言,當然我的idea簡直弱爆了。。

【IPN:基于PyMC的Python概率編程】《Probabilistic Programming in Python using PyMC》O網頁鏈接? Slide: 《Probabilistic Programming in Python with PyMC3》O網頁鏈接云:O網頁鏈接

【(Trello)數據科學資源專題】O網頁鏈接

【論文:"NoBackTrack" RNN】《Training recurrent networks online without backtracking》Y Ollivier, G Charpiat (2015)O網頁鏈接

【論文+演示+代碼+數據:簡筆畫自動識別】《How Do Humans Sketch Objects?》M Eitz, J Hays, M Alexa (SIGGRAPH 2012) GitXiv:O網頁鏈接O網頁鏈接Project Page:O網頁鏈接Code:O網頁鏈接

"在線最優化求解(Online Optimization)"系列+FTRL詳解? 關于LR的稀疏性問題,發現幾個比較好的鏈接,非常清晰明了,O網頁鏈接O網頁鏈接O網頁鏈接O網頁鏈接O網頁鏈接O網頁鏈接

【Word2Vec實戰教程】《Word2Vec: an introduction》by Folgert KarsdorpO網頁鏈接ipn:O網頁鏈接

【"技術債"綜述】《A Field Study of Technical Debt》by Neil ErnstO網頁鏈接參閱:O愛可可-愛生活

【(Python)深度學習框架/庫/工具匯總介紹】《Frameworks and Libraries for Deep Learning》Theano/Pylearn2/Blocks/Keras/LasagneO網頁鏈接

【避免誤用交叉驗證】《Cross Validation done wrong》by Alfredo MottaO網頁鏈接

【論文:深度學習模型演進】《Evolution of Deep learning models》 Ajit Jaokar (2015)O網頁鏈接pdf:O網頁鏈接

【《Learning to Generate Chairs with Convolutional Neural Networks》Alexey Dosovitskiy, Jost Tobias Springenberg, Thomas Brox】 通過訓練卷積神經網絡(CNN),自動生成對象指定類型、角度和顏色的圖像 arXiv:O網頁鏈接PDF:O網頁鏈接? GitXiv:O網頁鏈接Code(Caffe):O網頁鏈接

【來自Facebook的圖像自動生成】《The Eyescream Project - NeuralNets dreaming natural images》by Soumith, Emily, Arthur & RobO網頁鏈接參閱O愛可可-愛生活? GitXiv:O網頁鏈接Code(Torch):O網頁鏈接//@愛可可-愛生活: 【(Lua)The Eyescream Project】GitHub:O網頁鏈接

【基于Pandas/Matplotlib的高收入數據分析】《Exploring the Top Incomes Database with Pandas and Matplotlib》by Ramiro GómezO網頁鏈接

【免費書:經濟學者的差分方程指南】《Difference Equations for Economists》by Klaus Neusser (2015)O網頁鏈接

【論文+代碼:面向圖像分類的多列深度網絡(MCDNN)】《Multi-column Deep Neural Networks for Image Classification》D Cire?an, U Meier, J Schmidhuber (CVPR2012)O網頁鏈接Code(Theano):O網頁鏈接

【數據可視化框架/庫/軟件大列表】"Awesome dataviz"O網頁鏈接

【基于Lasagne/nolearn的Kaggle's Diabetic Retinopathy Detection競賽第二名方案分享】《Team o_O Solution Summary》O網頁鏈接參閱:O愛可可-愛生活O愛可可-愛生活

【R語言文本處理】《Text Processing in R》O網頁鏈接

【時序分析之序列相關/自相關】《Serial Correlation In Time Series Analysis》O網頁鏈接

【基于遺傳算法察言觀色自選字體/圖像/布局的數字廣告】《The artificial intelligence advert that writes itself》O網頁鏈接

【(Python)三行代碼實現Hinton's Dropout】《Hinton's Dropout in 3 Lines of Python - How to install Dropout into a neural network by only changing 3 lines of python》by TraskO網頁鏈接

【IPN:基于Sony Lifelog API數據的位置聚類/預測】《Using machine learning to cluster and predict locations from Sony Lifelog API》O網頁鏈接

論文《Navigating the massive world of reddit: Using backbone networks to map user interests in social media》O網頁鏈接介紹了其實現思路,值得借鑒? 《Navigating the massive world of reddit: using backbone networks to map user interests in social media》的最新版本:O網頁鏈接? 【可視化】《redditviz - reddit interest network》O網頁鏈接Reddit的聚類網絡化瀏覽,

【GoogLeNet類可視化】《Visualizing GoogLeNet Classes》O網頁鏈接GitHub(DeepDraw):O網頁鏈接

【Kaggle's Taxi Trajectory Prediction競賽第一名訪談(深度學習的"非主流"應用)】《Taxi Trajectory Winners' Interview: 1st place, Team》O網頁鏈接

【"A Generative Word Embedding Model and its Low Rank Positive Semidefinite Solution"】終于刷出我們的paper:A Generative Word Embedding Model and its Low Rank Positive Semidefinite Solution的錄用通知,多虧一個reviewer在rebuttal之后把3改成了4…先把code放出來吧:O網頁鏈接,有train好的vector,歡迎大家試用

【Digital Research Tools (DiRT)的文本挖掘工具列表】O網頁鏈接

【視頻:深度學習并行訓練算法淺析】@InfoQ發布的《如何讓機器學習得更快——深度學習并行訓練算法淺析》by 鹿曉亮O網頁鏈接

《愛可可老師今日視野(15.07.30)》( 分享自@簡書O網頁鏈接

我們將在EMNLP 2015報告兩個成果:一個探索了如何在知識表示中考慮關系路徑信息,顯著提高了關系抽取等任務的性能,草稿已放在O網頁鏈接。另一個Online Learning of Interpretable Word Embeddings探索了可解釋詞表示的在線學習方法。稍后將呈上論文代碼和數據。歡迎交流。第一個成果由一年級直博生林衍凱完成,他今年初已在AAAI 2015報告過TansR算法,并發布了TransE/TransH/TransR源碼:O網頁鏈接。第二個成果由我組大三本科生羅鴻胤完成。青年才俊啊。

【視頻:Hinton在Cambridge介紹深度學習及其最新進展的報告】《(Cambridge)Deep Learning: Professor Geoffrey Hinton FRS, 25 June 2015》O網頁鏈接? 云:O網頁鏈接

【開源:(Python)方便的"One Pass"統計/回歸計算庫RunStats】"RunStats: Computing Statistics and Regression in One Pass"O網頁鏈接

【Chainer新增計算圖生成功能build_computational_graph()】《Visualization of Computational Graph》(附圖為inception in GoogLeNet示例)O網頁鏈接

【視頻:Hinton在Cambridge介紹深度學習及其最新進展的報告】《(Cambridge)Deep Learning: Professor Geoffrey Hinton FRS, 25 June 2015》O網頁鏈接? 講座給我的感覺:ReLU+dropout+反向傳播基本實現了神經系統中信號傳播和學習方法的精髓,后面重點在網絡體系結構,和更多的數據及計算能力。不知道Hinton是不是真有這么樂觀。

【論文:基于段向量的文檔表示】《Document Embedding with Paragraph Vectors》AM Dai, C Olah, QV Le, GS Corrado (2014)O網頁鏈接筆記《Notes on Document Embedding with Paragraph Vectors》O網頁鏈接參考向量表示總結:O愛可可-愛生活? arXiv:O網頁鏈接參閱:OCopper_PKU

Text, Topics, and Turkers: A Consensus Measure for Statistical TopicsO網頁鏈接

【幻燈:(PyData 2015)機器學習系統觀】《PyData 2015 Keynote: "A Systems View of Machine Learning"》by Joshua BloomO網頁鏈接云:O網頁鏈接

【對Stanford命名實體標注工具NER Tagger的測試(和比較)】《Named Entity Recognition: Examining the Stanford NER Tagger》O網頁鏈接

【數據爬取核心技術系列】《Science of Crawl series》Part1.Deduplication of Web ContentO網頁鏈接Part2.Content FreshnessO網頁鏈接

【Kaggle代碼(Python):分類問題重要變量的篩選和可視化】《Visualizing important variables》by saihttam in Caterpillar Tube PricingO網頁鏈接

【(多媒體處理/信息抽取/數據挖掘/機器學習/...)國家安全局(NSA)專利集】"NSA Patents - A Searchable, Interactive and Fully-Visualizable Database of Patents Filed by the National Security Agency"O網頁鏈接

【布朗層次聚類調優】《Tuning Brown Clustering》O網頁鏈接Paper:O網頁鏈接

【Python/dlib/OpenCV玩兒"變臉"】《Switching Eds: Face swapping with Python, dlib, and OpenCV》O網頁鏈接GitHub:O網頁鏈接

【用Python實現帶排序的搜索引擎】《Implementing a Search Engine with Ranking in Python》by Aakash JapiO網頁鏈接GitHub:O網頁鏈接

【Google翻譯為移動終端帶來深度學習能力】《How Google Translate squeezes deep learning onto a phone》O網頁鏈接

【如何檢驗網絡數據質量】《How to Test the Quality of Web Data》O網頁鏈接

【DeepFace vs. DeepDream】《Defeating Facebook’s DeepFace with Deep Dreams》O網頁鏈接GitHub:O網頁鏈接

【幻燈:數據科學家之測試觀】《Testing for data scientists》O網頁鏈接

【開源:(Python)馬爾可夫鏈蒙特卡羅(MCMC)繪圖包】"Python package to plot MCMC samples"O網頁鏈接

【決策樹缺點與應對(優化)策略】《Decision Trees – Tree Development and Scoring》O網頁鏈接

【R/H2O集成學習預測社交網絡影響力】《Predict Social Network Influence with R and H2O Ensemble Learning》O網頁鏈接

【"Dependency Graph-to-String Translation"EMNLP2015】:都柏林城市大學(DCU)博士生李良友Liangyou Li的論文Dependency Graph-to-String Translation被錄用。該論文提出了一種基于Synchronous Edge Replacement Grammar的機器翻譯模型,該方法將依存樹轉換成圖形式,表達能力優于依存樹到串模型,在中英和德英上的實驗都顯著超過目前最好模型。

【spaCy+Scikit-Learn的NLP實例介紹】《Intro to NLP with spaCy - An introduction to spaCy for natural language processing and machine learning with special help from Scikit-learn》O網頁鏈接

【論文:面向知識庫/文本推理的顯層特征vs.潛層特征】《Observed versus latent features for knowledge base and text inference》K Toutanova, D Chen (2015)O網頁鏈接pdf:O網頁鏈接

【面向數據重建(補齊)的樹模型】《Tree Models for Data Imputation》O網頁鏈接

【基于arrows/Pandas/TextBlob/Seaborn/Cartopy的美國大選候選人Tweets的時/空/語言分析】《Geospatially, Temporally, and Linguistically Analyzing Tweets about Top U.S. Presidential Candidates with Pandas, TextBlob, Seaborn, and Cartopy》O網頁鏈接GitHub:O網頁鏈接

【視頻:David Silver(DeeMind)的強化學習課程】《Reinforcement Learning course by DeeMind's David Silver》O網頁鏈接云:O網頁鏈接Slides&Info:O網頁鏈接? Clip.mn標注的版本:O網頁鏈接

【(R)rvest/dplyr/ggplot2/GGally數據采集+分析實例】《r got good at scraping》O網頁鏈接

《愛可可老師今日視野(15.07.31)》( 分享自@簡書O網頁鏈接

【Python調參優化庫Optunity】GitHub:O網頁鏈接Doc:O網頁鏈接? SVM with RBF kernel調參實例:O網頁鏈接

【開源:集成Stanford NER/DBpedia/OpenCalais/Zemanta/Freebase的自然語言解析/標注/實體抽取服務(API)Parserbot】"Web-based synthesis of nifty NLP and entity extraction services"O網頁鏈接

【(Python)matplotlib/seaborn繪制NBA投籃情況統計分析圖】《How to Create NBA Shot Charts in Python》O網頁鏈接

【預測模型銀彈——廣義可加模型(GAM)】《GAM: The Predictive Modeling Silver Bullet》by Kim LarsenO網頁鏈接

【(MetaMind) Dynamic Memory Network(DMN)介紹】《Ask it anything: new deep learning model understands and answers questions》O網頁鏈接

【課程資料:(UC San Diego)數據挖掘與預測分析】《CSE 255: Data Mining and Predictive Analytics》by Julian McAuley 講義/源碼:O網頁鏈接筆記:O網頁鏈接課程設計集錦:O網頁鏈接

【Stanford社交網絡與信息網絡分析課程資料+課設+數據】《CS224W: Social and Information Network Analysis - Autumn 2014》by Jure LeskovecO網頁鏈接講義+閱讀材料(很多經典論文):O網頁鏈接學期課程設計(2014):O網頁鏈接數據集+代碼:O網頁鏈接? 《Social and Information Network Analysis - Autumn 2013》的課設集錦:O網頁鏈接

【John Wittenauer的IPython notebooks系列】內容包括數據科學常用庫使用/Andrew Ng機器學習課程練習/edX上Spark課程練習等,很不錯O網頁鏈接

【最新一期TalkingMachines:面向體育/政治和實時預測的機器學習】《Machine Learning for Sports and Real Time Predictions》O網頁鏈接

【數據科學8種Bias及應對策略】《How Do I Avoid Bias In My Data Science Work?》O網頁鏈接

【李滔:搜狐基于Spark的新聞和廣告推薦實戰】@CSDN云計算O網頁鏈接

【數據分析、機器學習與物聯網】via@InfoQO網頁鏈接原文《 Analytics, Machine Learning, and the Internet of Things》O網頁鏈接

【CPPN-NEAT的JS實現(with karpathy's recurrent.js)】《Neurogram》by 大トロO網頁鏈接參閱《Compositional Pattern Producing Networks: A Novel Abstraction of Development》O網頁鏈接

【90行python搭一個音樂搜索工具 —— Song Finder】by@鄭淇木-COYGO網頁鏈接GitHub:O網頁鏈接參閱O愛可可-愛生活

【開源:跨語言(Python/Java/Go)布隆過濾器實現inbloom】"Cross language bloom filter implementation" GitHub:O網頁鏈接

【幻燈:數據流挖掘的問題與挑戰】《Mining from Data Streams: Issues and Challenges》by Jo?ao GamaO網頁鏈接云:O網頁鏈接

【面向數據科學的NumPy/SciPy/Pandas使用速查表】《NumPy/SciPy/Pandas Cheat Sheet》O網頁鏈接云:O網頁鏈接

【開源:跨語言(Python/Java/Go)布隆過濾器實現inbloom】"Cross language bloom filter implementation" GitHub:O網頁鏈接? 說道bloomfilter在實用起來我個人推薦O網頁鏈接又快又好用,順道推薦一下

【Python/Pandas/Bokeh數據分析/可視化實例】《Data Analysis with Python, Pandas, and Bokeh》by Chris MetcalfO網頁鏈接GitHub:O網頁鏈接

【論文:空間變化網絡(ST-CNN)】《Spatial Transformer Networks》M Jaderberg, K Simonyan, A Zisserman, K Kavukcuoglu [Google Deepmind] (2015)O網頁鏈接? 《Spatial Transformer Networks》Code:O網頁鏈接GitXiv:O網頁鏈接

【Spark快速入門】《The Essential Spark Cheat Sheet》O網頁鏈接云:O網頁鏈接

【八個工具看Python數據生態圈的最新趨勢】《Eight Tools That Show What’s on the Horizon for the Python Data Ecosystem》by Bo Moore Including:SFrame&SGraph/Bokeh/Dask/Ibis/Splash/Petuum/Flink/PyxleyO網頁鏈接

【開源:基于variational autoencoders (VAEs)的"漸變臉"】"Morphing Faces"O網頁鏈接Demo:O網頁鏈接GitHub:O網頁鏈接

【幻燈:圖的量子游走】《Quantum walks on graphs》by Andrew ChildsO網頁鏈接

"On Explainability of Deep Neural Networks"On Explainability of Deep Neural Networks,深度神經網絡的可解釋性O網頁鏈接

【Kaggle代碼:上班時間vs.收入水平】《Wake me up, before you go go...》O網頁鏈接

【IPN:反向傳播梯度下降及其(Python)實現】《Gradient Descent with Backpropagation》O網頁鏈接

【視頻:(RLDM 2015)David Silver的深度強化學習教程】《Tutorial on "Deep Reinforcement Learning"》 by David Silver at RLDM 2015O網頁鏈接

【視頻:(RLDM 2015)計算強化學習入門】《Basics of Computational Reinforcement Learning》 by Michael Littman at RLDM 2015O網頁鏈接

【開源:(Python)NLP快速流程(原型)庫broca】"a Python library for rapidly experimenting with new natural language processing (NLP) approaches"O網頁鏈接GitHub:O網頁鏈接

《愛可可老師今日視野(15.08.01)》( 分享自@簡書O網頁鏈接

【視頻+講義:MLSS Sydney 2015】《Machine Learning Summer School Sydney 2015》O網頁鏈接(云端版稍后奉上)? "MLSS Sydney 2015"視頻 云:O網頁鏈接

【文本分析七個實用領域】《The Seven Practice Areas of Text Analytics》O網頁鏈接摘錄自《Practical Text Mining and Statistical Analysis for Non-Structured Text Data Applications》by G. Miner, D. Delen, J. Elder, A. Fast, T. Hill, and R. Nisbet, Elsevier, 2012

【開源:基于Theano的CNN實現(dropouts/adagrad/momentum/max-margin layer/...)】O網頁鏈接

【多層感知器反向傳播訓練過程交互可視化(XOR Example)】O網頁鏈接

【CPPN-NEAT的JS實現(with karpathy's recurrent.js)】《Neurogram》by 大トロO網頁鏈接參閱《Compositional Pattern Producing Networks: A Novel Abstraction of Development》O網頁鏈接? More Sample Neurograms:O網頁鏈接

【專訪IBM蘇中:認知計算關鍵技術解讀】via:@CSDN云計算O網頁鏈接

【工業互聯網需要更多的方法:Essence使得這些方法更強大】工業互聯網將對所有工業和商業產生巨大影響,現有軟件將進行修改和重新設計,并需要重新開發大量新軟件。一個直接結果就是軟件行業需要更新更好的開發方法。本文將通過案例來說明未來需要多種而不是單一的開發方法。O網頁鏈接

【A Visual Introduction to Machine Learning】O網頁鏈接在機器學習中,計算機應用統計學習技術自動識別數據模式。這些技術可以用來作出非常準確的預測。本文將機器學習的要素用可視化方式進行展示。轉需!A Visual Introduction to Machine LearningO網頁鏈接

The Brain vs Deep Learning Part I: Computational Complexity — Or Why the Singularity Is Nowhere Near | Deep LearningO網頁鏈接

【論文:面向非凸優化的遞歸分解(IJCAI15杰出論文)】《Recursive Decomposition for Nonconvex Optimization》 A Friesen, P Domingos (IJCAI2015)O網頁鏈接IJCAI2015最佳論文給了 A Friesen和 P Domingos 的《Recursive Decomposition for Nonconvex Optimization》,論文觀察到the local modes of the objective function有combinatorial結構, 提出用combinatorial 優化方式來解決局部最優問題。Domingos就是牛啊,多個工作都非常有開創性?

【Kaggle's CrowdFlower搜索結果相關性競賽第一名訪談】《CrowdFlower Winner's Interview: 1st place, Chenglong Chen》O網頁鏈接? 轉一發吧。為了ensemble,前期花了很多時間在代碼重構方面,慢慢分離出來preprocessing,feature extraction,model building,model evaluation這個pipeline,這個是挺有幫助的。

零代碼玩兒數據!COS沙龍第29期,李棟博士兩個小時的分享! 查看紀要以及幻燈片,請移步:O網頁鏈接

Detecting diabetic retinopathy in eye images,神一般的20多層的深度神經網絡O網頁鏈接

CMU課程:Statistical Machine Learning 10-702/36-702O網頁鏈接

The Next Wave Of Enterprise Software Powered By Machine LearningO網頁鏈接

【一個著名但容易遺忘的訣竅: 對象池化】O網頁鏈接對象池是一種設計模式,和一組預先初始化的實體打交道,而不是根據需要處置或者重建這些實體。每當對象池的客戶使用完對象,把這個對象還給對象池以便循環使用。比如線程池、連接池都有廣泛應用。好文章,推薦

Open Access 和 Open Source 的親密接觸,我們可能熟悉arXiv,更熟悉GitHub,現在有一個這樣的模式:當在arXiv 發表一篇計算機類的論文后,幾天后在GitHub上就出現了開源實現,這樣就促生了 GitXiv: arXiv和GitHub鏈接體,arXiv + Github + Links + Discussion 模式, 不用看了,沒生物信息類

Gaussian process,in PythonO網頁鏈接

Research Blog: How Google Translate squeezes deep learning onto a phone# Google翻譯##深度學習#O網頁鏈接

Frameworks and Libraries for Deep Learning - Creative PunchO網頁鏈接

Cross Validation done wrong | Alfredo MottaO網頁鏈接

【Development Workflow using Docker and Docker Compose】O網頁鏈接介紹在Linux和Mac OSX平臺上利用Docker和Docker Compose搭建Hackathon開發環境的過程。轉需!

O網頁鏈接hpages一小步,#ChIPseeker#一大步,現在做一個超過800M的bed file注釋,竟然5分鐘不到就完成了,高手太給力。

【Karatsuba乘法算法詳解】O網頁鏈接Karatsuba乘法是一種快速乘法。此算法在1960年由Anatolii Alexeevitch Karatsuba 提出,并于1962年得以發表。此算法主要用于兩個大數相乘。普通乘法的復雜度是n2,而Karatsuba算法的復雜度僅為3nlog3≈3n1.585(log3是以2為底的)。轉需!

【John Horton Conway: 世界上最有魅力的數學家】O網頁鏈接約翰·何頓·康威(John Horton Conway,1937年12月26日-),生于英國利物浦,數學家,活躍于有限群的研究、趣味數學、紐結理論、數論、組合博弈論和編碼學等范疇。都來看看他傳奇的故事吧!

【A Gentle Introduction to Lockless Concurrency】O網頁鏈接本文描述了Java里的無鎖的問題,一個相當有用并容易忽視的主題。實現無鎖算法和數據結構需要一些基本原理的直覺,好吧,讓我們從簡單的開始吧!


科學網—泥沙龍筆記:從 sparse data 再論parsing乃是NLP應用的核武器@西瓜大丸子湯@算文解字@好東西傳送門@白碩SH@王偉DL@zhazhabaO網頁鏈接? 我在討論中對parsing并未有負面看法,只是對設置parsing單獨環節的準確率指標是否有意義提出質疑。

O網頁鏈接Reasoning about Linguistic Regularities in Word Embeddings using Matrix Manifolds@劉知遠THU之前劉老師在鵝廠講座時有提到embedding和mainfold這類思路,相比而言,當然我的idea簡直弱爆了。。 糾正一下 應該是詞的語義結構 類似于KB和ontology那類//@Copper_PKU: 恩 像這類Linguistic Regularities, log-bilinear model應該足夠了 但我感覺像embedding這類方法應該還要加Linguistic rules做正則,不然扁平model只是reveal了扁平的詞法結構//@劉知遠THU: 簡單的反而可能更好。

Word Embedding大家都會訓練,但是在很多句子級別的任務中,如何更有效地使用詞級別的嵌入?我會在9月里斯本的#EMNLP2015#上介紹一種很簡單有效的詞嵌入Data Augmentation方法來自動增加有監督學習的訓練數據。另外,我們還通過推特進行了計算行為學的研究,分析了最讓別人討厭的行為。論文稍后送上。

ECML-PKDD2015 Accepted Papers List,ECML PKDD會議接收論文列表O網頁鏈接

我們將在EMNLP 2015報告兩個成果:一個探索了如何在知識表示中考慮關系路徑信息,顯著提高了關系抽取等任務的性能,草稿已放在O網頁鏈接。另一個Online Learning of Interpretable Word Embeddings探索了可解釋詞表示的在線學習方法。稍后將呈上論文代碼和數據。歡迎交流。第一個成果由一年級直博生林衍凱完成,他今年初已在AAAI 2015報告過TansR算法,并發布了TransE/TransH/TransR源碼:O網頁鏈接。第二個成果由我組大三本科生羅鴻胤完成。青年才俊啊。

Document Embedding with Paragraph Vectors, Quoc 又把P2V拉出來遛彎了。O網頁鏈接

[1507.06947] Fast and Accurate Recurrent Neural Network Acoustic Models for Speech RecognitionO網頁鏈接谷歌在語音搜索方面的工作,有跳過音素直接把語音識別成單詞的初步結果。雖然錯詞率仍不低,但例子中那幾個相近詞猜得還是挺像回事的。

[1507.07636] Reasoning about Linguistic Regularities in Word Embeddings using Matrix ManifoldsO網頁鏈接用格拉斯曼流形上的測地線來研究詞向量之間的關系,好高大上的學科交叉啊!

【大腦 vs. 深度學習 Part I:計算復雜度】《The Brain vs Deep Learning Part I: Computational Complexity — Or Why the Singularity Is Nowhere Near》O網頁鏈接? 此文在 redditO網頁鏈接上引起了熱烈的討論。上月一篇長文O網頁鏈接的作者 jcannell 持相反觀點,但尚未和本文作者 timdettmers 直接辯論

【視頻:Hinton在Cambridge介紹深度學習及其最新進展的報告】《(Cambridge)Deep Learning: Professor Geoffrey Hinton FRS, 25 June 2015》O網頁鏈接? 講座給我的感覺:ReLU+dropout+反向傳播基本實現了神經系統中信號傳播和學習方法的精髓,后面重點在網絡體系結構,和更多的數據及計算能力。不知道Hinton是不是真有這么樂觀。

Toward a reproducible machine learning community:O網頁鏈接非常好, 大家把自己最新的research paper放到 arXiv上, 然后把code放到 github上, 所以就有了這個社區 gitxiv, 致力于可重復的實驗。上面有著名的 skip-thought, deepDream, neural machine translation, char-rnn的實現...

[1507.06149] Data-free parameter pruning for Deep Neural NetworksO網頁鏈接通過合并權重相近的神經元,大大降低網絡模型的規模。比如用在 MNIST 訓練出的 LeNet 上,約85%的參數可以去掉。

【在線最優化求解(Online Optimization)"系列+FTRL詳解】【LR的稀疏性問題】,發現幾個比較好的鏈接,非常清晰明了,O網頁鏈接O網頁鏈接O網頁鏈接O網頁鏈接O網頁鏈接O網頁鏈接? 基本上都是在 Mirror Descent 的框架下做

【Python之父Guido談Python】O網頁鏈接Guido在EuroPython 2015O網頁鏈接高度評價了Django Girls運動。被問到喜歡的文本編輯器:主要用emacs,偶爾也用vi。除了Python外最喜歡的編程語言:C。

【pgcli:可自動補齊輸入和語法高亮的MySQL的開源命令行接口】O網頁鏈接Mycli 支持 MySQL, MariaDB 和 Percona。源代碼GitHub托管地址:O網頁鏈接附圖是效果演示動畫。@Linux中國@伯樂頭條@linux命令行精選網

#rust#各種編程語言終究逃脫不了 bioinformatics 的魔掌,Rust 也下手了 , rust-bio 提供了很多生物信息數據結構和算法實現,比如Suffix arrays 、BWT變換 、 FM/FMD-Index、Smith Waterman 算法、各種匹配算法, IO 這塊包括了 FASTA/FASTQ/BED 的接口,Rust 雄起!O網頁鏈接? 當然社區比較好的, 比如 Python/R 解決問題第一位,性能第二位,興趣第三位。

On Explainability of Deep Neural Networks,深度神經網絡的可解釋性O網頁鏈接

最近用大數據的方法,我跟朋友合伙在上海開了家精致火鍋店。看食品工程+大數據+生命科學如何顛覆傳統餐飲業。大數據選題、選址、運營。店內定期有大數據沙龍和行業人士會晤。頗辣渝味火鍋,虹井路樂虹坊精致生活廣場2樓。閔行區美食大類綜合評價排名第二。歡迎光臨。

最強大的模型往往最簡單,每每看到把機器學習吹得巨高深巨復雜的人,我就塞一句其實Google廣告系統的主模型就是一個log regression, 你咬我啊。
Logistic Regression實現簡單、訓練快、較容易并行化、可以online learning、輕松加任何特征,實乃居家旅游必備的......

悉尼機器學習暑期學校MLSS 2015的PPT和視頻,O網頁鏈接

近期一篇新的技術Paper《Occlusion Coherence Detecting and Localizing Occluded Faces》,在FDDB測試結果表明可以提高當前人臉檢測的性能。該文提出一種級聯可變形部件模型(HPM)來進行人臉探測和關鍵點定位,該模型顯式的對部分遮擋進行了建模。Paper、Code、數據集下載參見:O網頁鏈接

Percentage of Natives across the US,Census Data Exploration,大Neveda亮瞎了#Kaggle#O網頁鏈接

《規模要素:數據平臺的組成和擴展》 演講很棒,PPT更贊,連我這個作客戶端的都一個字一個字的讀完了O網頁鏈接

【Docker Misconceptions】O網頁鏈接Docker大張旗鼓地襲擊了傳統的系統領域,盡管它取得令人激動不已的進步,但是目前圍繞它存在許多誤解。點擊前面鏈接了解詳情。

【在國際學術會議上如何社交?】羽田中山:1. 大牛們 各場大會報告(Plenary / Keynote)的大牛們一定要在coffee break期間捕捉住,用自己導師的title去打招呼,寒暄幾句即可,他們沒空鳥你。 2. 小牛們 這個…O網頁鏈接(分享自@知乎

【Cinatra:高性能現代C++ Web框架】Cinatra是由C++開源社區purecpp發起的一個開源項目,是一個現代C++寫的Web框架,旨在給用戶提供一個易用、靈活和高性能的Web框架,讓用戶能完全專注于核心邏輯而無需關注http細節。O網頁鏈接

大家有沒有好的基于室內rgbd的平面檢測(plane detection)工作介紹?
paper is here:O網頁鏈接? 很贊的paper,只用了單張rgb, model architecture挺有意思。目前我想做的是從單張的depth去做室內平面檢測,特別是地面

【如何讓機器學習得更快——深度學習并行訓練算法淺析】近幾年,語音識別、圖像識別等感知智能的核心效果得到了長足的進展,然而其背后的超大規模深度學習平臺還不為眾人所知,本演講為大家揭開基于深度神經網絡人工智能的深度學習平臺的神秘面紗。O網頁鏈接

福利:GATK 2013年 研討會幻燈片,O網頁鏈接Dropbox 地址:O網頁鏈接內容講的很多,可以系統的學習下GATK 百度盤了 跟大家共享O網頁鏈接

ACL2015的最佳論文獎得主好像不懂Pearson Correlation有什么問題... 也不知道Spearman是nonparametric的。我建議大家了解一下Pearson和Spearman的區別和異同:O網頁鏈接? 沒有啊,我在大會上當著1000人的面問了她Spearman correlation啊。回頭你們可以看視頻。純屬個人的看法,我沒有覺得這篇最佳論文特別的出色。對regression問題的評價大家都知道用MAE和Pearson吧。

【How to Create NBA Shot Charts in Python】O網頁鏈接本文介紹了如何抽取NBA球員的投籃數據然后用matplotlib和seaborn繪制統計圖。轉需!

【通過Mesos、Docker和Go,使用300行代碼創建一個分布式系統】雖然Docker和Mesos已成為不折不扣的Buzzwords,但是對于大部分人來說它們仍然是陌生的,下面我們就一起領略Mesos、Docker和Go配合帶來的強大破壞力,如何通過300行代碼打造一個比特幣開采系統。O網頁鏈接

Toward a reproducible machine learning community:O網頁鏈接非常好, 大家把自己最新的research paper放到 arXiv上, 然后把code放到 github上, 所以就有了這個社區 gitxiv, 致力于可重復的實驗。上面有著名的 skip-thought, deepDream, neural machine translation, char-rnn的實現...

【Game Analytics 開源自己的Erlang集群調度器】O網頁鏈接該庫實現了一個通用的調度程序,用于處理集群中的任務。任務的生成和處理是專門為特定的應用程序。客戶端通過一個回調來執行,并返回一個消息,指示任務的狀態。

《一起寫一個Web服務器(3)》在本系列第二部分,你已經創造了一個可以處理基本的 HTTP GET 請求的 WSGI 服務器。我還問了你一個問題,“怎么讓服務器在同一時間處理多個請求?”在本文中你將找到答案。O網頁鏈接(高世界 譯,歡迎加入翻譯組:O網頁鏈接

【Switching Eds: 應用Python,dlib和OpenCV切換面孔】O網頁鏈接本文描述了如何編寫一個200行代碼的Python腳本自動將第二個臉孔圖像的面部特性替換掉第一個面孔圖像的面部特性。源代碼GitHub地址:O網頁鏈接有意思!

EMNLP2015:都柏林城市大學(DCU)博士生李良友Liangyou Li的論文Dependency Graph-to-String Translation被錄用。該論文提出了一種基于Synchronous Edge Replacement Grammar的機器翻譯模型,該方法將依存樹轉換成圖形式,表達能力優于依存樹到串模型,在中英和德英上的實驗都顯著超過目前最好模型。

開源大戶Facebook又公布了一個開源項目——超高速數據傳輸工具WDT。可被視為一個嵌入式的庫或命令行工具,試圖利用多個TCP路徑提高兩個系統間傳送文件的效率。據透露,在Facebook內部傳輸系統之間的RocksDB快照時,WDT通過長距離和高延遲的傳輸鏈路提供了高達600MB/s的傳輸速率。O網頁鏈接

剛讀到一篇關于metagenome的 Data Note 文章, GigaScience 做了一個很好的嘗試,基因組/元基因組的項目使用工具比較多,可重復性真的是個問題, 那好,把所有的東西都扔到Docker里完成運行整個流程,把Dockerfile 提交到 Docker Hub Registry,把腳本扔到Github,隨便重復,O網頁鏈接? 這樣意味著科研服務這塊盡可能使用開源/免費的應用可以增強可重復性,該Docker流程里出現了一個這樣的問題: KEGG 數據庫商業版本不能放進去,總感覺有瑕疵!

【論文:基于段向量的文檔表示】《Document Embedding with Paragraph Vectors》AM Dai, C Olah, QV Le, GS Corrado (2014)O網頁鏈接筆記《Notes on Document Embedding with Paragraph Vectors》O網頁鏈接參考向量表示總結:O愛可可-愛生活 在6月版里arXiv實驗的最好結果是50維LDA,正確率85.8%。發上arXiv這版LDA就從100維開始做,正確率85%,然后結論是和段向量持平。話說這樣好嗎?//@愛可可-愛生活: arXiv:O網頁鏈接參閱:OCopper_PKU

【Visualizing GoogLeNet Classes 】O網頁鏈接想沒有想過深度神經網絡應該是樣子?醉經發表一個帖子,描述如何使用深度神經網絡來產生類的可視化和利用inceptionism方法來修改圖像。通過此方法也發表他們修改圖像,但是,他們沒有發表本帖顯示的類可視化的代碼。轉需!

AI還遠沒實現,但保護組織已經有了,請善待強化學習算法!petrl.orgO網頁鏈接

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,117評論 6 537
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,860評論 3 423
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,128評論 0 381
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,291評論 1 315
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,025評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,421評論 1 324
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,477評論 3 444
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,642評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,177評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,970評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,157評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,717評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,410評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,821評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,053評論 1 289
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,896評論 3 395
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,157評論 2 375

推薦閱讀更多精彩內容