Kappenball,Neil Lawrence昨天在ICML上提到的O網頁鏈接
#對比nCRP, nHDP#Markov Mixed Membership Models 【Empirical results demonstrate that Markov M3 performs well compared with tree structured topic models, and can learn meaningful dependency structure between topics】 【nCRP/nHDP 見OPoetNiu】
Google Files AI PatentsO網頁鏈接
【lateral.io的arXiv檢索/相關推薦引擎Lateral × arXiv】O網頁鏈接不錯,推薦 介紹文章《Leveraging Machine Learning to Discover Research》O網頁鏈接? 對其背后arXiv數據獲取技術的介紹《The arXiv as Dataset》O網頁鏈接
異常檢測? iForest ?ICML上遇到國際機器學習學會首任主席Dietterich教授,對我們的iForest算法大贊,說嘗試了很多方法,還是這個又快又好。前段時間澳洲某startup公司也說他們發現iForest在信息安全領域的異常檢測應用中表現最佳并準備做進產品。isolation Forest,推薦給有異常檢測任務的同學O網頁鏈接? @南大周志華 Isolation Forest detects data-anomalies using binary trees. Platform: R (www.r-project.org) Reference: Fei Tony Liu, Kai Ming Ting, and Zhi-Hua Zhou, “Isolation Forest”, IEEE International Conference on Data Mining 2008 (ICDM 08)
【干貨:分布式系統資料大全】各類分布式系統的Paper、課程、電子書、文章,覆蓋數據、存儲、搜索等實踐案例。趕快下載不謝!O網頁鏈接
【A survey on the application of recurrent neural networks to statistical language modeling】 羅列了不少trick和idea RNN在sequence Modeling上的paper越來越多 這兩年已經灌得不少了 O網頁鏈接
【deeplearning4j的CNN專題頁】《Convolutional Networks》O網頁鏈接
【DE5-Net 正式成為Altera認證之OpenCL網絡平臺】O網頁鏈接Altera網站提供了三種主要的OpenCL參考平臺之應用: 網絡(Network)、系統單芯片(SoC)及高效能運算(HPC, High-Performance Computing)平臺。我們很高興的宣布,繼HPC及SoC平臺之認證后,我們的DE5-Net同樣成功地獲得了網絡平臺的認證。
【通俗易懂的機器學習入門指導】我們要對數據進行處理,希望從數據中得到我們想要的信息。機器學習其實是對人類智能的模仿,也是實現人類和更高智能的必經之路。O通俗易懂的機器學習入門指導我們要對數據進行處理,希望從數據中得到我們想要的信息。機器學習其實是對人類智能的模仿,也是實現人類和更高智能的必經之路。O通俗易懂的機器學習入門指導
《如何系統地學習數據挖掘?》數據挖掘系統的學習過程是怎么樣的,應該看哪些書?(來自: 知乎 )cc@酷勤網-程序員的那點事
【幻燈+IPN:Python下用Blaze/Bokeh構建數據應用】《Building Python Data Applications: with Blaze and Bokeh》by Christine DoigO網頁鏈接ipn:O網頁鏈接
【ICML2015深度學習專題討論會總結】《Brief Summary of the Panel Discussion at DL Workshop@ICML2015》by KyungHyun ChoO網頁鏈接 pdf:O網頁鏈接
【(Python)五維(x, y, z, 時間, 顏色標注)動畫gif制作庫Animator5D】O網頁鏈接
《愛可可老師今日視野(15.07.13)》( 分享自@簡書)O網頁鏈接
【(R)K-Means聚類】《K-Means Clustering》by Janu VermaO網頁鏈接GitHub:O網頁鏈接
【17億條規模的Reddit評論數據集】《Reddit Comments Dataset ~ 1.7 billion comments》O網頁鏈接BigQuery:O網頁鏈接
【ICML2015深度學習專題討論會總結】《Brief Summary of the Panel Discussion at DL Workshop@ICML2015》by KyungHyun ChoO網頁鏈接
【課程資料:系統介紹表示學習的深度學習課程】《IFT6266 – H2015 Representation Learning - A mostly deep learning course》by Aaron Courville, University of MontrealO網頁鏈接Lectures:O網頁鏈接Resources:O網頁鏈接
【coursera-dl采集程序原理分析】《閱讀 coursera-dl 源碼》by@only4iceO網頁鏈接
【Y Bengio寫的深度學習展望文章】《The Promise of Deep Learning》By Yoshua BengioO網頁鏈接
【視頻:面向數據科學的統計思維】《Statistical Thinking for Data Science | SciPy 2015 | Chris Fonnesbeck》O網頁鏈接云:O網頁鏈接
《Learning to Mine Chinese Coordinate Terms Using the Web》并列結構指同一個概念的不同實例之間,或者一個概念的直接下位之間;如果兩個term是并列的,那互相替換仍是語法正確的,盡管不一定都為真 [Learning to Mine Chinese Coordinate Terms Using the Web,Huang,arXiv15] 用半監督的規則+統計從中文搜索結果為種子term抽取并列結構且聚類O網頁鏈接
Bootstrap是Bradley Efron(O網頁鏈接發明的一種Plug-in估計方法(見wikeO網頁鏈接, 或者WileyO網頁鏈接),核心是用經驗分布去估計總體分布。參數用bootstrap方法估計,其準確性也用bootstrap來估計。但是這個估計方法自己無法從理論上justify自己的優良性.Efron自己用這個方法討論了許多估計問題,其最近的一項研究是用bootstrap方法設計了一種post-model selection的估計(Efron (2014). Estimation and Accuracy After Model Selection, JASA ),本質上有點類似于model averaging估計,他還用bootstrap研究了這個估計的準確性的估計。有時候覺得,統計處于如此的尷尬境地,想證明的證不了,能夠證明的又沒啥用,于是,各路統計學者就主要靠著賣萌為生。這是另外一個話題了。回復@你是不是也會常常想起那個夏天:比如說用cross-validation來做模型選擇,其理論上的好處,除了一個相合性,啥實質性的性質都證明不了。但是,模型選擇的目的還是用來做進一步的推斷,僅僅有個模型選擇的相合性有啥用呢?最需要的結論是cv做模型選擇得到的估計與不做模型選擇的OLS的優良性比較。