銳眼視點(diǎn):
- 2017 年實(shí)時(shí)流數(shù)據(jù)分析的 Top 27 個(gè)預(yù)測(cè);
- CrateDB 發(fā)布可對(duì)物聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行分析的 SQL 數(shù)據(jù)庫;
- 2017 年,5 個(gè)不應(yīng)該被忽視的機(jī)器學(xué)習(xí)項(xiàng)目。
[業(yè)界新聞] 2017 年實(shí)時(shí)流數(shù)據(jù)分析的 Top 27 個(gè)預(yù)測(cè)
根據(jù) Markets & Markets 的預(yù)測(cè),流數(shù)據(jù)分析市場(chǎng)將從 2016 年的 30.8 億美元增長(zhǎng)到 2021 年的 137 億美元。各個(gè)企業(yè)都將快速意識(shí)到他們需要利用實(shí)時(shí)數(shù)據(jù)集成和流數(shù)據(jù)分析來獲得更有價(jià)值的信息、使數(shù)據(jù)變得更安全以及保持增長(zhǎng)。在數(shù)據(jù)無時(shí)無刻不在產(chǎn)生的背景下,企業(yè)需要:
- 過濾無關(guān)數(shù)據(jù)
- 進(jìn)行聚合和分組
- 跨流關(guān)聯(lián)信息
- 將元數(shù)據(jù)、參考數(shù)據(jù)和歷史數(shù)據(jù)與上下文的流數(shù)據(jù)相結(jié)合
- 實(shí)時(shí)監(jiān)測(cè)異常數(shù)據(jù)
實(shí)時(shí)數(shù)據(jù)集成和劉數(shù)據(jù)分析平臺(tái)公司 Striim, Inc. 的聯(lián)合創(chuàng)始人兼 CTO Steve Wilkes 給出了他對(duì) 2017 年關(guān)于實(shí)時(shí)數(shù)據(jù)分析將如何影響云、IoT、集成服務(wù)、分析服務(wù)、大數(shù)據(jù)以及數(shù)據(jù)安全領(lǐng)域的預(yù)測(cè),對(duì)這些領(lǐng)域的 27 個(gè)預(yù)測(cè)都做了深入解釋和說明。
原文鏈接:Striim – Top 27 Predictions for 2017
[業(yè)界新聞] CrateDB 發(fā)布可對(duì)物聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行分析的 SQL 數(shù)據(jù)庫
Crate.io 發(fā)布了 CrateDB 1.0, 一個(gè)開源 SQL 數(shù)據(jù)庫,它將使對(duì)物聯(lián)網(wǎng)數(shù)據(jù)的實(shí)時(shí)分析成為可能。CrateDB 使得主流 SQL 開發(fā)者也可以處理之前只能由 NoSQL 解決方案處理的物聯(lián)網(wǎng)數(shù)據(jù)應(yīng)用。同時(shí),CrateDB 宣布在三藩市成立新的總部。
從 2014 年推出至今,CrateDB 已經(jīng)獲得了超過 100 萬次下載,下面的這些創(chuàng)新造就了它的獨(dú)特能力:
- 將分布式SQL查詢引擎用于更快的 JOIN,聚合和即席查詢
- 將數(shù)據(jù)搜索和查詢多功能性集成到 SQL
- 采用容器架構(gòu)以及為了簡(jiǎn)單縮放進(jìn)行自動(dòng)數(shù)據(jù)分片
原文鏈接:CrateDB SQL Database Puts IoT and Machine Data to Work
[業(yè)界新聞] 2017 年,5 個(gè)不應(yīng)該被忽視的機(jī)器學(xué)習(xí)項(xiàng)目
這篇文章將推薦 5 個(gè)大家可能沒有聽說過的機(jī)器學(xué)習(xí)項(xiàng)目,來自不同生態(tài)系統(tǒng)和編程語言。你可能會(huì)發(fā)現(xiàn)你并不需要其中的某一個(gè)工具,但是深入了解它們的實(shí)現(xiàn)細(xì)節(jié)和代碼有助于啟發(fā)我們的思路。
Hyperopt-sklearn
Hyperopt-sklearn 使用了多種搜索算法,可以搜索所有支持的分類器或者只是用參數(shù)給定的唯一分類器,它支持一系列數(shù)據(jù)預(yù)處理步驟,比如 PCA, TfidfVectorizer, Normalzier, 以及 OneHotEncoder 等。Dlib
Dlib 是使用 C++ 實(shí)現(xiàn)的可用于創(chuàng)建機(jī)器學(xué)習(xí)和數(shù)據(jù)分析應(yīng)用的通用工具庫,并且提供了 Python 接口。NN++
NN++ 是一個(gè) C++ 實(shí)現(xiàn)的輕量級(jí)、非常容易使用的神經(jīng)網(wǎng)絡(luò),無需安裝,直接#include
即可。LightGBM
來自微軟的梯度增強(qiáng)樹算法實(shí)現(xiàn),提供了 C++ 和 Python 接口。Sklearn-pandas
Sklearn-pandas 是一個(gè)正在開發(fā)中的模塊,在 Scikit-Learn 的機(jī)器學(xué)習(xí)方法和 Pandas 風(fēng)格的 Data Frame 之間提供一個(gè)橋梁。
原文鏈接:5 Machine Learning Projects You Can No Longer Overlook, January