美國大數據創業公司篇 - 簡書 http://www.lxweimin.com/p/581cbd7b9bad
如果中國的信息化發展到美國的階段,并且公司普遍采用【基于數據的量化決策機制】,將會迎來一個大數據發展的爆發式增長。
這里面創業公司太多了,包含提供商務數據分析,可視化報表,大數據平臺,數據存儲,挖掘應用等,我就簡單說一些我感興趣的,它們大多在硅谷,其他的可以參考。更新到2015年6月8日,92家。
Palantir:融資:9.5億美元。150億美金估值,已經是超級獨角獸單獨列出來。Peter Thiel創辦大數據公司。數據集成、 信息管理和定量的分析。連接到商業、 專有和公共數據集,并發現趨勢、 關系和異常,包括預測分析。
##############
Database
MemSQL: 號稱最快的內存數據庫。
GraphSQL:高效、大容量的圖形數據庫和分析平臺,創始人是國人。
MongoDB: 融資:3.11億美元。細分行業:面向文檔數據庫采集。它靈活的存儲方式非常受青睞。
DataStax:融資:1.9億美元。細分行業:基于Apache Cassandra的數據庫支持平臺。客戶包括eBay、Adobe、Netflix等
Couchbase: 文檔型數據庫,高性能,在LinkedIn運維也推薦使用
FoundationDB: 兼容事務處理的NoSQL
RethinkDB: open-source, scalable database that makes building realtime apps dramatically easier.
RocksDB: FB旗下的開源數據庫類似LevelDB.org設計
Presto:FB旗下分布式SQL查詢引擎
Hadoop
Hadoop 三劍客其中 Hortonworks 已經上市
Cloudrea:融資:10.4億美元。細分行業:大數據分析軟件、服務與培訓。今年,這家大數據巨頭企業即將進入中國市場。
MapR:融資:1.74億美元。細分行業:大數據分析軟件、服務與培訓。它的創始團隊來自Facebook、Google和Yahoo等公司
Altiscale: 提供的Hadoop作為一種服務(HAAS)
Qubole:Hadoop服務提供商,一些創業公司如Pinterest也是它的客戶
Splice Machine: 基于Hadoop的實時大數據技術公司,支持SQL 事務處理,并針對OLAP 和OLAP 應用進行實時優化處理
Continuuity: a Hadoop-based big data application hosting platform.
Platfora: Provide a big data analytics solution that transforms raw data in Hadoop into interactive, in-memory business intelligence.
Xplenty: Provide HaaS.
Nuevora: Provide Big Data analytics applications.
機器學習
Everstring:通過不斷地主動挖掘和分析全網在線企業信息,結合每家企業內部的客戶關系管理系統,利用機器學習自動建立量化客戶模型預測誰是下一個客戶。
Luminoso:自然語言處理和機器學習技術,幫助企業分析消費者在各種通訊渠道中討論的話題
Dato:GraphLab提供了一個完整的平臺,從別的應用程序或者服務中抓取數據,讓機器學習這個模型,并將學到的知識作為基礎,自動地進行準確的預測和決策制定。
Paxata:應用機器學習技術處理大數據難題
0xdata:H2O 的算法是面向業務流程——欺詐或趨勢預測
Numenta:developed a cohesive theory, core software technology, and numerous applications all based on principles of the neocortex
PredictionIO:開源的機器學習服務器
Alpine Data Labs: 大數據預測分析
Zementis: 預測分析決策管理平臺
Trifacta:人機交互數據分析平臺
Metamind: 提供相當完美的人工智能解決方案,這種解決方案主要由“深度學習(DL)”支持
RapidMiner:數據挖掘工具
FiscalNote: 數據挖掘軟件和人工智能手藝預測立法機構的投票成果,從而判斷某些議案可否通過。
BI工具和其他
Looker:一個基于Web的BI平臺,目前已以與Amazon Redshift、 Teradata Aster、HP Vertica、Greenplum、Impala、 BigQuery以及Spark等數據源進行集成;定制和復用數據可視化體驗。
Confluent:Kafka初創公司。
Databricks:主要開發Spark。
Elasticsearch:分布式搜索引擎,基于Lucene開發
Tachyon Nexus:主要開發Tachyon。
Snowplow Analytics:開放代碼的分析平臺,特別是基于AWS的分析。
Datameer:開源的數據處理系統,用于構建強大的超級計算機廉價服務器集群。
DataSift:社交數據分析公司
Datadog:數據監控
Sumo logic:日志管理過濾
Ginger.io:為研究人員、物理學家和醫療保健人員提供相應的行為分析能力
Birst:從事商業智能和數據分析,利用云計算來顛覆傳統的IT服務模式
Interana:自助分析數據平臺
gridgain: 基于內存的大數據實時處理系統
Lucidworks:Solr企業版
DataTorrent:可以將數據處理速度從實時提高至“現在時”
WibiData:專業大數據軟件包
Dataguise:大數據安全公司
Aerospike:開源NoSQL數據庫,支持近實時數據分析
Accumulo:可靠的、可伸縮的、高性能的排序分布式的Key-Value 存儲解決方案,基于單元訪問控制以及可定制的服務器端處理
Pentaho:以工作流為核心的、強調面向解決方案而非工具組件的BI
Metamarkets:可視化分析,幫助在線媒體公司分析高流量的流媒體數據
Pivotal:一個以數據為核心的企業級PaaS平臺
Pachyderm:Dockerized MapReduce
Premise:走眾包數據采集途徑向金融機構提供數據
Domo:融資:2.5億美元。細分行業:云商務智能。它的主要服務客戶是企業用戶,其數據庫可以幫助企業維持日常的運轉。
SumAll:social media analytics and business dashboard
Tintri:“智能混合閃存”,混合了閃存和計算機硬盤驅動器
Datarella:Big Data Strategy & Product Development
Snowflake:云數據倉庫
GoodData:融資:1.01億美元。細分行業:云商務智能。GoodData向SaaS供應商提供技術集成服務,在平臺內獲得分析數據。
Amplitude:BI分析軟件
Mu Sigma:融資:1.95億美元。細分行業:大數據科學服務。這是一家向企業客戶提供數據分析和決策支持服務的研究公司。
Mixpanel:有web和移動分析平臺,其提供的服務可以分析監測用戶活動
DataHero:打著“你的數據你做主”的口號,試圖彌合大數據同普通用戶之間的鴻溝,即幫你分析跟你密切相關的數據
Opera Solutions融資:1.22億美元。細分行業:大數據科學服務。其提供的大數據服務可以一次性采集數十億條數據。
Guavus融資:1.07億美元。細分行業:智能解決方案平臺。它的主要投資方是英特爾。
Kissmetrics:分析服務公司
treasuredata: 提供大數據存儲,查詢,分析云服務
Quantcast: 大數據廣告公司
Spagobi: BI 開源工具
Zoomdata: 大數據可視化展示
Birst:商業智能和數據分析,安全性隔離性
Clearstory:大數據分析服務商,幫助企業和客戶收集、處理、分析數據
Actian:深藏不露的數據庫公司。目前其年收入大約為1.5 億美元。對 ParAccel 的收購已經是過去5 個月中Actian 進行的第四筆收購
Eclipse BIRT: Eclipse旗下數據可視化
Netezza Analytics: IBM 旗下數據倉庫
DataGravity: software-based company engaged in the IT industry and is focused on providing data management services.
Zipfian Academy:Data Science Bootcamp
Civis Analytics:big data analytics firm that helps companies, non-profits, and campaigns leverage their data to develop smarter strategy.
Quid: Business Analytics Software
inPowered:discover the most engaging content written about them and turn them into native ads that are promoted across the web, mobile apps
Cask.co:helps developers and organizations deliver Hadoop solutions more quickly and effectively with the open source
Tamr:quickly, efficiently and cost-effectively connects and enriches all of your internal or external data sources
ScalingData/Rocana: building software for large scale machine data (logs, metrics, etc.) and event management, specifically in the domain.
Ayasdi: use mathematics theory to find potential patterns in data and visualize them as geometric shapes
bloomreach:采用數據學分析讓用戶手機變得與促銷密切相關
roambi:向任何iPad用戶發布和傳播動態宣傳冊、報告和介紹.
airtable:easy but powerful organizational tool that works exactly the way you want. It's as fast and flexible as a spreadsheet, but offers a refreshingly clean
databox:Mobile Business Intelligence Platform
下面是來自Bo Yang的總結
從對美國大數據市場的調研來看,我們可以得到一些啟示:
美國的數據分析市場非常大,容納超過百家公司,這得益于美國信息化的高度發達。
雖然有很多公司,但是大家很少有重復競爭,每一家都有自己的特色,在自己的領域內發展,這也符合美國公司注重差異化相關。
傳統的商務數據分析公司在維持舊有客戶和平臺的情況下,在積極向大數據技術擴展。
新興的大數據技術發展非常快,但是目前還沒有到成熟階段,除了Hadoop之外,沒有其他統一的技術被各家公司采用。
新的大數據技術趨勢是快速響應,開始追求數據的實時處理和快速查詢。
相對于美國市場,中國的大數據市場還處于非常初期的階段,這可能跟中國的信息化程度相關。做長期展望預測,如果中國的信息化發展到美國的階段,并且公司普遍采用基于數據的量化決策機制,將會迎來一個大數據發展的爆發式增長。
參考鏈接
10 Hot Big Data Startups to Watch in 2015 from A to Z
10 Hot Hadoop Startups to Watch
2015年值得關注的25家初創科技企業
融資最多的大數據創業企業
美國大數據創業公司總結
文/董老師(簡書作者)原文鏈接:http://www.lxweimin.com/p/581cbd7b9bad著作權歸作者所有,轉載請聯系作者獲得授權,并標注“簡書作者”。