還記得阿里巴巴版的NASA計劃嗎?今年3月初,阿里巴巴董事局主席馬云宣布啟動內(nèi)部代號為“NASA”的計劃,將面向未來20年組建強(qiáng)大的獨立研發(fā)部門,建立新的機(jī)制體制,為服務(wù)20億人的新經(jīng)濟(jì)體儲備核心科技。而在3月29日的阿里云云棲大會深圳峰會上,“NASA”計劃的首個重磅武器也浮出水面!
新武器就是——機(jī)器學(xué)習(xí)平臺PAI2.0。1.0版本是兩年前阿里云對外發(fā)布的國內(nèi)首個機(jī)器學(xué)習(xí)平臺,兩年時間里,PAI在阿里巴巴內(nèi)部已經(jīng)被廣泛使用。以淘寶搜索為例,搜索結(jié)果會基于商品和用戶的特征進(jìn)行排序。通過使用參數(shù)服務(wù)器,淘寶可以把百億個特征的模型,分散到數(shù)十個乃至于上百個參數(shù)服務(wù)器上,打破規(guī)模的瓶頸。
此次版本的重大升級,標(biāo)志著阿里云在構(gòu)建AI核心技術(shù)能力上又進(jìn)一步,而阿里的“NASA”計劃將為PAI平臺使用者提供強(qiáng)大的技術(shù)后盾。簡要來概括2.0的優(yōu)勢,便是:更豐富的算法庫、更大規(guī)模的數(shù)據(jù)訓(xùn)練和全面兼容開源的平臺化產(chǎn)品。據(jù)阿里云方面介紹,相比1.0版本,PAI 2.0有多項重大更新,除增加了100余種算法外,更重要的是對主流深度學(xué)習(xí)框架TensorFlow、Caffe和MXNet的全面兼容。
一些小編不是很能看得懂的內(nèi)容將在【浙江新聞+】中分享給能看得懂的各位讀者,但通俗解釋的話,2.0版本要比1.0版本更兼容、更普惠,對開發(fā)者來說,人工智能的開發(fā)將以更親近的方式展開。
也就是說,PAI可以大幅的降低人工智能的門檻以及開發(fā)成本。人工智能綜合了多門學(xué)科的技術(shù),對人才要求極其高,除了懂統(tǒng)計學(xué)中各種復(fù)雜的機(jī)器學(xué)習(xí)算法,還要懂實現(xiàn)邏輯以及分布式架構(gòu)理論。但PAI的操作界面沒有繁瑣的公式和復(fù)雜的代碼邏輯,用戶看到的是各種分門別類被封裝好的算法組件。每一個實驗步驟都提供可視化的監(jiān)控頁面。在深度學(xué)習(xí)黑箱透明化方面,PAI也同時集成了各種可視化工具。
阿里云首席科學(xué)家周靖人說,在過去的一年時間里,阿里云協(xié)助客戶落地了多項重大的人工智能應(yīng)用。但人工智能要想真正成為成為普惠科技,需要一款更加通用的生產(chǎn)工具。PAI2.0正是為此而生。
在阿里巴巴倡導(dǎo)的“五新”中,阿里云毫無疑問是新技術(shù)的擔(dān)綱。3月23日,馬云在馬來西亞談及“NASA”計劃時表示,科技是創(chuàng)造未來的關(guān)鍵,投入技術(shù)研發(fā)是希望讓科技更加普惠,能讓更多的人收益,“我們對一些很奇特但無法持久的技術(shù)不感興趣。我們希望投資在那些能讓人更有創(chuàng)造力的技術(shù)上。我們認(rèn)為技術(shù)是要為人所使用,而不是人為技術(shù)而工作。”
在今天的云棲大會·深圳峰會上,阿里云也宣布了一系列新成果和亮點,以下為盤點:
1.合并優(yōu)酷CDN業(yè)務(wù) 降價35%
3月29日阿里云宣布完成對優(yōu)酷CDN及視頻云業(yè)務(wù)和團(tuán)隊的整合。據(jù)悉,合并后的阿里云CDN整體帶寬能力超過40T,全球節(jié)點超過1000個,業(yè)務(wù)規(guī)模躍居中國第一,與全球巨頭Akamai旗鼓相當(dāng)。
同時,阿里云視頻云總經(jīng)理朱照遠(yuǎn)宣布CDN開始新一輪的大幅降價。此次阿里云CDN官網(wǎng)降價降幅最高可達(dá)35%,流量單價最低只需0.17元/GB。此外,帶寬計費規(guī)則從原來的超額累進(jìn)調(diào)整為階梯到達(dá),更加有利于消費者。2015年5月,阿里云曾宣布CDN降價21%,調(diào)整后的價格對比傳統(tǒng)CDN廠商價格接近“腰斬”,引發(fā)市場激烈反應(yīng)。目前,阿里云CDN服務(wù)了超過20萬家企業(yè)客戶,包括人民網(wǎng)、映客、CNTV、芒果TV、今日頭條、新浪微博、知乎、豆瓣、熊貓TV、PPTV等。
會上,阿里云還發(fā)布了整合優(yōu)酷資源后的全新視頻云解決方案,全面覆蓋金融、電商、醫(yī)療、教育等諸多領(lǐng)域,一站式提供海量存儲、高效分發(fā)、極速網(wǎng)絡(luò)、視頻AI等強(qiáng)大服務(wù),廣泛適用于短視頻、游戲直播、娛樂直播、泛生活直播、教育直播、遠(yuǎn)程醫(yī)療、企業(yè)遠(yuǎn)程視頻會議等場景。
2.實現(xiàn)首個云上量子加密通訊服務(wù)
量子加密通道將成為未來互聯(lián)網(wǎng)重要的基礎(chǔ)設(shè)施之一,阿里云今日公布了首個云上量子加密通訊案例。
據(jù)了解,網(wǎng)商銀行的一組信貸業(yè)務(wù)數(shù)據(jù)率先進(jìn)行了云上量子加密通訊的遠(yuǎn)距離傳輸“實戰(zhàn)”。該貸款需要運用到大量的數(shù)據(jù)計算來給客戶授信,服務(wù)的客戶都是散落在各地的小微經(jīng)營者,對數(shù)據(jù)是否安全抵達(dá)數(shù)據(jù)中心提出了極高要求。據(jù)技術(shù)人員介紹,該次傳輸在城域之間的專有云通道進(jìn)行。通過對信息采用量子密鑰加密,并使用量子技術(shù)對密鑰進(jìn)行分發(fā),保障了數(shù)據(jù)的不可破解和密鑰傳遞過程中的不可竊取或篡改。
自此,阿里云成為全世界第一家可以提供量子加密信息傳送服務(wù)的云計算公司,也是最安全的網(wǎng)絡(luò)服務(wù)提供者。
量子科學(xué)被視為新一代網(wǎng)絡(luò)信息技術(shù)的關(guān)鍵技術(shù),相比傳統(tǒng)的信息安全技術(shù),量子通信能做到數(shù)據(jù)傳輸?shù)慕^對安全,當(dāng)前尚無計算能力進(jìn)行破解,可解決信息傳輸?shù)陌踩珕栴}。也正因為此,量子通信的實用化和產(chǎn)業(yè)化已經(jīng)成為各大國爭相追逐的目標(biāo)。
由于成本昂貴,量子通信此前僅用于個別科學(xué)實驗。兩年前,阿里云和中國科學(xué)院在上海成立量子計算實驗室,探索超越經(jīng)典計算機(jī)的下一代超快計算技術(shù)。隨后,阿里云與中國科學(xué)院旗下的國盾量子聯(lián)合發(fā)布了量子加密通信產(chǎn)品--量子加密通道,使量子加密技術(shù)成為一種共享資源。據(jù)悉,阿里量子團(tuán)隊擁有二十余項量子通信應(yīng)用相關(guān)專利。未來,阿里還將探索量子信息技術(shù)與區(qū)塊鏈、人工智能等技術(shù)的結(jié)合應(yīng)用,目標(biāo)是讓前沿領(lǐng)域的科研成果通過云計算的方式,成為普惠科技,實現(xiàn)大規(guī)模產(chǎn)業(yè)應(yīng)用。
3.華北3地域超大規(guī)模數(shù)據(jù)中心正式對外開放運營,云服務(wù)器ECS全系列降價20%。
這是阿里云在全球開服的第14個地域。阿里云華北3所在的節(jié)點是目前國內(nèi)最大的下一代超大型云計算數(shù)據(jù)中心,采用定制處理器、存儲、服務(wù)器等高規(guī)格硬件和自主研發(fā)的飛天操作系統(tǒng),綜合發(fā)揮最大的計算效率,實時處理海量數(shù)據(jù)。同時,新節(jié)點采用風(fēng)能、太陽能等先進(jìn)節(jié)能技術(shù),可將能耗比(PUE)控制在1.25以內(nèi),最低可達(dá)1.13,優(yōu)于國家標(biāo)準(zhǔn)40%,相當(dāng)于每年可節(jié)省5.9萬噸的碳排放。
“華北3的開服將進(jìn)一步釋放阿里云的規(guī)模和技術(shù)紅利。”阿里云飛天研發(fā)負(fù)責(zé)人李津表示,用戶將享受降價20%的優(yōu)惠。作為全球云計算基礎(chǔ)設(shè)施最完善的服務(wù)商之一,阿里云目前在全球開放了14個服務(wù)區(qū)域節(jié)點,包括中國(華北3個、華東2個、華南、香港)、新加坡、美國(美東、美西)、歐洲、中東、澳大利亞、日本,均部署阿里云自研的飛天操作系統(tǒng),并提供中、英、日三種語言支持。
半年內(nèi),阿里云已進(jìn)行過多次產(chǎn)品降價——
2016年10月,宣布中國區(qū)云產(chǎn)品全線下調(diào),核心云產(chǎn)品最高降幅達(dá)50%,并推出“免費套餐”;
2016年雙11,阿里云降價促銷,當(dāng)天完成了1.9億元的銷售,相當(dāng)于24小時賣空一座數(shù)據(jù)中心,為數(shù)萬家企業(yè)節(jié)省超過11億元的IT成本;
2016年12月,阿里云再次宣布降價,中國區(qū)云數(shù)據(jù)庫產(chǎn)品平均降幅達(dá)20%。
【浙江新聞+】
在阿里云的客戶當(dāng)中,廣東省氣象局對PAI的使用最具代表性。他們使用PAI對臨近預(yù)報(0-3小時內(nèi))的降雨量進(jìn)行建模預(yù)測。通過拖拽操作就完成了數(shù)據(jù)清洗、特征工程,非線性機(jī)器學(xué)習(xí)算法訓(xùn)練以及結(jié)果評估的工作。PAI還被應(yīng)用在各種前沿科技領(lǐng)域。華大基因聯(lián)合阿里云科學(xué)家,正使用PAI對肺腺癌患者基因進(jìn)行分析,試圖尋找到導(dǎo)致肺腺癌病發(fā)的關(guān)鍵基因突變。
好了,以下是一些小編不是很能看得懂的內(nèi)容,分享給能看得懂的各位讀者:
此次PAI2.0的重大升級主要包括以下方面:
全面擁抱開源
PAI2.0編程接口完全兼容深度學(xué)習(xí)框架:Tensorflow、Caffe以及MXNet,用戶只需要將自己本地編寫的代碼文件上傳至云端就可以執(zhí)行。
Tensorflow、Caffe和MXNet是目前全球主流的深度學(xué)習(xí)開源框架。Tensorflow開源算法和模型最豐富;Caffe是經(jīng)典的圖形領(lǐng)域框架,使用簡單;MXNet分布式性能優(yōu)異。
對于底層計算資源,PAI2.0提供了強(qiáng)大的云端異構(gòu)計算資源,包含CPU、GPU、FPGA。在GPU方面,PAI2.0可以靈活實現(xiàn)多卡調(diào)度。
借助這些框架以及強(qiáng)大的計算資源,用戶能非常方便地就可以將計算任務(wù)下發(fā)到對應(yīng)的分布式計算機(jī)群上,實現(xiàn)深度學(xué)習(xí)模型訓(xùn)練與預(yù)測。
更豐富的算法庫
PAI2.0提供100余種算法組件,涵蓋了分類、回歸、聚類等常用場景,還針對主流的算法應(yīng)用場景,提供了偏向業(yè)務(wù)的算法,包含文本分析、關(guān)系分析、推薦3種類別。
“算法全部脫胎于阿里巴巴集團(tuán)內(nèi)部的業(yè)務(wù)實踐,所有算法都經(jīng)歷過PB級數(shù)據(jù)和復(fù)雜業(yè)務(wù)場景的錘煉,具備成熟穩(wěn)定的特點”,阿里云首席科學(xué)家周靖人說。
支持更大規(guī)模的數(shù)據(jù)訓(xùn)練
PAI 2.0 新增了參數(shù)服務(wù)器(Parameter Server)架構(gòu)的算法。不僅能進(jìn)行數(shù)據(jù)并行,同時還可將模型分片,把大的模型分為多個子集,每個參數(shù)服務(wù)器只存一個子集,全部的參數(shù)服務(wù)器聚合在一起拼湊成一個完整的模型。
其創(chuàng)新點還在于失敗重試的功能。在分布式系統(tǒng)上,成百上千個節(jié)點協(xié)同工作時,經(jīng)常會出現(xiàn)一個或幾個節(jié)點掛掉的情況,如果沒有失敗重試機(jī)制,任務(wù)就會有一定的幾率失敗,需要重新提交任務(wù)到集群調(diào)度。PS算法支持千億特征、萬億模型和萬億樣本直至PB級的數(shù)據(jù)訓(xùn)練,適合于電商、廣告等數(shù)據(jù)規(guī)模巨大的推薦場景。
PAI的基礎(chǔ)設(shè)施和計算框架建立在阿里云飛天計算平臺之上,通過云的模式大幅降低了計算成本,支持MR、SQL、MPI、PS、GRAPH等多種分布式計算框架,對于底層的CPU和GPU計算機(jī)群可以靈活調(diào)用。
此文章為 “懂懂科技” 原創(chuàng),特此聲明!