姓名:楊誼 ? ? 學號:16130120200
【嵌牛導讀】:10月27日上午8:30,第十四屆中國計算機大會(CNCC 2017)正式邁入第二天的日程。本次大會主題是“人工智能改變世界(AI Changes the World)”,共邀請近十位院士、300余位國內外計算機領域知名專家、著名國際國內IT企業家到會演講。會議包括14個特邀報告、2場大會論壇、40余場前沿技術論壇及30余場特色活動,同期舉辦科技成果展,匯聚80余家企業參展。大會已成功舉辦13屆,此次參會規模也是迄今為止最大,人數最多的一次,共計有近700家企事業單位,超過6000名專業人士參會參展。
【嵌牛鼻子】:第十四屆中國計算機大會 ;? 人工智能;
【嵌牛提問】:人工智能的現狀如何? 目前有哪些核心的研究成果?發展方向?
【嵌牛正文】:
特邀報告環節
27日上午共進行了八場特邀報告。
特邀嘉賓:Dinesh Manocha教授
報告主題:Motion Planning Technologies for Human-Robot Interaction
Dinesh教授首先介紹了機器人在制造、裝配、倉庫自動化和服務行業得到的越來越廣泛的應用,隨后認為目前的機器人在處理新環境或與人類合作等方面的能力還很有限。
報告中,Dinesh介紹了在開發機器人運動和任務規劃能力方面的一些挑戰,包括實時規劃算法。隨后他介紹了他們提出的實時運動規劃的的新技術以及如何將他們與視覺算法結合起來進行人類行為預測以及自然語言處理。由此產生的方法結合了人工智能規劃、拓撲、優化、計算機視覺、機器學習、自然語言處理和并行計算等研究的思想。隨后他展示了他們研究的許多應用,包括自主采摘、避免障礙等。
特邀嘉賓:陳熙霖
報告主題:從物體識別到場景理解
首先陳熙霖教授介紹了視覺在動物生活中的重要作用,隨后簡短地介紹了計算機視覺的歷史。隨著深度學習的引入,計算機視覺得到了很大的發展。但仍然喜憂參半,喜的是計算機視覺逐漸走向工業應用,而憂的是高精度背后的穩定性還存在風險、結論的可解釋性與推廣性還有待提高、和人類似的感知的一致性還有待研究。陳熙霖教授認為計算機視覺仍然很低能,因為它們沒有被賦予給知識。隨后陳老師通過一系列的例子給我們分享了幾個計算機視覺研究的觀點:1、計算機視覺在識別之后應當是理解,應當超越視力,達到視覺與視覺智能;2、計算機視覺的研究要超越桌面視覺,將它與機器人、語言等結合起來;3、計算機視覺應當研究如何自動感受并建立元視覺概念集;4、計算機視覺的研究應當從任務驅動走向事件/數據驅動。
特邀嘉賓:王涌天
報告主題:“無屏”呈現——人機融合的新紀元
王涌天教授認為人類發展的歷史是人類與信息逐漸融合的歷史,人與信息世界的融合歷程大致經歷了三代演繹,分別為電影屏幕、電視屏幕和移動屏幕。隨著現在虛擬現實和增強現實的發展,我們將會有第四塊無屏之屏幕:VR/AR屏。這種無屏將會帶來人機融合的真正改變,實現人與信息的全天候深度融合。但是如果沒有對信息的過濾,那么人類將淹沒在大量的信息中,因此無屏必須與人工智能融合在一起發展。
當然現在無屏還有很多技術的痛點,王涌天教授認為真正的自然顯示與交互應該讓使用者忘卻科技產品的存在,以更為親和的方式實現信息融合,使得設備可以被用戶“無視”。所以這個無屏之屏要做到顯示透明化、交互自然話、穿戴無擾化等。王涌天教授隨后詳細介紹了他們實驗室在這三個方面的工作。其研究現在已經應用到了圓明園現場重建、醫學上的手術導航系統、宇航員心理舒緩系統、增強現實輔助維修系統以及一些面向大眾的一些應用等上面。
最后王涌天分享了他們實驗室的一句口號及圖片:移動增強現實使人類第二次站立起來。
特邀嘉賓:章文嵩
報告主題:滴滴共享出行與智慧交通
據章文嵩介紹,在交通領域存在著資源有限、供需不平衡等問題,通過共享出行的方式,滴滴重構了出行的供需平衡問題。經過5年的高速發展,滴滴在交通領域的積累了大量的數據和技術。報告中介紹,滴滴峰值訂單量超高2500多萬/小時,每日定位軌跡數據超過70TB,每日處理數據超過4500TB;在人工智能、云計算、信息安全等方面滴滴也有大量的研究,例如智能派單、高穩定性、數據保護等。
除了這些,滴滴也逐漸在考慮交通的環境,例如路況規劃等。滴滴的價值在于擁有大量且詳細的交通數據,技術較為完備,并且能夠提供一個平臺。例如他們提供的交通大數據平臺,能夠為交通管理部門、政策制定部門、城市建設部門、客運物流公司等提供服務。此外他們還能夠提供交通路況、智慧信號燈、OD數據分析、運力調度、供需預測等服務。
滴滴目前正大力促進一站式出行的方案,從而優化出行結構。最后章文嵩介紹了滴滴在智慧交通方面的一些解決方案,例如滴禹一體化方案、交通運行報告(城市擁堵排名、運行分析、熱門起終點分析)、實時城市擁堵排名、城市運行指數、異常擁堵、代駕熱力圖、智慧誘導屏(國內已經安裝70多塊)、智慧信號燈、潮汐車道、實時公交&換乘、一站式出行服務等。
特邀嘉賓:叢京生
報告主題:Computing Near the End of Moore's Law
叢京生教授認為我們現在已經接近摩爾定律的末尾,已經不能在簡單的依靠頻率或者內核的縮小來大規模地提高計算機的性能。他認為未來的計算系統會將會使用定制的芯片,例如谷歌專門為做人工智能開發的TPU芯片。在報告中,叢教授首先簡單回顧了他們在可定制芯片的研究,包括單片機、服務器節點、數據中心以及FPGAs(field-programmable gate-arrays)。隨后叢教授介紹了他們的研究在幾個領域的成功應用,例如機器學習和計算基因組學。最后他介紹了他們正在進行的定制計算啟用自動化的工作,并重點介紹了算法和實施方面的挑戰,以及他們對許多編譯和運行時優化問題的解決方案。
特邀嘉賓:李志飛
報告主題:語音交互技術將如何重塑下一代消費電子
李志飛在報告中主要講了智能音箱在整個行業中的趨勢以及語音交互的一些標準。
他首先舉例亞馬遜的echo,認為他們之所以成功,是因為語音是他們與用戶溝通的唯一方式。現在智能音箱也是如此。
在智能音箱的行業趨勢方面,他介紹了幾個主要的趨勢。首先,智能音箱在美國正處于高速發展的前夜,而中國還要稍晚一步。消費電子大趨勢就是智能化,包括耳機、電視、汽車等。其用戶滲透的趨勢就是,從北美到歐洲隨后到中國。
李志飛介紹了出門問問的技術探索之路,在2012年他們開始積累AI技術,13年開始探索語音助手軟件,14年開始軟硬結合,進行場景探索,到17年則開始開發跨場景聯動的虛擬個人助理。
隨后李志飛講解了實現語音交互的五個步驟:遠場喚醒、語音識別、語義理解、垂直搜索、語音合成。他認為判斷語音交互體驗好壞的標準可以用五個字來概括,分別為:遠(遠場)、快(快速響應)、準(準確率高)、全(技能有多少)、深(多輪對話)。
特邀嘉賓:何源
報告主題:從瓦薩沉船到數字孿生——物聯網的機遇和挑戰
何源首先非常生動地介紹了瓦薩沉船的故事,瓦薩沉船成為瑞典王國由衰轉盛的標志。從這個故事中何源副教授認為可以獲取三個啟示:設計制造流程無法響應不斷改變的用戶需求;設計方案和制造進展情況無法全面細致掌握;木已成舟前無法評估戰艦的安全性和可用性。
數字孿生以數字化方式為物理對象創建的虛擬模型,來反應物理對象的全生命周期過程。通過在虛擬和現實世界的無縫鏈接,可以協同仿真與設計、監控制造執行過程、產品使用狀態跟蹤,同時數據驅動的服務。
隨后何源介紹了國家電網特高壓換流站無人值守檢測和診斷系統。這個系統包括設備狀態實時跟蹤、故障分析與診斷、環境人員監控和遠程協作。類似的我們能夠發現很多類似應用場景,例如物聯網。物聯網進入了新的發展階段。物聯網與傳統行業深度融合,呈現出應用需求多樣化、網絡終端異構化、運維空間同一化的顯著特征,推動該領域研究向縱深發展。何源在報告中簡單介紹了他們的近期的一些研究,包括無緣感知網絡的并發傳輸、跨協議通信技術。最后何源介紹了未來的機遇和挑戰,認為最卓越的技術恰恰是會消失的技術,未來的計算機將不僅融入到我們的生活,而且他們將深度地連結在一起,為我們創造更加智慧的未來。
特邀嘉賓:劉偲
報告主題:圖像的像素級語義理解
劉偲首先通過自己一天中可能遇到的事情,生動地引入了深度學習的圖像視頻分析問題。近年來,基于深度學習的圖像視頻分析技術取得了巨大成功。相比于傳統的物體分類識別技術,圖像的像素級語義理解,又稱語義分割,能提供更加豐富的像素級信息, 因而成為一個新的研究熱點。
劉偲在報告中介紹了他們小組在語義分割領域的三個方向的研究,分別為場景解析、人體解析、人臉解析。
場景解析氛圍室內場景和室外場景。他們在室內場景提出了一個魔幻墻的系統,能夠自動的換壁紙的效果;室外場景中她介紹了一個去霧霾的效果。
人體解析的重要性在于能夠幫助進行視頻監控,他們針對這個問題設計了一個時序上下文的視頻解析算法,包括三個模塊,分別為單幀圖片解析、幀間光流估計、時序上下文融合。
針對人臉解析,他們設計了一套自適應調節視野域的人臉解析模型。其應用包括智能美妝、妝容遷移、人臉老化。
雖然基于深度學習的語義分割取得了很大的進展,但是未來依然有很大的提升空間。劉偲認為以后的方向集中在幾個方面:深度模型小型化、信息源多模態化、數據標注的低成本化。