一、概述
隨著生物識別技術、自然語音處理技術、大數據驅動的智能感知、理解等技術的不斷發展和深入,人工智能的技術瓶頸以及應用成本已從根本上得以突破。這使得人工智能的發展也日趨接近于人類智能水平,人工智能正從學術驅動轉變為應用驅動、從專用智能邁向通用智能。根據新一代人工智能面臨的新形勢、驅動的新因素、呈現的新特征,本文的目的是通過對《新一代人工智能發展白皮書》學習,對人工智能發展的歷史、驅動要素、主要特征、技術架構及產業化應用等方面進行概述,使從事人工智能領域研究、開發、生產及服務型企業及個人對新一代人工智能有一定的認知,也希望從中掌握新一代人工智能的發展機遇,制定企業發展戰略和個人規劃,使其能在行業中占有一席之地。
二、人工智能發展歷程
人工智能從誕生至今,人工智能已有 60 年的發展歷史,大致經歷了三次浪潮。第一次浪潮為 20 世紀 50 年代末至 20 世紀80 年代初;第二次浪潮為 20 世紀 80 年代初至 20 世紀末;第三次浪潮為 21 世紀初至今。在人工智能的前兩次浪潮當中,由于技術未能實現突破性進展,相關應用始終難以達到預期效果,無法支撐起大規模商業化應用,最終在經歷過兩次高潮與低谷之后,人工智能歸于沉寂。隨著信息技術快速發展和互聯網快速普及,以 2006 年深度學習模型的提出為標志,人工智能迎來第三次高速成長[摘抄原文]。
三、驅動人工智能發展的要素
3.1人機物互聯互通成趨勢,數據量呈現爆炸性增長
隨著互聯網、社交媒體、移動設備和傳感器的大量普及,其產生并存儲的數據量急劇增加,為通過深度學習的方法來訓練人工智能提供了良好的土壤,海量的數據將為人工智能算法模型提供源源不斷的素材,人工智能從各行業、各領域的海量數據中積累經驗、發現規律、使其深度學習成果得以持續提升。
3.2數據處理及運算能力的大幅提升
人工智能領域富集了海量數據,傳統的數據處理技術難以滿足高強度、 高頻次的處理需求,人工智能一個神經元的處理需要數百甚至上千條指令才能完成,傳統主流的X86、ARM的CPU架構難已與之匹配。目前,出現了 GPU、 NPU、 FPGA 和各種各樣的 AI-PU專用芯片,這些人工智能芯片的出現加速了深層神經網絡的訓練迭代速度,讓大規模的數據處理效率顯著提升,極大地促進了人工智能行業的發展。
3.3深度學習研究成果卓著,帶動算法模型持續優化
2006 年,加拿大多倫多大學教授杰弗里?辛頓提出了深度學習的概念,極大地發展了人工神經網絡算法,提高了機器自學習的能力。隨著算法模型的重要性進一步凸顯,全球科技巨頭紛紛加大了這方面的布局力度和投入,通過成立實驗室,開源算法框架,打造生態體系等方式推動算法模型的優化和創新。目前,深度學習等算法已經廣泛應用在自然語言處理、語音處理以及計算機視覺等領域,并在某些特定領域取得了突破性進展,從有監督式學習演化為半監督式、無監督式學習。
3.4資本與技術深度耦合,助推行業應用快速興起
當前,在技術突破和應用需求的雙重驅動下,人工智能技術已走出實驗室,加速向產業各個領域滲透,產業化水平大幅提升。在此過程中,資本作為產業發展的加速器發揮了重要的作用,一方面,跨國科技巨頭以資本為杠桿,展開投資并購活動,得以不斷完善產業鏈布局。人工智能已在智能機器人、無人機、金融、醫療、安防、駕駛、搜索、教育等領域得到了較為廣泛的應用。
四、新一代人工智能主要特征
4.1大數據成為人工智能持續快速發展的基石
智能終端和傳感器的快速普及,海量數據快速累積;計算能力、數據處理能力和處理速度實現了大幅提升,機器學習算法快速演進,大數據的價值得以展現。新一代人工智能是由大數據驅動的,通過給定的學習框架,不斷根據當前設置及環境信息修改、更新參數,具有高度的自主性。例如,在輸入 30 萬張人類對弈棋譜并經過 3 千萬次的自我對弈后,人工智能 AlphaGo 具備了媲美頂尖棋手的棋力。
4.2文本、圖像、語音等信息實現跨媒體交互
計算機圖像識別、語音識別和自然語言處理等技術在準確率及效率方面取得了明顯進步,并成功應用在無人駕駛、智能搜索等垂直行業。與此同時,隨著互聯網、智能終端的不斷發展,多媒體數據呈現爆炸式增長,并以網絡為載體在用戶之間實時、動態傳播,文本、圖像、語音、視頻等信息突破了各自屬性的局限,實現跨媒體交互,智能化搜索、個性化推薦的需求進一步釋放。未來人工智能將逐步向人類智能靠近,模仿人類綜合利用視覺、語言、聽覺等感知信息,實現識別、推理、設計、創作、預測等功能。
4.3基于網絡的群體智能技術的應用
隨著互聯網、云計算等新一代信息技術的快速應用及普及,大數據不斷累積,深度學習及強化學習等算法不斷優化,人工智能研究的焦點,已從單純用計算機模擬人類智能,打造具有感知智能及認知智能的單個智能體,向打造多智能體協同的群體智能轉變。群體智能充分體現了“通盤考慮、統籌優化”思想,具有去中心化、自愈性強和信息共享高效等優點,相關的群體智能技術已經開始萌芽并成為研究熱點。例如,我國研究開發了固定翼無人機智能集群系統,并于 2017 年 6月實現了 119 架無人機的集群飛行。
4.4自主智能系統成為新興發展方向
隨著生產制造智能化改造升級的需求日益凸顯,通過嵌入智能系統對現有的機械設備進行改造升級成為更加務實的選擇。在中國制造 2025引導下,自主智能系統正成為人工智能的重要發展及應用方向。例如,沈陽機床以 i5 智能機床為核心,打造了若干智能工廠,實現了“設備互聯、數據互換、過程互動、產業互融”的智能制造模式。
4.5人機協同正在催生新型混合智能形態
人類智能在感知、推理、歸納和學習等方面具有機器智能無法比擬的優勢,機器智能則在搜索、計算、存儲、優化等方面領先于人類智能,兩種智能具有很強的互補性。人與計算機協同,互相取長補短將形成一種新的“1+1>2”的增強型智能,也就是混合智能,這種智能是一種雙向閉環系統,既包含人,又包含機器組件。其中人可以接受機器的信息,機器也可以讀取人的信號, 兩者相互作用,互相促進。在此背景下,人工智能的根本目標已經演進為提高人類智力活動能力,更智能地陪伴人類完成復雜多變的任務。
五、新一代人工智能技術框架
5.1新一代人工智能的技術演變
5.1.1 從原有的 CPU 架構,轉變為 GPU 并行運算架構
大數據技術帶來的數據洪流滿足了人工智能的深度學習算法對于訓練數據量的要求,但是算法的實現還需要更快更強大的處理器予以支撐。當前主流的 CPU 只有 4 核或者 8 核,可以模擬出 12 個處理線程來進行運算,但是普通級別的 GPU 就包含了成百上千個處理單元,高端的甚至更多,可以快速處理圖像上的每一個像素點,其海量數據并行運算的能力與深度學習需求非常符合。這對于多媒體計算中大量的重復處理過程有著天生的優勢。吳恩達教授領導的谷歌大腦研究工作結果表明, 12 顆英偉達(Nvidia)公司的 GPU 可以提供相當于 2000 顆 CPU 的深度學習性能,為人工智能技術的發展帶來了實質性飛躍。
5.1.2從單一算法驅動,轉變為數據、運算力、算法復合驅動
與早期人工智能相比,新一代人工智能體現出數據、運算力和算法相互融合、優勢互補的良好特點。1、數據方面,人類進入互聯網時代后,數據技術高速發展,各類數據資源不斷積累,為人工智能的訓練學習過程奠定了良好的基礎。2、運算力方面,摩爾定律仍在持續發揮效用,計算系統的硬件性能逐年提升,云計算、并行計算、網格計算等新型計算方式的出現拓展了現代計算機性能,獲得更快的計算速度。3、算法方面,伴隨著深度學習技術的不斷成熟,運算模型日益優化,智能算法不斷更新,提升了模型辨識解析的準確度。
5.1.3從封閉的單機系統,轉變為快捷靈活的開源框架
人工智能系統的開發工具日益成熟,通用性較強且各具特色的開源框架不斷涌現,如谷歌的TensorFlow、Facebook 的Torchnet、百度的PaddlePaddle 等,其共同特點均是基于 Linux 生態系統,具備分布式深度學習數據庫和商業級即插即用功能,能夠在GPU 上較好地繼承 Hadoop 和 Spark 架構,廣泛支持 Python、Java、 Scala、 R 等流行開發語言,與硬件結合生成各種應用場景下的人工智能系統與解決方案。
5.1.4從學術研究探索導向,轉變為快速迭代的實踐應用導向
目前,人工智能圍繞醫療、金融、交通、教育、零售等數據較集中且質量較高的行業的實踐需求,在算法模型、圖像識別、自然語言處理等方面將持續出現迭代式的技術突破,在深度應用中支撐人工智能實現“數據-技術-產品-用戶”的往復正循環,正由學術驅動向應用拉動轉化。在人工智能技術準備期,由于提供數據支撐較少,技術提升度慢,一旦進入應用期,大量的優質數據有助于分析技術弊端,通過對相關技術進行改進升級,提升了產品的應用水平,用戶在得到更好的產品體驗后,繼續為應用平臺創造了更大規模的后臺數據,用來進行下一步的技術升級與產品改良,由此進入了大規模應用階段。在技術快速迭代發展的過程中,數據累積和大規模應用起到了至關重要的作用,能夠持續推動人工智能技術實現自我超越。
5.2新一代人工智能技術體系
新一代人工智能技術體系由基礎技術平臺和通用技術體系構成,其中基礎技術平臺包括云計算和大數據平臺,通用技術體系包括機器學習、模式識別與人機交互。
5.2.1云計算:基礎的資源整合交互平臺
云計算主要共性技術包括虛擬化技術、分布式技術、計算管理技術、云平臺技術和云安全技術,具備實現資源快速部署和服務獲取、進行動態可伸縮擴展及供給、面向海量信息快速有序化處理、可靠性高、容錯能力強等特點,為人工智能的發展提供了資源整合交互的基礎平臺。尤其與大數據技術結合,為當前受到最多關注的深度學習技術搭建了強大的存儲和運算體系架構,促進了神經網絡模型訓練優化過程,顯著提高語音、圖片、文本等辨識對象的識別率。
5.2.2 大數據:提供豐富的分析、訓練與應用資源
大數據主要共性技術包括采集與預處理、存儲與管理、計算模式與系統、分析與挖掘、可視化計算及隱私及安全等,具備數據規模不斷擴大、種類繁多、產生速度快、處理能力要求高、時效性強、可靠性要求嚴格、價值大但密度較低等
特點,為人工智能提供豐富的數據積累和價值規律,引發分析需求。同時,從跟蹤靜態數據到結合動態數據,可以推動人工智能根據客觀環境變化進行相應的改變和適應,持續提高算法的準確性與可靠性。
5.2.3機器學習:持續引導機器智能水平提升
機器學習指通過數據和算法在機器上訓練模型,并利用模型進行分析決策與行為預測的過程。機器學習技術體系主要包括監督學習和無監督學習,目前廣泛應用在專家系統、認知模擬、數據挖掘、圖像識別、故障診斷、自然語言理解、
機器人和博弈等領域。機器學習作為人工智能最為重要的通用技術,未來將持續引導機器獲取新的知識與技能,重新組織整合已有知識結構,有效提升機器智能化水平,不斷完善機器服務決策能力。
5.2.4模式識別:從感知環境和行為到基于認知的決策
模式識別是對各類目標信息進行處理分析,進而完成描述、辨認、分類和解釋的過程。模式識別技術體系包括決策理論、句法分析和統計模式等,目前廣泛應用在語音識別、指紋識別、人臉識別、手勢識別、文字識別、遙感和醫學診斷等領域。隨著理論基礎和實際應用研究范圍的不斷擴大,模式識別技術將與人工神經網絡相結合,由目前單純的環境感知進化為認知決策,同時量子計算技術也將用于未來模式識別研究工作,助力模式識別技術突破與應用領域拓展。
5.2.5人機交互:支撐實現人機物交叉融合與協同互動
人機交互技術賦予機器通過輸出或顯示設備對外提供有關信息的能力,同時可以讓用戶通過輸入設備向機器傳輸反饋信息達到交互目的。人機交互技術體系包括交互設計、可用性分析評估、多通道交互、群件、移動計算等,目前廣泛應用在地理空間跟蹤、動作識別、觸覺交互、眼動跟蹤、腦電波識別等領域。隨著交互方式的不斷豐富以及物聯網技術的快速發展,未來肢體識別和生物識別技術將逐漸取代現有的觸控和密碼系統,人機融合將向人機物交叉融合進化發展,帶來信息技術領域的深刻變革。
六、新一代人工智能的產業化應用
隨著人工智能理論和技術的日益成熟,應用范圍不斷擴大,潛在需求的逐漸明確和商業模式的日漸成熟,人工智能核心產業的邊界與范圍將逐步擴展。通過人工智能核心產業發展所形成的輻射和擴散效應,獲得新提升、新增長的國民經濟其它行業集合,均可視為人工智能帶動的相關產業。
通過梳理從研發到應用所涉及的產業鏈各個環節,將新一代人工智能在當前的核心產業分為基礎層、技術層和應用層,結合目前常見應用場景,依據產業鏈上下游關系,再將其主要劃分為既相對獨立又相互依存的若干種產品及服務,其新一代人工智能當前核心產業鏈如下圖所示。
6.1基礎層
基礎層主要包括智能傳感器、智能芯片、算法模型,其中,智能傳感器和智能芯片屬于基礎硬件,算法模型屬于核心軟件。
隨著應用場景的快速鋪開,既有的人工智能產業在規模和技術水平方面均與持續增長的市場需求尚有差距,倒逼相關企業及科研院所進一步加強對智能傳感器、 智能芯片及算法模型的研發及產業化力度。預計到 2020 年,全球智
能傳感器、 智能芯片、算法模型的產業規模將突破 270 億美元, 我國智能傳感器、 智能芯片、算法模型的產業規模將突破 44 億美元。
6.1.1智能傳感器:智能轉型引領行業發展
智能傳感器屬于人工智能的神經末梢,是實現人工智能的核心組件,是用于全面感知外界環境的最核心元件,各類傳感器的大規模部署和應用是實現人工智能不可或缺的基本條件。隨著傳統產業智能化改造的逐步推進,以及相關新型智能應用和解決方案的興起,對智能傳感器的需求將進一步提升,預計到 2020 年全球智能傳感器的產業規模將超過54 億美元,其中我國智能傳感器的產業規模為 11 億美元。
核心技術: 智能傳感器本質上是利用微處理器實現智能處理功能的傳感器,必須能夠自主接收、分辨外界信號和指令,并能通過模糊邏輯運算、主動鑒別環境,自動調整和補償適應環境,以便于大幅減輕數據傳輸頻率和強度,顯著提高數據采集效率。目前,智能傳感器集成化、小型化的特點愈發突出,更多的功能被集成在一起,控制單元所需的外圍接插件和分立元件越來越少,促使其通用性更強,應用范圍更寬廣,制造成本也進一步下降。同時,原子材料、納米材料等新材料技術也在智能傳感器領域得到日益廣泛的應用,使其表現出更為靈敏的物理性能。
主要產品: 智能傳感器已廣泛應用于智能機器人、智能制造系統、智能安防、智能人居、智能醫療等各個領域。例如,在智能機器人領域,智能傳感器使機器人具有了視覺、聽覺和觸覺,可感周邊環境,完成各種動作,并與人發生互動,包括觸覺傳感器、視覺傳感器、超聲波傳感器等。在智能制造系統領域,利用智能傳感器可直接測量與產品質量有關的溫度、壓力、流量等指標,利用深度學習等模型進行計算,推斷出產品的質量,包括液位、能耗、速度等傳感器。在安防、人居、醫療等與人類生活密切相關的領域,智能傳感器也廣泛搭載于各類智能終端,包括光線傳感器、距離傳感器、重力傳感器、陀螺儀、心律傳感器等。
典型企業:智能傳感器市場主要由國外廠商占據,集中度相對較高。由于技術基礎深厚,國外廠商通常多點布局,產品種類也較為豐富,較為典型的有霍尼韋爾、美國壓電、意法半導體、飛思卡爾。如霍尼韋爾生產的產品包括了壓力傳感器、溫度傳感器、濕度傳感器等多個產品類型,涉及航空航天、交通運輸、醫療等多個領域。美國壓電生產的產品涵蓋了加速度傳感器、壓力傳感器、扭矩傳感器等,并涉及核工業、石化、水力、電力、和車輛等多個不同領域。相比之下,我國廠商經營內容仍較為單一,如高德紅外主要生產紅外熱成像儀,華潤半導體主要生產光敏半導體,但其中也出現了華工科技、中航電測等少數企業試水擴大布局范圍。人工智能根據客觀環境變化進行相應的改變和適應,持續提高算法的準確性與可靠性。
6.1.2 智能芯片:初創企業蓄勢待發
智能芯片是人工智能的核心,與傳統芯片最大的差別在于架構不同,傳統的計算機芯片均屬于馮?諾依曼體系,智能芯片則仿照大腦的結構設計,試圖突破馮?諾依曼體系中必須通過總線交換信息的瓶頸。當前各大科技巨頭正積極布局人工智能芯片領域, 初創企業紛紛入局,隨著市場將進一步打開,預計到 2020 年全球智能芯片的產業規模將接近 135 億美元,其中我國智能芯片的產業規模近 25 億美元。
核心技術:深度學習已成為當前主流的人工智能算法,這對于處理器芯片的運算能力和功耗提出了更高要求,目前軟件企業采取的主流方案是通過應用 GPU 和 FPGA 提高運算效率,與 CPU 少量的邏輯運算單元相比, GPU 就是一個龐大的計算矩陣,具有數以千計的計算核心,可實現 10-100倍應用吞吐量,而且支持對深度學習至關重要的并行計算能力,可以比傳統處理器更加快速,大大加快了訓練過程。同時,一些針對深度學習算法而專門優化和設計的芯片也已經面市,由于是量身定制,運行更為高效。
主要產品:數據和運算是深度學習的基礎,可以用于通用基礎計算且運算速率更快的 GPU 迅速成為人工智能計算的主流芯片。 2015 年以來,英偉達公司的 GPU 得到廣泛應用,并行計算變得更快、更便宜、更有效,最終導致人工智能大爆發。同時,與人工智能更匹配的智能芯片體系架構的研發成為人工智能領域的新風口,已有一些公司針對人工智能推出了專用的人工智能芯片。如 IBM的類腦芯片 TureNorth及神經突觸計算機芯片 SyNAPSE、高通的認知計算平臺Zeroth、英特爾收購的 Nervana、浙江大學與杭州電子科技大學的學者合作研制的類腦芯片“達爾文”,中國科學院計算技術研究所的寒武紀芯片。
典型企業: 作為核心和底層基礎,智能芯片已經成為各大公司布局的重點領域。目前傳統芯片巨頭如英特爾、英偉達,大型互聯網公司如谷歌、微軟已經在該領域發力,這些公司資金實力雄厚,除了自行研發外,通常也采用收購的方
式快速建立競爭優勢。例如,谷歌繼 2016 年發布第一代 TPU后,于今年谷歌 I/O 大會上推出了第二代深度學習芯片 TPU,英特爾則以 167 億美元收購 FPGA 生產商 Altera 公司。由于智能芯片剛剛興起,技術、標準都處于探索階段,我國芯片廠商換道超車的機會窗口閃現,涌現出了一批優秀的創業型公司,如寒武紀、深鑒科技等。
6.1.3算法模型:通過開源構建生態已是大勢所趨
人工智能的算法是讓機器自我學習的算法,通常可以分為監督學習和無監督學習。隨著行業需求進一步具化,及對分析要求進一步的提升,圍繞算法模型的研發及優化活動將越發頻繁。當前,算法模型產業已初具規模,預計到 2020
年全球算法模型產業規模將達到 82 億美元,我國算法模型產業規模將突破 8 億美元。
核心技術:算法創新是推動本輪人工智能大發展的重要驅動力,深度學習、強化學習等技術的出現使得機器智能的水平大為提升。全球科技巨頭紛紛以深度學習為核心在算法領域展開布局,谷歌、微軟、 IBM、 Facebook、百度等相繼在圖片識別、機器翻譯、語音識別、決策助手、生物特征識別等領域實現了創新突破。
主要產品: 目前,隨著大數據環境的日漸形成,全球算法模型持續取得應用進展,深度學習算法成為推動人工智能發展的焦點,各大公司紛紛推出自己的深度學習框架,如谷歌的 TensorFlow, IBM 的 System ML, Facebook 的 Torchnet,百度公司的 PaddlePaddle。更為重要的是,開源已成為這一領域不可逆的趨勢,這些科技巨頭正著手推動相關算法的開源化,發起算法生態系統的競爭。與此同時,服務化也是算法領域未來發展的重要方向,一些在算法提供商正將算法包裝為服務,針對客戶的具體需求提供整體解決方案。
典型企業: 目前,在算法模型領域具備優勢的企業基本均為知名的科技巨頭,正在通過構建聯盟關系,擴展戰略定位等方式布局人工智能產業。 2016 年 9 月, Facebook、亞馬遜、谷歌 Alphabet、 IBM 和微軟自發聚集在一起,宣布締結新的人工智能伙伴關系, 10 月,谷歌公司更是調整戰略方向從移動優先轉變為人工智能優先。我國科技企業也紛紛落子人工智能, 2017 年 3 月,阿里巴巴正式推出“NASA”計劃,騰訊成立人工智能實驗室, 5 月,百度公司將戰略定位從互聯網公司變更為人工智能公司,發展人工智能已經成為科技
界的共識。
6.2技術層
技術層主要包括語音識別、 圖像視頻識別、文本識別等產業,其中語音識別已經延展到了語義識別層面,圖像視頻識別包括了人臉識別、手勢識別、指紋識別等領域,文本識別主要是針對印刷、手寫及圖像拍攝等各種字符進行辨識。
隨著全球人工智能基礎技術的持續發展與應用領域的不斷豐富,人工智能技術層各產業未來將保持快速增長態勢。預計到 2020 年,全球語音識別、圖像視頻識別、文本識別等人工智能技術層產業規模將達到 342 億美元,我國人工智能
技術層產業規模將突破 66 億美元。
6.2.1語音識別:正在步入應用拉動的快速增長階段
語音識別(Speech Recognition, SR)技術是將人類語音中的詞匯內容轉換為計算機可讀的輸入,例如按鍵、二進制編碼或者字符序列。語音識別技術與其他自然語言處理技術如機器翻譯及語音合成技術相結合,可以構建出更加復雜的應用及產品。在大數據、移動互聯網、云計算以及其他技術的推動下,全球的語音識別產業已經步入應用快速增長期,未來將代入更多實際場景,預計到 2020 年全球語音識別產業規模將達到 236 億美元,國內語音識別產業規模達到 44.2億美元。
核心技術:語音識別的主要目的是讓智能設備能夠具有和人類一樣的聽識能力,同時將人類語言所表述的自然語義自動轉換為計算機能理解和操作的結構化語義,完成實時的人機交互功能。近年來,語音喚醒技術、聲學前端處理技術、
聲紋識別技術、語義理解技術、對話管理技術等語音識別領域核心技術的蓬勃發展,有助于構建智能語音交互界面系統,提高語音識別的準確率與響應速度,滿足垂直領域對自然語義識別和聲音指令的應用需求,為用戶提供自然、友好和便捷的人機交互體驗。
主要產品:伴隨著移動互聯網技術的發展與智能硬件設備的普及,人類已經不再滿足于鍵盤輸入和手寫輸入等傳統人機交互方式,語音識別技術在電子信息、互聯網、醫療、教育、辦公等各個領域均得到了廣泛應用,形成了智能語音
輸入系統、智能語音助手、智能音箱、車載語音系統、智能語音輔助醫療系統、智能口語評測系統、智能會議系統等產品,可以通過用戶的語音指令和談話內容實現陪伴聊天、文字錄入、事務安排、信息查詢、身份識別、設備控制、路徑
導航、會議記錄等功能,優化了復雜的工作流程,提供了全新的用戶應用體驗。
典型企業: 語音識別領域具有較高的行業技術壁壘,在全球范圍內,只有少數的企業具有競爭實力。目前, Nuance、蘋果、三星、微軟、谷歌、科大訊飛、云知聲、百度、 阿里、凌聲芯、思必馳等知名企業均重點攻克語音識別技術,推出大量相關產品。 Nuance 曾經是全球最大的語音識別技術提供商,側重于為服務提供商提供底層技術解決方案,隨著企業戰略目標以及商業環境的改變,目前轉型為客戶端解決方案提供商;蘋果公司以 Siri 語音助手為平臺關聯 iOS 系統相關應用與服務,傾向于改善用戶的智能手機使用體驗和創新商業模式;微軟致力于提高語音識別技術的準確率,英語的語音識別轉錄詞錯率僅 5.9%,達到了專業速錄員水平,并將相關技術應用于自身產品“小冰”和“小娜”之中;科大訊飛作為國內智能語音和人工智能產業的領導者,中文語音識別技術已處于世界領先地位,并逐漸建立中文智能語音產業生態;云知聲重點構建集機器學習平臺、語音認知計算和大數據交互接口三位一體的智能平臺,垂直應用領域集中于智能家居和車載系統;阿里人工智能實驗室借助“天貓精靈”智能音箱構建基于語音識別的智能人機交互系統,并通過有效接入第三方應用實現生活娛樂功能的進一步拓展。
6.2.2圖像視頻識別:在安防監控市場具有巨大增長潛力
圖像識別(Image Recognition, IR)技術是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式狀態下的目標和對象,包括人臉、手勢、指紋等生物特征。視頻從工程技術角度可以理解成靜態圖像的集合,所以視頻識別與圖像識別的定義和基本原理一致,在識別量和計算量上明顯提高。隨著人類社會環境感知要求的不斷提升和社會安全問題的日益復雜,人臉識別和視頻監控作用更加突出,圖像視頻識別產業未來將迎來爆發式增長,預計到 2020 年全球圖像視頻識別產業規模將達到 82 億美元,國內圖像視頻識別產業規模達到 15.2 億美元。
核心技術: 圖像視頻識別是通過計算機模擬人類器官和大腦感知辨別外界畫面刺激的過程,既要有進入感官的信息,也要有記憶中存儲的信息,對存儲的信息和接受的信息進行比較加工,完成圖像視頻的辨識過程。圍繞以上特定需求,
圖像預處理技術、特征提取分類技術、圖像匹配算法、相似性對比技術、深度學習技術等構成了圖像視頻識別的核心技術體系框架,能夠對通過計算機輸入和照相機及攝像頭獲取的圖片視頻進行變換、壓縮、增強復原、分割描述等操作,顯著提高圖像視頻識別質量和清晰度,有助于快速準確完成圖像視頻的響應分析流程。
主要產品: 隨著工業生產及生活消費領域影像設備的日益普及,每天都會產生海量蘊含豐富價值和信息的圖片及視頻,單靠人力無法進行分揀處理,需要借助圖像視頻識別功能進行集中快速獲取與解析。目前,智能圖片搜索、人臉識
別、指紋識別、掃碼支付、視覺工業機器人、輔助駕駛等圖像視頻識別產品正在深刻改變著傳統行業,針對種類繁雜、形態多樣的圖形數據和應用場景,基于系統集成硬件架構和底層算法軟件平臺定制綜合解決方案,面向需求生成圖像視
頻的模型建立與行為識別流程,為用戶提供豐富的場景分析功能與環境感知交互體驗。
典型企業: 近年來,國內外從事圖像視頻識別的公司顯著增加,谷歌、 Facebook、微軟、曠視科技、圖普科技、格靈深瞳等國內外知名企業重點集中在人臉識別、智能安防和智能駕駛等領域進行技術研發與產品設計。國外公司大多進行底層技術研發,同時偏重于整體解決方案的提出,積極建立開源代碼生態體系,如谷歌推出 Google Lens 應用實時識別手機拍攝的物品并提供與之相關的內容, Facebook 開源三款智能圖片識別軟件,鼓勵研發者們圍繞其圖像視頻識別技術框架開發各類功能豐富的應用產品;國內企業直接對接細分領域,商業化發展道路較為明確,如曠視科技目前重點研發人臉檢測識別技術產品,加強管控卡口綜合安檢、重點場所管控、小區管控、智慧營區等領域的業務布局,圖普科技在阿里云市場提供色情圖像和暴恐圖像識別的產品和服務,確定準確率超過 99.5%,滿足了云端用戶的安全需求。
6.2.3文本識別:全面進入云端互聯時代
文本識別(Text Recognition, TR)技術是指利用計算機自動識別字符,包括文字信息的采集、信息的分析與處理、信息的分類判別等內容。文本識別可以有效提高如征信、文獻檢索、證件識別等業務的自動化程度,簡化工作流程,提高相關行業效率。隨著政府、金融、教育、科技等領域需求中國電子學會的進一步上升,文本識別將在工業自動化流程與個人消費領域取得長足發展,預計到 2020 年全球文本識別產業規模將達到 24 億美元,國內文本識別產業規模達到 6.6 億美元。
核心技術: 文本識別技術目前正由嵌入式設備本地化處理向云端在線處理全面演進發展,過去由鼠標與鍵盤輸入的文本信息,現在則主要由攝像頭、麥克風和觸摸屏采集獲取。在此基礎上,以往的文本識別核心技術, 如模版匹配技術、字符分割技術、光學字符識別技術(Optical Character Recognition, OCR)、邏輯句法判斷技術等需要與應用程序編程接口(API)技術、智能終端算法技術、云計算技術等結合,衍生出面向云端與移動互聯網的新型文本識別系統,通過開放的平臺與服務為廣大的企業及個人用戶提供方便快捷的服務。
主要產品: 當今信息社會背景下,文本信息不僅體量巨大,表現形式也日趨復雜,包括印刷體、手寫體以及通過外接設備輸入到計算機系統的字符圖形。同時,隨著世界不同語言文明地區交流逐漸增多,對實時語言文本翻譯系統的需
求更加強烈。目前,基于文本識別技術開發的文件掃描、名片識別、身份證信息提取、文本翻譯、在線閱卷、公式識別等產品正在金融、安防、教育、外交等領域得到廣泛應用,通過不同的授權級別,為企業級用戶部署專業的文檔管理、移動辦公與信息錄入基礎設施,同時為個人用戶提供個性化的人脈建立、信息咨詢和遠程教育服務。
典型企業: 隨著文本識別在各類垂直應用領域的應用逐漸普及,國內外企業也結合自身業務和區域發展特色積極展開布局。谷歌、微軟、亞馬遜等跨國科技巨頭在自身產品服務中內嵌文本識別技術,以增強產品使用體驗和用戶粘度,
如谷歌推出的在線翻譯系統可提供 80 種語言之間的即時翻譯,并將自身的語音識別技術與文本識別相結合,提高了翻譯效率。國內公司在中文文本識別領域也有多年積累,具備良好的技術優勢與產業背景,漢王科技、百度、騰訊等均有
較為成熟的產品推出,如漢王正在構建以識別云和設備云為核心的文本識別 2.0 系統。
6.3應用層
應用層主要包括智能機器人、智能金融、智能醫療、智能安防、智能駕駛、智能搜索、智能教育、智能制造系統及智能人居等產業。其中,智能機器人產業規模及增速相對突出; 智能金融、 智能駕駛、 智能教育的用戶需求相對明確且市場已步入快速增長階段;智能安防集中于行業應用和政府采購,市場集中度相對較高;智能搜索、智能人居的產品尚未完善,市場正在逐步培育;智能醫療則涉及審批機制,市場尚未放量。預計到 2020 年,全球人工智能應用層產業規模將達到 672 億美元,其中,智能機器人、智能駕駛、智能教育、智能安防及智能金融的產業規模將超過 68%,同時我國人工智能應用層產業規模將突破 110 億美元。
6.3.1智能機器人
智能機器人是指具備不同程度類人智能,可實現“感知-決策-行為-反饋”閉環工作流程,可協助人類生產、服務人類生活,可自動執行工作的各類機器裝置,主要包括智能工業機器人、智能服務機器人和智能特種機器人。受智能工業機
器人助推智能制造升級和智能家用服務機器人率先放量的帶動,智能機器人全球產業規模在 2020 年會接近 90 億美元,我國將達到 25 億美元。
核心技術: 由于高頻人機互動特點,智能機器人的核心技術重點聚焦在智能感知、智能認知和多模態人機交互領域。同時依據應用領域的不同,智能機器人也存在著大量帶有典型行業特征的特色關鍵技術。智能工業機器人運用傳感
技術和機器視覺技術,具備觸覺和簡單的視覺系統, 更進一步運用人機協作、多模式網絡化交互、自主編程等技術增加自適應、自學習功能,引導工業機器人完成定位、檢測、識別等更為復雜的工作,替代人工視覺運用于不適合人工作業的危險工作環境或人工視覺難以滿足要求的場合;智能家用服務機器人重點應用移動定位技術和智能交互技術,達到服務范圍全覆蓋及家用陪護的目的;智能醫療服務機器人重點突破介入感知建模、微納技術和生肌電一體化技術,以達到提升手術精度、加速患者康復的目的;智能公共服務機器人重點運用智能感知認知技術、多模態人機交互技術、機械控制和移動定位技術等,實現應用場景的標準化功能的呈現和完成;智能特種機器人運用仿生材料結構、復雜環境動力學控制、微納系統等前沿技術,替代人類完成高危環境和特種工況作業。
主要產品: 智能工業機器人領域, 隨著柔性生產模式的轉型, 具備感知、規劃、學習能力的智能定位機器人和智能檢測機器人加速出現, 智能定位機器人通過機器視覺系統結合雙目攝像頭, 引導機械手進行準確的定位和運動控制,不僅可以完成對工件的抓取和放置等操作,同時還能進行焊縫、 拋光、噴涂、外殼平整等多項作業; 智能檢測機器人用機器視覺檢測方法大大提高生產效率和生產的自動化程度。智能服務機器人領域,隨著人均收入水平的提升,對家用工具智能化程度的需求日益增長,掃地機器人、擦窗機器人等智能家政服務產品大量涌現;同時由于全球老齡化引發的社會問題,情感陪護類機器人市場需求也逐步成熟,輔助人類進行陪伴和溝通;隨著全球醫療投入的持續增加以及微創類
手術需求的快速上升,智能醫療服務機器人進一步促進了醫療解決方案的高效化和精準化。智能特種機器人領域,人類工作及探索的環境邊界不斷拓展,為降低在高危及不確定環境的工作難度,智能軍用機器人、應急救援機器人及消防機
器人等正在逐漸代替人類從事高危環境和特殊工況;無人機則廣泛應用在警用、城市管理、農業、地質、氣象、電力、搶險救災、視頻拍攝等行業,實現大面積巡查,完成實時監測和評估。
典型企業: 智能工業機器人領域,國際四大巨頭仍占據較高市場份額, 日本發那科和安川、德國庫卡、瑞士 ABB、意大利柯馬側重具有分揀和裝配能力的智能工業機器人,英國 Meta、德國 Scansonic、日本安川聚焦激光視覺焊縫跟蹤系統; 國內智能工業機器人“三巨頭”新松、云南昆船和北京機科占據國內 90%市場份額,均有典型產品推出,新松重點提供自動化裝配與檢測生產線、物流與倉儲自動化成套設備,云南昆船側重煙草行業服務,北京機科主要應用于印鈔造幣、輪胎及軍工領域。智能服務機器人領域,美國 iRobot、中國科沃斯、美國 Intuitive Surgica、 以色列 Rewalk、荷蘭Hot-Cheers 分別聚焦于清潔、手術、康復及分揀等細分領域。智能特種機器人領域,波士頓動力圍繞著擁有液壓驅動核心技術的“大狗”機器人,不斷構筑技術壁壘;大疆在國內消費級無人機領域占有率達 75%,成為估值超百億美元的“獨角獸”企業;美國 Howe and Howe Techonologies 則專注生產消防機器人,應用于應急救援場景。
6.3.2 智能金融
金融行業與整個社會存在巨大的交織網絡,每時每刻都能夠產生金融交易、客戶信息、市場分析、風險控制、投資顧問等多種海量數據。促進人工智能技術與金融行業相融合,在前端可以增強用戶的便利性和安全性,在中臺支持授信、各類金融交易和金融分析中的決策,在后臺用于風險防控和監督。這將大幅改變金融行業現有格局,推動銀行、保險、理財、借貸、投資等各類金融服務的個性化、定制化和智能化。 受智能客服、金融搜索引擎及身份驗證入口級產品的廣泛普及和應用, 智能金融全球產業規模在 2020 年會接近 52 億美元,我國將達到 8 億美元。
核心技術: 當前,線上交易引發的隱私泄露及金融詐騙頻出,同時隨著移動終端和金融機構客戶端的普及,提取的用戶金融數據逐步豐富,金融機構線上服務能力和用戶隱私和交易風控就變得至關重要,語音識別、自然語音處理、計
算機視覺、生物特征識別和機器學習等技術得到了廣泛應用。語音識別與自然語音處理技術可以為前端服務客戶實現批量人性化和個性化的服務;計算機視覺與生物特征識別技術則為金融支付驗證提供了保障;機器學習技術一方面通過導入海量金融交易數據,從中分析信用卡數據,識別欺詐交易,并提前預測交易變化趨勢,另一方面通過構建金融知識圖譜將不同來源的結構化和非結構化的數據整合到一起,建立基于大數據的完整征信授信體系。
主要產品: 基于電話、網頁在線、微信、短信及 APP等多模式多頻次的金融信息及服務獲取渠道,相對較為成熟并已經逐步推廣的產品包括智能客服、金融搜索引擎和身份驗證,通過構建知識圖譜實現理解答復及信息關聯體系、提
供遠程開戶和刷臉支付等便捷方式幫助金融機構節省人力成本。同時,隨著用戶消費及信貸能力的逐步提升,也涌現出一批征信和風險控制的產品,但受限于數據庫的規模和數據源的相對難以獲取,目前大部分集中在客觀呈現款人、企業間、行業間的信息維度關聯方面。此外,金融類或資產管理類公司為持續提供用戶理財和升值的資產組合推出了智能投顧產品,可根據歷史經驗和新的市場信息來預測金融資產的價格波動趨勢,以此創建符合風險收益的投資組合。
典型企業: 智能客服、身份驗證和金融搜索引擎領域創新企業較多,著重于引流擴量。智齒科技、網易七魚及美國DigitalGenius 均著重通過用戶體驗提升客戶量,曠世科技、商湯科技及依圖圍繞著人臉識別的核心技術進入金融領域,融 360、好貸網、資信客聚焦垂直領域打造金融服務的入口。征信及風控領域企業以大數據為壁壘,逐步出現行業龍頭。啟信寶和美國 ZestFinance 不斷擴容數據基礎,形成“平臺黑洞”優勢,啟信寶通過提取 100 多家官方網站數據產品側重呈現客觀數據整合, ZestFinance 則使用谷歌的大數據模型建立
信用評分體系。智能投顧多為金融機構專業人才或者投資顧問公司轉型而來,美國 Wealthfront、彌財、財鯨等主要通過投資 ETF 組合以達到資產配置,理財魔方、錢景私人理財則專注基金產品的覆蓋,雪球和金貝塔等以對量化策略、 投資名人的股票組合的跟投為內容展開資訊傳遞和信息交流。
6.3.3智能醫療
促使智能機器和設備代替醫生完成部分工作,更多地觸達用戶,只是智能醫療功用的部分體現。運用人工智能技術對醫療案例和經驗數據進行深度學習和決策判斷,顯著提高醫療機構和人員的工作效率并大幅降低醫療成本,才是智能醫療的核心目標。同時,通過人工智能的引導和約束,促使患者自覺自查、加強預防,更早發現和更好管理潛在疾病,也是智能醫療在未來的重要發展方向。
核心技術:醫療水平的提升和醫療設備的完善使得患者就診過程會產生與日俱增的就診數據,爆炸式信息增長讓醫生無法無差錯的完成診斷和治療,同時隨著人們健康意識的加強,預防性和精準性治療同時受到關注。圖像識別、語音
語義識別、深度學習技術在醫療領域得到廣泛應用。圖像識別、語音語義識別技術可充分獲取患者的飲食習慣、鍛煉周期、服藥習慣等個人生活習慣信息以對癥下藥,深度學習技術可通過計算機模擬預測藥物活性、安全性和副作用,降低
藥物研發周期,并輔助醫生工作實現更精準診斷和治療。
主要產品:期待健康長壽的意愿隨著人們生活質量的提高持續增強,適用于生活化的身體管理的智能健康管理產品率先成為熱點,以數據形式引導個人生活習慣以達到基于精準醫學的健康管理。同時,醫生為能進行更精準并且效率更
高的診斷和治療,往往會圍繞著醫療領域過往沉淀的大量病理案例,不斷從預防的角度規避疾病或提前預測藥物的可行性,智能影像、智能診療等智能醫療產品快速興起,逐漸取代經驗診斷,通過大量的影像數據和診斷數據模擬醫療專家
的思維、診斷推理和治療過程,從而給出更可靠的診斷和治療方案。
典型企業: 智能健康管理多面向消費端客戶,創新企業大量涌現,大部分集中在美國。如 Next IT、 Sense.ly 和 AiCure均是從日常健康管理切入移動醫療, Welltok 則通過可穿戴設進行健康干預。智能診療領域取得顯著進展, IBM Watson以腫瘤為重心,在慢病管理、精準醫療、體外檢測等九大醫療領域中實現突破,美國 MedWhat、英國 Babylon Health 和中國拍醫拍、康夫子正在聚焦智能診療的單個應用進入該領域。智能影像領域以創新企業為主,圍繞影像數據源競爭激烈。美國 Butterfly Network 和中國推想科技著重打造影像設備,美國 Enlitic 則重點關注癌癥監測,中國 Deepcare 圍繞SaaS 模式為行業提供“算法+有效數據”服務。?
6.3.4智能安防
隨著高清視頻、智能分析、云計算和大數據等相關技術的發展,傳統的被動防御安防系統正在升級成為主動判斷和預警的智能安防系統。安防行業也從單一的安全領域向多行業應用、提升生產效率、提高生活智能化程度方向發展,為更多的行業和人群提供可視化、智能化解決方案。隨著智慧城市、智能建筑、智慧交通等智能化產業的帶動,智能安防也將保持高速增長,預計在2020年全球產業規模實現106億美元,我國會達到20億美元。
核心技術:隨著平安城市建設的不斷推進,監控點位越來越多,從最初的幾千路到幾萬路甚至于到現在幾十萬路的規模,依托視頻和卡口產生的海量數據,智能安防已經延展到事后追查、事中防范響應、事前預防的全生命周期。目標
檢測、目標跟蹤和目標屬性提取等視頻結構化技術,以及海量數據管理、大規模分布式計算和數據挖掘等大數據技術已經取代傳統的人海戰術,實時分析視頻內容,探測異常信息,進行風險預測。視頻結構化技術可以通過識別目標并持續跟
蹤生成圖片結果,提取目標屬性歸納可視化特征;大數據技術則用于采集、存儲人工智能應用所涉及的全方位數據資源,并基于時間軸進行數據累積,開展特征匹配和模型仿真,輔助安防部門更快、更準地找到有效的資源,進行風險預測
和評估。
主要產品: 為避免社會不穩定事件頻頻發生的影響,各國對治安和安防的需求都在不斷上升,這對更高效、更精準、覆蓋面更廣的安防服務提出新的需求,公安、交通、樓宇這些代表性的行業都已開始積極利用基于人工智能的硬件及
定制化系統。智能公安管理系統匯總海量城市級信息,可對嫌疑人的信息進行實時分析,將犯罪嫌疑人的軌跡鎖定由原來的幾天縮短到幾分鐘,同時其強大的交互能力還能與辦案民警進行自然語言方式的溝通,真正成為辦案人員的專家助
手。智能交通管理系統實時掌握城市道路上通行車輛的軌跡信息、停車場的車輛信息以及小區的停車信息,預測交通流量變化和停車位數量變化,合理調配資源、疏導交通,提升整個城市的運行效率。智能樓宇管理系統綜合控制著建筑的
安防、能耗,對于進出大廈的人、車、物實現實時的跟蹤定位,監控大樓的能源消耗,使得大廈的運行效率最優。
典型企業:從提供的產品類型來看,智能安防領域的企業主要分為人工智能芯片、硬件和系統、軟件算法三大類別。在芯片領域,跨國巨頭企業占較高市場份額,如美國英偉達和英特爾。在硬件和系統領域,各國均以采購本國產品為主,
國內主要采購對象為海康威視、大華集團,海康具有深厚的技術積累和成規模的研發團隊,大華持續構建廣泛的營銷網絡;美國則有ADT、 DSC、 OPTEX等高端品牌占據了安防市場大部分份額。在軟件算法領域,美國谷歌、 Facebook、微軟開源代碼并提供整體解決方案,中國曠視科技、 商湯科技、云從科技等企業也在專注于技術創新研發。
6.3.5智能駕駛
智能駕駛通過車上搭載傳感器,感知周圍環境,通過算法的模型識別和計算,輔助汽車電子控制單元或直接輔助駕駛員做出決策,從而讓汽車行駛更加智能化,提升汽車駕駛的安全性和舒適性。根據智能化水平的不同, 同時參考SAE的評級標準, 可將智能駕駛由低到高分為五個級別,依次是駕駛支援、 部分自動化、有條件自動化、高度自動化、完全自動化。 在未來各國智能駕駛相關政策法規逐漸成型、行業內技術不斷完善、智能駕駛企業積極推動應用落地的情況下,智能駕駛產業規模將保持持續擴大趨勢,預計在2020年全球產業規模實現95億美元,我國會達到12億美元。
核心技術: 隨著汽車產業的成熟和普及,各城市交通擁堵愈發嚴重,汽車尾氣帶來的環境污染也逐漸影響了人們的生活環境和空氣質量,應用計算機視覺、深度學習和知識圖譜技術的智能化環保型駕駛方式為解決經濟問題和社會問題創造良機。 計算機視覺技術對周圍的交通環境,如本車在哪里、其它車在哪里、道路多寬、限速多少、現在是紅燈還是綠燈等進行識別;深度學習技術和知識圖譜構建理解、規劃、決策以及經驗,比如紅燈要停車、路口要減速、何時及
如何換道、當前加速還是減速等,同時按照時間順序更好地統籌安排車輛使用提高車輛的使用效率,減少車輛消費總量,有效減少碳排放;機器學習操控汽車,如方向盤是否轉到位、油門剎車檔位如何協調等。
主要產品: 智能駕駛核心依靠感知探測一定范圍內障礙物,并依據已設置好的路線規劃實施駕駛行為,各式車載雷達、傳感器、輔助駕駛系統和高精地圖可以實現駕駛、車和路的交互與融合。車載雷達可探測路肩、車輛、行人等的方
位、距離及移動速度,視覺傳感器用來識別車道線、停止線、交通信號燈、交通標志牌、行人及車輛等信息,定位傳感器用來實時獲取經緯度坐標、速度、加速度、航向角等高精度定位,車身傳感器通過整車網絡接口獲取諸如車速、輪速、檔位等車輛本身的信息,高級輔助駕駛系統(ADAS)實時收集車內外的環境數據以及時察覺潛在危險,高精度地圖實現地圖匹配、輔助環境感知、路徑規劃的作用。
典型企業:智能駕駛分為三層金字塔供應鏈格局,頂層包括整車及整體解決方案,中層是指高級輔助駕駛系統,底層是指零部件供應商。在整車及整體解決方案層級,科技型公司憑借在人工智能、人機交互方面的優勢搶占市場份額。特斯拉通過成熟硬件和機器學習打造智能駕駛商用化車型,谷歌則重點完善智能駕駛方案并向整車制造能力延伸。在高級輔助駕駛系統層級,供應商基本由跨國巨頭壟斷。德國博世在傳感器、自動駕駛、控制、軟件等領域共計擁有約 450項專利,美國德爾福則通過資本手段布局全產業鏈,以色列Mobileye 在攝像頭視覺系統領域占據國際領先地位。在底層零部件供應商層級,中國廠商比重日益增強,圍繞某些部件實現技術突破,打造細分市場龍頭,如四維圖新的車載芯片、
拓普集團的智能剎車系統 IBS、索菱股份的車載智能系統CID、寧波高發的 CAN 總線控制系統、興民智通的智能用車系統駕寶盒子、盛路通信的夜間駕駛輔助系統、車道偏移提醒系統、盲區檢測系統及萬安科技的電子制動產品等。
6.3.6智能搜索
智能搜索是結合了人工智能技術的新一代搜索,除了能提供傳統的快速檢索、 相關度排序等功能,還能提供用戶角色登記、用戶興趣自動識別、內容的語義理解、智能信息化過濾和推送等功能,具有信息服務的智能化、人性化特征,允許采用自然語言進行信息的檢索,為用戶提供更方便、更確切的搜索服務。
核心技術:在信息爆炸時代,用戶需要通過最短時間鎖定最有價值信息。為匹配用戶的請求,實現網絡資源快速檢索,搜索的方式和算法都有變化。 應用到搜索方式的主要技術有語音識別、圖像識別和文本識別, 改善搜索算法的技術則包括啟發式搜索算法、智能代理技術及自然語言查詢。 語音識別、圖像識別和文本識別可全方位識別搜索信息輸入屬性,提升搜索的便捷性和準確度。啟發式搜索算法、智能代理技術及自然語言查詢可根據相關度及用戶興趣的評價函
數選擇最匹配信息鏈接,自動地將用戶感興趣的、對用戶有用的信息提交給用戶,并引入用戶反饋來完善檢索機制,實現自然語言的信息檢索,為用戶提供更方便、更確切的搜索服務。
主要產品:隨著信息技術的迅速發展和互聯網的廣泛普及,網絡上信息量成幾何級數的增長,傳統的搜索引擎技術在日益龐大的信息量面前逐漸顯得力不從心,多樣化的搜索方式和更精準的搜索算法產品應運而生。淘淘搜和百度搜圖、聽歌識曲、高德地圖和百度地圖、墨跡天氣等產品,分別滿足用戶在圖像搜索、語音搜索、定位搜索、天氣搜索等場景的信息匹配和推送。出門問問、呱呱財經等產品則聚焦于垂直類智能搜索領域,實現用戶對某具體領域單點信息需求的充分篩選。
典型企業: 在提供智能搜索方式的企業中,阿里巴巴、百度從文本搜索延伸至圖像搜索,英國 Shazam、中國酷狗、網易、獵曲奇兵不斷提升語音搜索的準確率,百度、高德均推出基于定位搜索的高精地圖,墨跡風云科技公司專注天氣搜索成為移動端用戶量第一。在提供智能搜索算法的企業中,傳統搜索引擎巨頭升級為主,創新企業多聚焦垂直領域。科技巨頭如美國谷歌、 Wolfram Alpha、中國百度、雅虎、搜狐等專注技術驅動,創新企業如齊聚科技則側重服務驅動。
6.3.7智能教育
智能教育側重啟發與引導,關注學生個性化的教育和交互,學生能夠獲得實時反饋和自動化輔導,家長可以通過更為便捷和成本更低的方式看到孩子實時學習情況,老師能收獲更豐富的教學資源、學生個性化學習數據來實現因材施教,學校也能提供高質量的教育,政府則將更容易為所有人提供可負擔、更均衡的教育。自動化輔導優先通過搜題的應用取得爆發式增長,預計 2020 年全球智能教育產業規模可達 108 億美元,我國將接近 10 億美元。
核心技術: 智能教育建立在與學生充分的交互和數據獲取的基礎上,并在海量的教育數據中,匹配用戶的學習需求,最終能夠完成輔助教育和評估反饋,語音語義識別、圖像識別、知識圖譜和深度學習技術應用較多。語音語義識別、圖像識別實現了規模化的自動批改和個性化反饋;知識圖譜和深度學習技術搜集學生學習數據并完成自動化輔導和答疑,預測學生未來表現,智能化推薦最適合學生的內容,最終高效、顯著地提升學習效果。
主要產品: 對教師人力資源的過度依賴是教育行業問題根本所在,能夠輔助教育過程、提升教師效率,同時激發學生自主學習興趣的產品,率先得到市場的認可,目前相對成熟的產品有自動化輔導、智能測評和個性化學習。自動化輔
導可在兩秒內反饋出答案和解題思路,手寫的題目的識別正確率也已達到 70%以上,大幅提升學生的學習效率。智能測評不僅可以對用戶跟讀進行語音測評和指導,同時還能通過手寫文字識別、機器翻譯、作文自動評閱技術實現規模化閱
卷的作業測評。個性化學習基于學習行為的數據分析,推薦適合學生水平的學習內容。
典型企業:從事自動化輔導和個性化學習的企業均聚焦單一產品功能和教育區間,目前主要通過融資方式持續補貼用戶提升獲客能力。美國的 Volley 和中國的猿題庫、作業幫、學霸君和阿凡題聚焦 K12 教育的題庫輔導和答疑,均推出拍照搜題完成題庫答疑或老師答疑,中國郎播網、英語流利說和多鄰國等側重語言輔導,美國 Newsela、 LightSail 等建立閱讀數據庫個性化提供閱讀材料。智能測評企業主要集中在英語科目,如中國科大訊飛以智能語音技術為核心推出智能閱卷系統,批改網和美國 LightSide 通過數據庫匹配完成文本測評。
6.3.8智能人居
智能人居以家庭住宅為平臺,基于物聯網技術和云計算平臺構建由智能家居生態圈,涵蓋智能冰箱、智能電視、智能空調等智能家電,智能音箱、智能手表等智能硬件,智能窗簾、 智能衣柜、 智能衛浴等智能家居, 智能人居環境管理等諸多方面,可實現遠程控制設備、設備間互聯互通、設備自我學習等功能,并通過收集、分析用戶行為數據,為用戶提供個性化生活服務,使家居生活安全、舒適、節能、高效、便捷。
核心技術:隨著移動互聯網技術的大規模普及應用,為人們精細化掌控人居環境質量與模式提供了基礎支撐,人工智能技術的持續發展,又進一步促使人居環境中的管理、輔助、通信、服務、信息獲取等功能再次實現智能化的組合優
化,以達到借助科技手段管理生活方式的目的。在此背景下,傳感器技術、無線及近場通訊設備、物聯網技術、深度學習、大數據及云計算技術得到較多應用。傳感器和通訊設備對人居環境進行監測形成的數據流,會通過云計算和深度學習建立相應模型,再依托家用物聯網對室內的電器設備乃至整個建筑的實時控制,將模型對應的參數和狀態優化方案反饋到人居環境中,為人居生活的計劃、管理、服務、支付等方面提供支持。
主要產品: 隨著技術的進步、人均收入的提升和對舒適生活環境的追求,人們需要的不僅是具備傳統的居住功能的住宅,同時也需要兼備智能監測、環境控制、信息交互等全方位感知功能的智能居住環境。智能家居作為終端首先備受
市場關注,具有通信功能的家用智能硬件及設備在大數據和云計算技術的支持下,能夠完成遠程控制、網絡通信、防盜報警等較為復雜的任務。智能人居管理系統是以搭載大量移動互聯網應用為基礎,實現人居環境智能化改造,如生成家庭裝潢設計與家具擺放設計,通過天氣數據、已有服裝數據、所處場合的風格自動生成穿衣指南,或者通過人工助手借助語音識別、語義分析等技術,滿足人類在生活中的一些日常即時需求。
典型企業: 具備智能人居解決方案提供能力的龍頭企業眾多,可大致分為傳統家電廠商、智能硬件廠商、互聯網電商及創新企業,各家布局方式互不相同。海爾、美的聚焦智能家居終端,小米側重于面向眾多開發者提供硬件開放式接
口,華為致力于提供軟硬件一體化樓宇級解決方案,京東通過輕資產、互聯網化的運營模式號召合作伙伴加入其線上平臺和供應鏈,國安瑞通過數據挖掘提供覆蓋操作終端硬件、系統智能云平臺、建筑智能設備的閉環解決方案提升室內人
居感受。
結束語:目前深度學習、圖像視頻識別、語音識別和文本識別在智能領域應用范圍非常廣泛,市場潛力巨大,率先成為資本競相追逐的對象。深度學習算法成為推動人工智能發展的焦點,相繼在圖片識別、機器翻譯、語音識別、決策助手、生物特征識別等領域實現了創新突破。掌握上述技術的領先優勢的企業,必然在未來人工智能領域占領一席之地。