姓名:周可兒 學號:22021211973 學院:電子工程學院
轉載自:https://new.qq.com/rain/a/20221226A06LIE00
【嵌牛導讀】ChatGPT的出現,更是讓人看到了AI工程能力的又一次進化。
【嵌牛鼻子】人工智能產業 通用AI 自然的語言交互
【嵌牛提問】ChatGPT崛起背后:人工智能踏上“通用與工程化”之路?
【嵌牛正文】
2022年末,ChatGPT橫空出世,讓人工智能產業再起漣漪。
人工智能(Artificial Intelligence,簡稱“AI”)誕生于1956年,至今已六十余年。在漫長的歲月中,一些新技術或新方法的出現,給AI產業帶來過樂觀浪潮,但隨之而出現的,則是數次AI寒冬。
如同任何新興事物一樣,人工智能的發展沒有一蹴而就,而是歷經坎坷和挫折。直到近十年,得益于深度學習算法的突破,以及算力提升和大數據的積累,人工智能才真正迎來從實驗室研究走向產業實踐的黃金時代。
2016年,谷歌AlphaGo與人類圍棋冠軍李世石進行的人機大戰,讓AI走向社會舞臺中央,同時,也推動了AI商業浪潮的來臨。
過去五年,人工智能與千行百業加速融合,其價值在很多場景得到釋放,并催生出一大批AI公司或團隊。然而,在產業實踐過程中,AI也面臨新的瓶頸:解決單一場景問題,AI的能力毋庸置疑,但如何復用解決更多場景的問題,成為很多AI公司盈利的掣肘。
而AI工程化,是解決這一問題的重要手段。此前,Gartner已連續兩年把AI工程列為年度戰略技術趨勢之一。在Gartner看來,AI工程化是AI大規模發展的必經之路。因為任何行業或企業,只要有場景、數據和算力,都可以落地AI應用,但落地效率、周期會遠超預期。
因此,AI要成為企業的生產力,就必須以工程化的技術來解決模型開發、訓練、預測等全鏈路生命周期的問題。所以在2022年,AI工程化成為AI行業的一個關鍵詞。
ChatGPT走入大眾
以ChatGPT為例,它其實也是AI工程化的產物。一位AI領域專家告訴21世紀經濟報道記者,AI工程化的過程包括需求分析、模型設計、模型訓練、模型部署等環節。
其中,在需求分析階段,需要明確人工智能技術應用的目標和需求。比如OpenAI開發ChatGPT,其目的就是滿足人們對自然語言處理技術的需求,希望通過自然語言交互的方式給人們提供幫助。
而在模型設計階段,需要根據需求分析的結果,設計合適的模型來解決問題。就像ChatGPT其實是一種被稱Assistant的大型語言模型,為了讓它能夠理解和回答用戶的問題,并生成用戶可讀的回復,OpenAI選擇用Transformer深度學習模型進行訓練。
在訓練過程中,則需要通過訓練大量的文本數據,讓模型學習如何對話。它需要先識別用戶輸入文本中的語法、語義和結構,更難的則是要學會如何生成更像是人類回復的文本。
“ChatGPT能實現目前這樣自然的語言交互,與過去幾年AI產業在算法、算力、數據等方面的不斷突破密切相關,但光有技術上的創新還不夠,人們能夠如此便捷的體驗到ChatGPT,則是AI工程化的功勞”,該AI領域專家表示。
其實早在2020年,OpenAI就推出過大型語言生成模型GPT-3(Generative Pre-training Transformer 3),其訓練參數量達到1750,在當時,這已是世界之最。
雖然都是使用深度學習技術開發的大型語言模型,但GPT-3比ChatGPT要更大,訓練數據也更多,所以GPT-3的能力要強于ChatGPT。然而,GPT-3的能力只能通過API的形式開放給外界,這也讓很多普通用戶無法體驗到GPT-3的強大。
而ChatGPT在定位上,就是一款To C產品,上線僅5天,便吸引了超過100萬用戶。而且它給社會帶來的震撼,要遠超AlphaGo,畢竟相比只能遠觀AlphaGo,現在人們可以直接與ChatGPT對話,感受AI的魔力。
對業界來說,ChatGPT的出現,更是讓人看到了AI工程能力的又一次進化。真格基金管理合伙人戴雨森當時便表示,“從ChatGPT中,我看到新一代的AI技術隨著不同組件走向成熟,已經進入樂高化模塊化的趨勢。這意味著迭代速度會越來越快,原來需要單獨開發的部分變成了公用的、可復用、可調用的組件。”
規模與效率
在產業界,AI工程化則帶來了更直接的經濟效益。
近日,阿里巴巴集團副總裁、AI科學家賈揚清提出,工程化和開源是AI普惠最重要的兩大支撐。而實現AI工程化的關鍵,是要提升三個效率:通過云原生的計算,提升計算效率;通過標準研發范式,提升研發效率;通過大數據AI一體,提升數據應用效率”。
賈揚清以阿里達摩院上云為例稱,通過一個云原生的AI平臺PAI,就支撐算法團隊從規模、效率和易用性上面不斷突破。在規模上,可以支撐10萬億參數的預訓練大模型,在效率上,通過AI開放服務平臺OpenMind則可以服務日均1萬億次左右的調用。
借助AI工程化體系,阿里云服務了非常多云上的客戶,而騰訊云,也憑借AI工程化解決了規模化的難題。
2021年初,騰訊云幫助上海富馳高科技股份有限公司(簡稱“富馳高科”)解決了一個大問題。作為一家金屬粉末注射成型(MIM)產品專業制造商,如何提高質檢效率,一直困擾著富馳高科。
過去,富馳高科的質檢工作主要是由人工完成,這并非它不愿意使用自動化手段,而是市面上幾乎沒有能夠滿足其質檢需求的方案。后來,騰訊云研發團隊經過半年的艱苦攻堅,成功敲開了工業質檢的大門。
但是,讓騰訊云副總裁、騰訊云智能研發負責人、優圖實驗室研發負責人吳永堅頭疼的是,做完富馳高科項目后,該如何把AI質檢能力復制到更多項目中。吳永堅告訴21世紀經濟報道,“如果每個項目都要像在富馳高科這樣投入,那成本方面,騰訊云承擔不起”。
在又做了幾個項目之后,騰訊云終于找到了可行辦法。“我們拆解算法里的每一個流程,精細到每一步明確要做什么,然后將其沉淀到騰訊云AI開發服務平臺——TI平臺上,最終形成了一個面向工業質檢場景的產品化平臺”,吳永堅說。
今年,生產3C產品金屬結構件的立鎧精密也成為騰訊云的工業質檢客戶。相比富馳高科,立鎧精密的產品種類更多,涉及的工藝也更復雜,但在服務立鎧精密時,吳永堅覺得容易了很多。
“當初我們還需要派大量算法工程師去富馳高科駐場辦公,但現在,只需在項目前期派少量算法人員過去,其余大部分工作都可以在TI平臺上完成,效率提高非常多”,吳永堅說。
這種轉變,就是AI工程化價值的體現。現在,面對不同的質檢場景,騰訊云都可以通過工業質檢訓練平臺來提供解決方案,這背后,依靠的已不僅僅是算法團隊,而是需要工程、產品、數據運營等團隊共同支撐,進行的是一種體系化建設。
奔向通用AI
中國信通院今年發布的《人工智能白皮書(2022)》(以下簡稱“白皮書”)指出,未來,人工智能除了重視技術創新以外,還會更加關注工程實踐和可信安全,這也構成了新的“三維”發展坐標,牽引人工智能技術產業邁向新的階段。
其中,工程實踐能力正成為釋放人工智能技術紅利的重要支撐。白皮書提到,AI行業在工程實踐方面的努力,最早可追溯至Caffe、TensorFlow、PaddlePaddle等開源框架的誕生,通過屏蔽底層硬件和操作系統細節,大幅降低模型開發和部署難度,有效推動了人工智能技術的擴散。
而當前,人工智能與云計算、大數據等技術的融合不斷深入,圍繞著數據處理、模型訓練、部署運營和安全監測等各環節的工具鏈不斷豐富,也使得人工智能研發管理體系日益完善。
白皮書認為,隨著工程實踐能力的不斷提升,“小作坊、項目制”的AI賦能方式正在成為歷史,未來將會更加便捷、高效地實現人工資高就能落地應用和產品交付。
具體而言,AI工程化主要聚焦于工具體系、開發流程、模型管理全生命流程的高效耦合。在工具體系層面,體系化與開放化成為研發平臺技術工具鏈的發展特點;開發流程方面,工程化關注AI模型開發的生命流程,追求高效且標準化的持續生產、持續交付和持續部署。
而模型管理方面,隨著企業智能化應用的逐步加深,模型種類和數量大幅增長,企業需要建設對模型生命周期的管理機制,并對模型的版本歷程、性能表現、相關數據、衍生的模型檔案等進行標準化的管理運維。
所以接下來,AI企業能否快速賦能各行各業,響應多樣化需求,關鍵因素就在于企業的工程化能力。
另一方面,通用人工智能(AGI,Artificial General Intelligence)作為AI領域的終極目標,實現的過程也需要依靠AI工程化能力。雖然目前距離實現真正的通用人工智能還有很長一段距離,但是,在一些特定場景下的通用AI,已經出現。
比如ChatGPT,便是一種自然語言處理的通用AI模型,因為它可以回答覆蓋各種領域的問題,而不是專門針對某一個領域設計的模型。
目前,在很多領域人工智能已經趕上甚至超過人類水平,比如語言理解、語音識別、視覺識別等。當人們能夠借助AI工程化能力,把這些AI技術規模化應用到諸如工業質檢、機器人等產業當中時,將大幅提升人類的工作效率和質量,而這,也是人工智能產業致力于實現的目標。