ChatGPT 是美國人工智能研究實驗室 OpenAI 開發的一種全新聊天機器人模型,能夠通過學習和理解人類的語言來進行對話,還能根據聊天的上下文進行互動,支持回答問題、承認錯誤、質疑并拒絕不適當的請求等情境。
中國信息通信研究院聯合中國人工智能產業發展聯盟對 ChatGPT 進行的測試顯示,ChatGPT 在百科檢索、數學問答、文學交流、常識問答、知識推理等對話任務上的意圖識別率均達到 98% 左右,在生活閑聊上的意圖識別率約為 95%,已具備較好的語義理解能力。
但在對穩定性和可靠性要求極高的工業領域,ChatGPT能否代替知識圖譜技術,讓我來一一給你拆解。
1.ChatGPT的本質是什么?
要想把ChatGPT的本質講清楚,就需要把ChatGPT的底層技術,也就是語言模型說明白。什么是語言模型?顧名思義,就是對人類的語言建立數學模型。這里面最重要的關鍵詞是“數學”。語言模型不是邏輯框架,不是生物學的反饋系統,而是由數學公式構建的模型。
因為這是一條捷徑。我們想讓計算機理解自然語言,讓計算機回答問題,或者進行幾種語言之間的翻譯,第一反應會是,應該讓計算機理解人的語言,讓它學會語法……但是人們經過很多次嘗試,都失敗了,或者說至少到今天還沒有做到。而換個思路,如果想辦法把這些問題變成數學問題,然后通過計算,就能間接解決這些自然語言處理的問題。于是,語言模型的想法就被提出來了。
最初提出語言模型概念的是賈里尼克博士。1972年,他在IBM負責解決語音識別這個課題,也就是讓計算機把人說的話識別出來。他采用的方法很特別,不是從語音學和語言學入手研究這個問題。而是采用統計學的方法來解決。怎么說呢?
比如,你傳輸一句話,“中國是一個古老的國家”。在傳輸前要對它進行編碼,比如編成010101111000…...但是,傳輸中一定會有噪音和信號損失,接收方接收到的編碼可能是1010111000…...這樣就翻譯不回原來的句子了。
那怎么辦呢?我們可以把和接收到的編碼相似的句子都列舉出來。比如:
國中是一個古老的國家
中國是一個古老的國家
國是一個古老的國家
中國一個古老的國
等等。
計算機如何來確認是哪個句子呢?他的方法是做統計學的計算。?讓計算機計算出哪一種可能的語句概率最大。這種計算自然語言每個句子概率的數學模型,就是語言模型。好,到這里你就明白了,ChatGPT的本質是語言模型,就是對人類的語言建立數學模型。
今天,ChatGPT的語言模型所用的訓練數據量是很大的,第一個版本使用的GPT-3用了大約5000億個詞,換算成句子大約是500億個。GPT-4因為模型規模增加了將近一個數量級,訓練數據可能增幅更大了。
2.ChatGPT的回答從哪里來?
我們使用ChatGPT這種語言模型來回答問題的時候,都會發現通常答案都比問題來得長,而且會補上額外的信息,這是如何做到的呢?
在英語中,問題通常都是用一個疑問詞開頭,而所有的疑問詞都由W和H開頭,它們也被稱為WH單詞,包括“是什么”(What),“為什么”(Why),“是誰”(Who),“在什么時候”(When),“在哪里”(Where),“哪一個”(Which),以及“怎么做”(How)。
回答簡單問題
對計算機來說,除了“為什么”和“怎么做”的問題屬于復雜問題,其他問題都屬于簡單問題。
比如現在2023年,你問ChatGPT美國總統是誰,它會很快告訴你是拜登。這是有明確答案的。這類問題,計算機根據疑問詞和主題詞就能理解了,比如這個問題的主題詞是“美國總統”,疑問詞是“是誰”,再去統計網上關于這個問題的答案,就可以建立一個關于美國總統的語義框架,或者說知識框架。
利用語言模型回答問題,不是一個問題對一個答案這樣簡單的匹配,而是對于問題給出多個答案,然后根據答案的概率排序,返回一個最可能的答案。比如過去的媒體上還有“美國總統特朗普”“美國總統布什”這樣的信息,它們也會被統計進去。但是今天的語言模型都很聰明,它們會給最近的內容賦予較高的權重。最后你得到的答案,就會是當前美國總統的名字。當然,如果正好趕在換屆時,數據還沒有更新,給出的答案就可能出錯。
回答復雜問題
對于這類問題,計算機的做法和人有很大的不同。
人遇到這種問題時,有三種途徑能夠回答。
第一,你知道答案,直接給出。這種做法,計算機也采用。
比如答案就在某個問答網站內。過去計算機采用網頁搜索,把那個網頁提供出來。今天ChatGPT則是把相應的一段話抽取出來。
為什么今天和過去采用的做法不同呢?原因有兩個。一個是過去計算機對文本進行摘要的能力不夠,二是過去的搜索其實很少分析句子的語義,不確定用戶的問題和問答網站上的問題是否一致。
比如你問“為什么最近蘋果的股票不漲”,網頁給你一個三個月前的網頁,分析“為什么蘋果的股票在漲”,因為這里面主要的關鍵詞都能匹配上。你遇到這種情況會哭笑不得,覺得搜索質量很差。今天ChatGPT足夠強大,大部分時候不會犯這樣明顯的錯誤。
我們回答復雜問題的第二種情況是,你不知道答案,但是你懂得找到答案的基本知識,于是你利用你的基本知識推出了答案。
比如當有人問你天為什么是藍色的,你學了中學物理,知道太陽光是由七色光構成的,不同顏色的光折射率不同。同時你還能活學活用,想到陽光進入大氣層時因為折射率不同會發生散射,導致天空顯得是藍色的。
但是,計算機其實沒有這個能力。硅谷的幾家著名公司,對ChatGPT進行了全面的測試,發現它回答小學常識課(美國叫自然課)的問題,正確率還不到60%。為什么呢?因為這部分問題很少在網絡上被討論,或者網絡上沒有靠譜的答案,而ChatGPT沒有辦法像人那樣運用知識去尋找答案,只能從現成的答案里歸納總結。
人類解決復雜問題的第三種情況是,你不知道答案,而現有的知識也無法直接推導出答案,需要你做研究工作。
比如這幾年疫情,市面上能找到幾十種口罩,有些管用,有些不管用,有些雖然管用但是效果有限,到底哪種才靠譜?雖然你能夠在互聯網上找到一些這方面的內容,其實一大半都是過時的,甚至是想當然的、錯誤的。過去從來沒有人對所有的口罩進行對比研究。這個看似并不復雜的問題,其實并沒有好的答案。
2020年,斯坦福大學材料學專家崔屹教授的團隊進行了全面的研究,徹底回答了這個問題。比如他們發現,真正能夠有效過濾新冠病毒的口罩,是靠口罩纖維上的靜電力把病毒吸附在口罩上,讓它無法進入口鼻,而不是用纖維網把病毒擋住。他們還發現,纖維越細的口罩,防護效果越好,纖維粗的反而防護效果差,這和人們的直觀感覺有很大的差異。后來諾貝爾獎得主朱棣文教授給了一個合理的解釋,就是靜電場和纖維直徑的平方成反比,纖維粗的口罩的吸附能力弱。這項研究還有很多發現,比如口罩一旦沾染了潮氣,防護力基本上就喪失了。基于這項研究的綜述論文發表之后,得到了廣泛引用。
你看,對于這樣的問題,人類是需要通過實驗和探索發現新知,而且更正過去認識錯誤的。這顯然也是ChatGPT做不到的。
ChatGPT如何工作
那么ChatGPT的答案從哪里來呢?簡而言之,回答問題也好、寫作短文也好,都基于它對現有事實的抽取和整合,或者說歸納總結。
說到這里,我就要開始講知識圖譜了。Google曾經收購了一家專門構建知識圖譜的小公司,那家小公司完成了對上百萬個知識點的總結,并且構建出它們之間的相互關系。在對上萬億語句進行分析后,這個知識圖譜得到了很大的補充。后來,負責Google知識圖譜的副總裁到了蘋果,是今天蘋果Siri的負責人。蘋果的Siri其實背后也有一個知識圖譜。ChatGPT背后也一樣,雖然它沒有公布如何利用各種知識,但是它下載了整個維基百科,而維基百科有一個現成的知識圖譜。
當人們在問答系統中提一個問題后,問答系統會首先在知識圖譜中尋找可能答案。對于我們前面講到的簡單問題,只要問題靠譜,答案通常都能直接找到。
但是對于復雜問題,有些可以通過知識圖譜中的幾個相關聯的知識點回答,但大部分就不行了,于是需要回到提供知識的原始網頁中去尋找答案。這個過程其實是一個逆向思維的過程,和人的思維方式不太一樣。
比如我現在問一個復雜問題,計算機就會去找到幾十上百個可能包含答案的文章,然后從這些文章中提取一些語句,構成可能的答案。當然,為了讓這些句子湊在一起看上去像是一個有邏輯的、連貫的回答,就需要使用語言模型了。
換句話說,這些候選的文章里有了原材料,而語言模型是一個廚師,將它做成一道菜。如果語言模型質量不高,提供的答案就是幾個事實的堆砌,讓人看了覺得毫無連貫性可言。ChatGPT之所以比之前的問答系統做得好,并不是它的原材料更多,而是菜做得更精致。
3.什么是知識圖譜?
知識圖譜就是描述真實世界存在的實體,并且和這些實體之間的一些關系,它與互聯網不同的點在于,我們都知道互聯網是網頁跟網頁之間的相互連接,實際上是通過字符串連接的。但是在知識圖譜,實體是通過語義關系來進行關聯的,這些實體都是具有現實的物理存在的一些意義的。
比如說以工業場景為例,我們可以把公司的這些人物、設備,或者是具體的一家公司,公司的各種產品,把它看做實體。這些實體之間天然的關系,比如說公司跟人員之間有這種雇傭的關系,公司跟地理位置之間有這種位移的關系,以及和產品的使用關系和生產關系等等,我們可以通過實體和它的語義關系形成一張知識圖譜。可以說知識圖譜,如果我們從學術角度來看的話,它就是一種語義網絡,是大數據和AI時代知識表示的重要方式之一。 然后從這個技術角度來說的話,知識圖譜是一個技術,是一門技術體系,它是大數據與AI時代知識工程的一個代表性的進展。
4.知識圖譜與智能問答
知識圖譜與智能問答其實是兩個相關的概念,它們都在人工智能領域中扮演著重要的角色。
知識圖譜是以圖形結構表示的知識庫,它包含了實體、屬性和實體之間的關系。通過對大量的數據進行加工、處理和整合,知識圖譜能夠將復雜的信息轉化為簡單、清晰的三元組形式,從而實現知識的快速響應和推理。知識圖譜的構建需要從實體維度和短句維度進行挖掘,通過獲取大量數據并進行挖掘、標注和清洗,定義實體之間的關系。
智能問答系統是一種能夠接受用戶自然語言形式提問并給出準確答案的系統。它通過對問題進行語義分析、知識檢索和答案生成等步驟來實現。在智能問答系統的整體基礎框架中,包括預處理模塊、問句分析、知識檢索和答案生成等部分。基于知識圖譜的智能問答系統(KBQA)是一種常見的技術路線,它利用知識圖譜中的數據進行問題的解析和查詢,從而得到準確的答案。
知識圖譜與智能問答系統的結合可以提高問答系統的準確性和效率。通過利用知識圖譜中的豐富知識和關系,智能問答系統能夠更好地理解用戶的問題,并給出更準確的答案。同時,知識圖譜也可以為智能問答系統提供更多的背景知識和上下文信息,從而提升系統的智能化水平。
5.在工業智能問答領域,大語言模型ChatGPT能否替代知識圖譜技術?
這也是近期在知識圖譜技術領域,引發討論最多的一個問題。由于ChatGPT在語言理解和知識問答方面的優異表現,大語言模型被認為具備記憶和應用世界知識(world knowledge)的能力,這就使得有一些觀點認為另外一種世界知識的表示和推理模型知識圖譜(Knowledge Graph)將要被以ChatGPT為代表的大語言模型所取代。有沒有這種可能,我們先說應用趨勢,再說應用挑戰。
應用趨勢
ChatGPT作為一種基于深度學習技術的大語言模型,具有強大的自然語言處理和生成能力。它可以快速處理和生成文本,對于自然語言處理方面表現出色。許多企業也開始嘗試將ChatGPT引入工業制造領域,例如西門子與微軟合作,將ChatGPT運用在工業領域,借助 ChatGPT 以及其它 Azure AI 服務來增強西門子的工業自動化工程解決方案,包括工程設計團隊如何使用自然語言輸入生成 PLC 代碼,從而減少時間成本并降低錯誤率。國內的汽車廠商長安汽車也宣布,旗下車型長安逸達將作為國內首款搭載“文心一言”的量產車型。“文心一言”集成了車輛的使用和維護知識,將車輛故障和維保知識建立圖譜,變成專有的“車輛數字助手”。
另外,專注于智能文本處理技術的公司“達觀數據”,旗下的產品—達觀智能知識管理系統(KWS),也融合了大語言模型與智能制造的先進技術,為工業制造領域提供集中、高效、智能的知識管理平臺。其產品的自動化知識生產、組織和搜索功能,結合深度的系統整合能力,幫助工業制造企業在生產計劃、質量管理、設備維護和供應鏈管理等關鍵業務場景中發揮重要價值。
應用挑戰
說完了,大模型在工業領域的應用趨勢與案例,我們再來說說應用挑戰。盡管ChatGPT在回答問題方面表現出色,亦有行業案例落地。但在工業知識問答中仍存在以下挑戰:
(1)數據量和質量
工業領域的知識通常龐大而復雜,需要大量高質量的數據來訓練大模型。然而,獲取和整理這些數據可能是一項艱巨的任務,因為它們可能分散在各種來源和格式中。拿電力行業的數據舉例:輸電線路的數據既存在非結構化數據(歷年故障文檔)、又有半結構化數據(線下存儲的Excel格式的文檔或者規范化的文本數據)、結構化數據(設備臺賬數據)。
(2)領域專業性
工業領域的知識通常需要特定的專業知識和背景才能理解和回答。大模型可能無法涵蓋所有領域的專業知識,因此在回答特定領域的問題時存在局限性。
以制造工藝為例,雖然知識的通常來源有領域論文和書籍,企業或組織機構積累的工藝設計手冊、工程規范標準、專家經驗知識等,看起來很類似。但事實上,新能源電池的制造工藝、煉油廠的煉油工藝和晶圓廠的半導體制造工藝大相徑庭。煉油廠的工程師可能無法理解制膠、勻漿、涂布、卷繞、烘烤、注液、噴碼、X射線檢測等鋰電池制造工藝及其內涵。反之,鋰電池企業的工程師則可能無法理解什么是常壓蒸餾、減壓蒸餾、催化、裂化、焦化、催化重整、提升管、沉降器、胺液回收器、再生器、吸收塔、穩定塔、抽提塔、緩沖塔、砂濾塔、空壓機、凝縮油罐、脫硫吸附罐、水洗罐、預堿洗罐、固定床、沸騰床、懸浮床等煉油工藝。
而不管是煉油廠的工程師,還是鋰電池企業的工程師,可能都不懂硅料提純、晶體生長、整型、切片、拋光、化學機械研磨、化學氣相沉積、介質沉積、蝕刻、離子注入、表面鈍化、摻雜阻擋層、曝光、顯影、薄膜沉積、烘烤、干涉位移測量、物理氣相沉積等半導體制造工藝。特別的,鋰離子電池制造和晶圓制造都有“烘烤”工藝,而其表達的知識卻有著天壤之別,工藝內容、方法、使用的設備等都完全不同。這些專業的知識及從業務出發所構建的各種專業模型,大模型很難完全涵蓋,尤其芯片制造、化工等工業領域涉及到上下游產品、原料供應鏈的知識往往是跨學科的。
(3)知識更新和變化
大語言模型在知識更新方面的能力一直被詬病,比如說ChatGPT剛剛出來的時候,只能回答2021年之前的知識類問題,因為ChatGPT沒有采用2021年之后的數據進行訓練,
工業領域的知識通常會隨著時間的推移而發展和變化。大模型可能無法及時跟蹤最新的知識更新,導致回答過時或不準確的問題。
舉一個例子,假設有一個工業知識問答系統,用戶詢問關于某種新型材料的性能和應用。由于該材料是最近才被開發出來的,相關的研究和應用可能還沒有被廣泛報道或整理成為結構化的知識。在這種情況下,傳統的搜索結果可能無法提供準確和詳盡的答案。
而要使用新的數據訓練成本非常高。跟知識圖譜采取圖操作相比,對大語言模型進行更新需要耗費大量的服務器資源,如果是頻繁更新,大語言模型付出的代價會遠遠超過知識圖譜。舉個例子,戰勝李世石的那一版AlphaGo,消耗的能量是一棟十幾層辦公大樓的耗電量。而參數量1750億,預訓練數據量45TB的GPT-3,據Semianalysis估算,ChatGPT一次性訓練費用就達8.4億美元。
(4)解釋性和可信度
大模型生成的答案通常是基于統計模式和訓練數據的,可能缺乏解釋性和可信度。在工業領域,解釋性和可信度對于決策和問題解決非常重要。
舉個例子,假設有一個工業知識問答系統,用戶詢問:“為什么某個產品的生產成本上升了?”如果使用大模型回答,可能會得到一個簡單的答案,如“可能是原材料價格上漲導致的”。然而,這個答案缺乏解釋性和可信度,無法提供更深入的理解。
而一個基于知識圖譜的工業知識問答系統可能會提供更具解釋性和可信度的答案。它可以通過查詢知識圖譜中的相關信息,解釋生產成本上升的原因,如原材料價格上漲、勞動力成本增加、能源價格上漲等。同時,知識圖譜可以提供支持答案的具體數據和來源,增加答案的可信度。
總結來說,大模型在工業知識問答領域的挑戰在于問題的復雜性、知識更新速度、以及工業領域要求可解釋性和可信度。
6.知識圖譜與大模型雙知識平臺的融合
既然知識圖譜和大型語言模型都是用來表示和處理知識的手段。大模型補足了理解語言的能力,知識圖譜則豐富了表示知識的方式,兩者的深度結合必將為人工智能提供更為全面、可靠、可控的知識處理方法。
在東南大學漆桂林:知識圖譜和大語言模型的共存之道這篇文章中,東南大學漆桂林教授、南京柯基數據科技有限公司楊成彪(CTO)和吳剛(CEO)為我們分享了“知識圖譜和大語言模型的共存之道”。文中列舉了知識圖譜和大語言模型作為知識庫的優缺點,提出知識圖譜和大語言模型雙知識平臺融合的理念,以及如何應用雙平臺協同完成復雜知識處理任務。
上圖是知識圖譜和大語言模型融合的雙知識服務平臺架構。從這個架構中我們可以清晰地看出大語言模型跟知識圖譜的核心技術具有驚人的相似性:大語言模型的預訓練跟知識圖譜的知識建模相似,都需要人工整理和理解數據,但是也可以通過某種自動化方式提升效率;監督微調跟知識抽取對應,都是用于從數據中提取知識,只不過大語言模型利用微調提取的知識存儲與神經網絡;大語言模型跟知識圖譜一樣需要做知識更新和融合,大語言模型的推理對應于知識圖譜的知識計算。另外,大模型和知識圖譜都需要考慮知識管理,而且都需要考慮知識眾包、知識質量評估、知識鏈接等。
從上圖還可以看出,知識圖譜構建成本可以通過大語言模型得到極大的降低,大語言模型可以提升知識自動建模的效率,可以為知識抽取生成標注數據,利用大語言模型的知識理解能力,可以設計通用信息抽取方法,利用一個模型抽取實體、關系、屬性值、事件,大語言模型還可以做零樣本知識生成,利用通用信息抽取得到的三元組,通過人工校對形成大標注數據還可以用于訓練監督模型,大語言模型可以有助于提升知識融合的自動化,并且大模型可以有助于知識圖譜的知識表示學習。另外,知識圖譜可以為大語言模型提供語料生成,Prompt增強和推理增強。
總結:大語言模型作為一個知識庫。它的知識質量可能存在一定的問題。它的問答精確度可能也不夠高。還存在不可解釋性的問題。為了解決這些問題,將知識圖譜和大語言模型結合起來是一個很好的方向。知識圖譜作為一種符號化的知識表示方式,可以提供結構化的、可解釋的知識。通過將知識圖譜和大語言模型融合,可以充分發揮兩者的優勢,擁有無限的想象空間。這將使人工智能進入真正的大知識時代。
7.多談一點:行業知識圖譜應用價值及關鍵點
對于工業制造領域的企業或其內部某個團隊來說,知識圖譜是一個新鮮事物,對其不甚了解,因此對是否引入知識圖譜技術存有疑慮,筆者在與傳統制造業的生產部門及信息化部門的同行交流過程中,發現他們最關心的是投入產出比,也就是如何衡量其價值。在這篇文章的最后,我也想多談一點:行業知識圖譜的應用價值及關鍵點。?
1. 工程師賦能,提升效率
知識圖譜行業應用的最直接的價值是為知識型的勞動者和工程師賦能,提高工作效率。通常體現在以下兩個方面。
(1)替代
即代替部分勞動者和工程師做一些較為復雜的、專業的、知識型的工作。替代所帶來的價值體現為以下三個方面。
·工作量的減少帶來直接收益,這部分被解放出來的高端人力可以完成其他更具創造性的工作,比如創新型的探索、系統性的方案設計、根本性原因機理的深究,等等。
·通常來說,重復相同的或相似的工作的時間會縮短,從而帶來產品競爭力或服務美譽度的提升,并因此為企業或組織機構帶來收益。
·質量、準確率等的提升,以及由此帶來的產品或服務溢價。
比如,某財務審計公司基于會計準則和財務審核規則構建審計知識圖譜,并依據公司過去若干年積累的審計經驗開發了專門自動審核模型,經過較為嚴格的測試后,能夠保證審核通過的部分是滿足監管要求的。這樣,審計知識圖譜的應用能為該公司帶來以下好處。
·節省專業的審計工作量,審計人員專注于解決沒有通過自動審計的部分內容,從而提升審計質量。
·縮短審計周期,提升了響應效率,為該公司帶來了大量的新客戶。
·因審計質量和響應效率的提升,從而能夠服務更多要求更高的客戶,因此帶來項目價格的提升。
(2)輔助
即借助可視化和交互式分析技術實現人機的高效協同。也就是說,在行業知識圖譜的幫助下,工程師或知識型勞動者能夠更為便捷地獲取知識,降低工作門檻,提升工作的質量和效率,并因此給企業帶來價值,主要體現在以下三個方面。
·很多知識型工作要求工程師或勞動者具備豐富的經驗,但這并不容易,不僅要求企業或組織機構付出更高的成本,在某些情況下甚至很難招聘到合適的人才,通過應用行業知識圖譜能夠有效降低門檻,并由此帶來價值。
·在實際工作中,即便非常資深的專家也常常遇到力有不逮的情況,應用行業知識圖譜能夠幫助這些資深專家完善知識體系,減少遇到力有不逮的情形,并由此帶來相應的價值。
·基于行業知識圖譜開發專業的輔助工具,并借此來規范所提供的服務,提升工作質量,從而帶來更高的用戶友好性,由此帶來價值。
在企業中,利用知識圖譜輔助工程師、客服人員或員工是常見的做法。比如銀行的客服中心,基于業務知識圖譜開發客服輔助工具,能夠大幅提升客服人員對業務的熟悉程度,提升客服解決問題的效率,并由此帶給企業以下兩個方面的價值。
·效率提升帶來的接通率提高或者人員減少所對應的價值。
·客戶好感度上升帶來的黏性和美譽度所對應的價值。
在實踐中,通過行業知識圖譜為企業員工、組織機構的成員或其上游供應商、下游客戶進行賦能,提升效率,提高產品和服務質量,并因此貢獻更大的價值。
2. 管理決策支持,控制風險
現代企業、組織機構的運營和管理往往面臨著復雜的環境,數據、信息和知識異常豐富,每一個決策都涉及非常多的要素,容易陷入信息過載的情形而導致不得要領,或者被困入信息繭房卻不自知而導致決策偏差等。行業知識圖譜具備匯聚、關聯和融合企業內外部的各類信息和知識的作用,結合企業、組織機構的特色經驗進行統計分析和深度建模,避免信息過載,提供全局決策知識支撐,沖破信息繭房,從而輔助管理者更全面、更深度地思考所面臨的問題,做出有效的決策。
(1)全局洞察
通過行業知識圖譜匯聚所有相關信息并進行關聯融合,打破信息孤島,做到全局的統計分析,避免管理者做決策時只見樹木、不見森林,相應的價值體現在以下方面。
·戰略價值,通過對全局信息的掌控,避免對企業、組織機構的戰略決策失誤,從而帶來價值。
·持續優化的價值,通過全局分析和關聯協同,找到企業、組織機構運營管理中的關鍵問題并進行持續優化,從而帶來價值。
·避免一葉障目、不見泰山,以致于陷入局部優化但全局變差的情形,由此所產生的價值。
這種全局洞察的例子無處不在,比如在新冠疫情中,中國的防疫政策就是從全局決策出發,阻斷疫情擴散,實現動態清零,并由實踐檢驗其決策的正確性;相反,許多國家因沒有及時阻斷疫情傳播,導致疫情擴散,致使經濟、社會發展、生活和生命健康等方方面面都受到嚴重影響。
(2)深度剖析
知識圖譜善于挖掘不同知識之間的關聯,知識推理有關的很多前沿研究都集中在如何挖掘潛在的關聯關系。企業的許多決策都需要穿透多層關系,才能夠發現真正的問題,并因此做出正確的決策,否則容易發生南轅北轍的情況——出發點是好的,決策看起來也沒問題,但結果卻不好。管理者在做決策時,不僅要考慮周全,還要深入思考,將行業知識圖譜與經驗相結合,將一系列的邏輯轉化為專業的輔助決策模型,將隱藏的關聯知識加以顯式化,致使錯綜復雜的關系變得清晰,減少隱藏在企業、組織機構“陰暗處”的問題,避免管理者做出看似合理實則大有問題的決策。因此,行業知識圖譜的價值就體現在能夠深入挖掘潛在的、沒被人注意的點。
在實踐中,決策支持方面的價值相對比較“虛”,難以被量化,但這類應用往往能夠激發管理者思考的廣度和深度,甚至引發其對管理架構的思考與調整。正如很難對人的生命進行金錢量化,行業知識圖譜賦能管理決策的價值也一樣,這是因為管理決策的百密一疏就可能導致企業和組織機構的毀滅。應用行業知識圖譜,很有可能在某些點上對管理者加以提示,使其考慮得更為周全和深遠一些,因此避免重大失誤,實現持久的競爭力,并由此帶來巨大的價值。
3. 知識的沉淀,避免流失
如今,企業家和組織機構的管理者都已經深刻體會到知識的重要性,并付出巨大努力,試圖充分利用知識來保持競爭優勢,并因此獲得超額的收益。行業知識圖譜的應用在客觀上實現了知識的即時沉淀和持續傳承,為行業領先者保持優勢和追趕者加速崛起賦能。
(1)即時沉淀
利用行業知識圖譜隨時隨地沉淀知識,并且所沉淀的知識立即就能夠為相關人員所使用,由此帶來相應的價值。即通過綜合手段促進知識的即時沉淀,實現知識的新陳代謝,避免知識的老化,具體表現為以下兩個方面。
·通過對接等自動化手段,及時從各種數據源匯集數據和信息,并通過知識圖譜構建技術更新到行業知識圖譜中,實時為各個應用方所使用。
·以行業知識圖譜的應用為契機,建設和完善規范化知識沉淀的管理規約并構建相應的模型,由此推進企業員工或組織機構成員自動提交、共享并沉淀知識。
(2)避免遺失
通過行業知識圖譜的即時沉淀,避免知識在企業、組織機構中遺失,并由此為企業帶來巨大的價值。通常,企業知識的遺失可以劃分為三大類。
·死知識,即知識雖然以某種方式沉淀下來了,但幾乎無人問津,比如有些知識存儲在某個共享目錄上、保存于檔案室中的某個文件中,理論上很多人都能訪問到,但實際上卻因種種原因幾乎無人使用。
·流失的知識,即知識或經驗在某個專家那里,并沒有總結并沉淀下來,當該專家退休或離職后,知識徹底流失。
·未知的知識,即知識已經存在并公開(比如發表在論文中的知識),但企業的員工或組織機構的成員并未了解這些知識。
行業知識圖譜能夠匯聚企業或組織機構內外部的各種相關知識,具備完整和精確的記憶能力(相對來說,人的記憶則是模糊的),結合合理的管理規約開發出沉淀知識的應用程序,從而記錄企業或組織機構的各種專家知識。“人生到處知何似,應似飛鴻踏雪泥”,企業和組織機構也應當如此,采用行業知識圖譜沉淀專家經驗,積累行業知識,聚集和拼裝日常工作中所承載的不可勝數的知識與經驗,形成寶貴的財富。否則,就像“泥上偶然留指爪,鴻飛那復計東西”,雪泥鴻爪雖有痕跡卻易消散,知識與經驗即使寶貴也未必能產生價值。
有一個擰螺絲的故事:某個工廠的機器壞了,工廠修不好該機器,于是找專家來解決問題。該專家到現場后,擰了機器上的一個螺絲就修好了,收費1萬元(不同版本金額差別很大,不予深究)。廠長認為,這么簡單的事情不值1萬元。專家卻回答說,擰螺絲只值1元,而知道擰哪個螺絲值9999元。這個故事原本的目的是體現知識的價值。反過來,這是典型的故障歸因分析和維修場景。如果機器廠商特別依賴于某個專家,并且只有該專家知道“know how”知識,這其實很危險,一旦該專家因某種原因離開了機器廠商,這個知識就遺失了,未來要解決這樣的問題也許要付出高昂成本,也許無法解決,并因此損害了機器廠商的聲譽,降低了競爭力。如果利用行業知識圖譜將專家的經驗沉淀下來,并以專業診斷模型提供服務,則不僅沒有知識遺失的風險,并因維護成本較低、服務好,進而提升機器廠商的聲譽和競爭力,擴大市場份額,獲得巨大的收益。
4. 集體智慧協同,組織進化
行業知識圖譜帶來的不僅是個體的知識沉淀,更最關鍵的是為企業、組織機構帶來了集體智慧。“三人行,必有我師”,在現實世界中,并沒有哪個人擁有絕對的知識;“尺有所短,寸有所長”,在企業或組織機構中,每個人既有其擅長之處,又有其知識盲區。行業知識圖譜的最大收益在于避免個體專家的認知局限,為每個人提供集體智慧的佐助,從而大幅縮減盲區的范圍,提升工作效率。集體智慧也能夠減少企業員工或組織機構成員“重復造輪子”,更容易站在“由集體智慧構成的巨人肩膀上”進行創新。
(1)集體智慧
行業知識圖譜凝聚了行業豐富的知識及企業、組織機構專家的經驗,從而擺脫對個體專家的依賴,避免了個體專家的認知局限,實現了集體智慧。具體來說,有以下方面的表現。
·行業知識圖譜的知識來源豐富,既可以包含領域內不同專家的知識和觀點,也包含企業或組織機構對這些知識的實踐檢驗結果。
·同一個知識點的可能有多個不同的來源,行業知識圖譜會“忠實”記錄每個來源,同時能夠溯源。
·將知識推理技術與行業實踐經驗相結合,能夠對知識進行相互碰撞和校驗,挖掘異同,包括對同一知識點的不同來源的校驗,以及對不同知識點進行推理校驗等。
·以矛盾的對立統一視角看待知識融合,對互相印證相一致的知識予以強化,對矛盾所在之處予以如實記錄。在應用中,遇到矛盾所在的知識時加以提示,并在矛盾解決時予以確認。
(2)巨人肩膀
企業、組織機構不同的人都可以對這些由集體智慧凝結成的行業知識加以利用,就像牛頓所說的“站在巨人的肩膀上”。對于牛頓來說,這巨人并非具體的、實在的某一個人,而是在牛頓之前的所有科學成就所組成的“巨人”。同樣的,每一個企業員工或組織機構成員的業務應用和創新也站在由集體智慧所凝結的行業知識圖譜這個巨人的肩膀上。行業知識圖譜也因此為企業或組織機構帶來了極其寶貴的價值。通常來說,包括以下方面。
·自始至終的可持續學習,這是由于知識源源不斷地輸入行業知識圖譜中,“巨人”得以持續成長。
·減少重復造輪子,當人們能夠方便地從行業知識圖譜中獲知最新的知識和經驗并在業務中應用時,自然就減少甚至避免了重復的工作。
·創新的加速、前沿知識和最新的最佳實踐,經由行業知識圖譜源源不斷地輸入企業員工或組織機構成員的大腦中,大幅減少重復造輪子的情形,減少精力和智力的雙重負擔,致使更多創新得以被激發。
·日積月累帶來的復利效應,在數學上,指數級增長是極其可怕的,如果“巨人肩膀”能夠在每天為每個人提升千分之一的效率,一年250個工作日就能為每一個員工提升至少28%(1.001250=1.2839)的效率,而對于具有成千上萬名成員的組織來說,其效益更是不得了。
(3)組織進化
集體智慧和巨人肩膀為組織打開了全新的視野,加速組織在運營模式、管理理念和文化精髓三個層次上的變革。當知識圖譜融入組織認知基因后,就開始了一個沒有終點的進化過程,就像人類自從發生了認知革命之后即開始了持續的進化。同樣的,就像認知革命之后的人類主宰了整個地球,而基于群體智慧的認知圖譜也將驅動著組織永無止境地創新,最終主宰整個行業。籠統地說,主要體現在以下方面。
·運營模式認知化,知識的創新、沉淀、傳承、應用如同新陳代謝一樣自然。
·管理理念認知化,全局洞察、深度剖析、集體決策、知識驅動成為順理成章的事。
·組織的認知變革成為文化的精髓,知識圖譜成為組織不斷成長的階梯。
在實踐中,實現集體智慧的協同很難,組織進化更難,但集體智慧帶來了1+1>2的價值,指數級的成長則是持續保持競爭優勢的不二法寶。通過深度應用行業知識圖譜,擴展企業和組織機構的認知邊界,有利于形成獨特的創新性產品和服務,并因此獲得持久且巨大的收益。在智能化呼聲此起彼伏的今天,服務創新、模式創新、質量創新、管理創新無一不依賴于行業知識圖譜的深度應用。