AI+金融技術(shù)分層解構(gòu)
從分層的視角來看,AI+金融技術(shù)可分為基礎(chǔ)層、技術(shù)層和應(yīng)用層三個(gè)層面。作為AI在金融領(lǐng)域落地的基礎(chǔ)設(shè)施建設(shè)和技術(shù)支持,基礎(chǔ)層的基礎(chǔ)技術(shù)必不可少,如大數(shù)據(jù)、云計(jì)算、智能芯片、傳感器及智能硬件等,特別是金融領(lǐng)域的大數(shù)據(jù),其為AI技術(shù)在金融領(lǐng)域的落地發(fā)展提供了數(shù)據(jù)基礎(chǔ);在技術(shù)層面,AI技術(shù)可應(yīng)用在金融領(lǐng)域的核心技術(shù)包括語音識(shí)別、圖像識(shí)別、生物特征識(shí)別、網(wǎng)絡(luò)爬蟲、機(jī)器學(xué)習(xí)、知識(shí)圖譜、自然語言處理等;在應(yīng)用層面,AI在金融領(lǐng)域的應(yīng)用落地場景有智能投顧、征信、風(fēng)控、金融搜索引擎、身份驗(yàn)證、智能客服、自動(dòng)研報(bào)等,當(dāng)前最火的應(yīng)用莫過于智能投顧。
AI+金融基礎(chǔ)設(shè)施建設(shè)
金融領(lǐng)域大數(shù)據(jù)
比較有代表性的企業(yè)有:
九次方大數(shù)據(jù):綜合的大數(shù)據(jù)平臺(tái)。其具有政府背景,貴陽大數(shù)據(jù)交易所的創(chuàng)始者。九次方大數(shù)據(jù)目前整合的大數(shù)據(jù)覆蓋了30 大品類,其中包括:企業(yè)大數(shù)據(jù)、政府大數(shù)據(jù)、醫(yī)療大數(shù)據(jù)、金融大數(shù)據(jù)、能源大數(shù)據(jù)、教育大數(shù)據(jù)、交通大數(shù)據(jù)、通信大數(shù)據(jù)等。
官網(wǎng):http://www.jusfoun.com/
AI慕課開拓方向:無。
因果樹:人工智能股權(quán)投融資服務(wù)平臺(tái)。整合全網(wǎng)20萬+項(xiàng)目信息,互聯(lián)網(wǎng)公司細(xì)分成1000+行業(yè),通過大數(shù)據(jù)分析、金融建模,制定行業(yè)及企業(yè) KPI。因果樹圖靈產(chǎn)品通過人工智能技術(shù),3s之內(nèi)回答一切投融資相關(guān)問題。
官網(wǎng):http://www.innotree.cn/
因果樹簡介:因果樹(InnoTREE)是中國領(lǐng)先的人工智能股權(quán)投融資服務(wù)平臺(tái),自2014年成立以來,始終致力于憑借最前沿的人工智能科技,以平等開放的心態(tài)重塑傳統(tǒng)的股權(quán)投融資生態(tài)格局。
經(jīng)過兩年多的高速發(fā)展,因果樹依托于完備的投資及企業(yè)信息庫,整合超過2000萬家企業(yè)運(yùn)營數(shù)據(jù)和過萬家風(fēng)險(xiǎn)投資機(jī)構(gòu)投資數(shù)據(jù),并結(jié)合已累計(jì)突破100萬份的市場分析研報(bào)以及招股書、海量的全球知識(shí)產(chǎn)權(quán)數(shù)據(jù)和日均覆蓋7億的用戶上網(wǎng)行為數(shù)據(jù),憑借業(yè)內(nèi)獨(dú)樹一幟的人工智能算法,逐步形成了涵蓋超過1000個(gè)細(xì)分行業(yè),囊括國內(nèi)外一、二級(jí)股權(quán)投資市場,貫穿投融資領(lǐng)域“信息垂直搜索”、“行業(yè)/企業(yè)研究報(bào)告”和“一體化解決方案”三大環(huán)節(jié)的人工智能股權(quán)投融資服務(wù)體系。
通過與包括國內(nèi)幾大電信運(yùn)營商在內(nèi)的一系列數(shù)據(jù)合作伙伴的戰(zhàn)略級(jí)合作,因果樹逐步建立起了累計(jì)達(dá)1000T、日新增結(jié)果數(shù)據(jù)超過3T的數(shù)據(jù)倉庫,海量、多源的數(shù)據(jù)為人工智能股權(quán)投融資服務(wù)打下了堅(jiān)實(shí)的基礎(chǔ)。
憑借完善的數(shù)據(jù)處理能力、高效的數(shù)據(jù)加工能力、極致的分析解讀能力和獨(dú)到的人工智能算法,因果樹將金融行業(yè)專家的豐富經(jīng)驗(yàn)和人工智能科技有機(jī)結(jié)合,形成了業(yè)內(nèi)獨(dú)樹一幟的股權(quán)投融資智能分析系統(tǒng)。
AI慕課開拓方向:李姜元鴻(因果樹創(chuàng)始人)。可讓其安排技術(shù)人員講解一下垂搜大數(shù)據(jù)產(chǎn)品的技術(shù)實(shí)現(xiàn)。AI慕課課程名稱可擬為:《金融大數(shù)據(jù)產(chǎn)品構(gòu)建之道》。
垂搜:項(xiàng)目和機(jī)構(gòu)數(shù)據(jù)庫、信息全面實(shí)時(shí)披露
因果樹垂搜是國內(nèi)首款股權(quán)投融資領(lǐng)域垂直搜索產(chǎn)品,其數(shù)據(jù)庫覆蓋超過2000萬家企業(yè)運(yùn)營數(shù)據(jù)、50萬+TMT項(xiàng)目和數(shù)萬家活躍投資機(jī)構(gòu)投資數(shù)據(jù),并結(jié)合已累計(jì)突破100萬份的市場分析研報(bào)以及招股書、海量的全球知識(shí)產(chǎn)權(quán)數(shù)據(jù)和日均覆蓋7億的用戶上網(wǎng)行為數(shù)據(jù),憑借業(yè)內(nèi)獨(dú)樹一幟的人工智能算法,逐步形成了涵蓋超過1000個(gè)細(xì)分行業(yè)。數(shù)據(jù)來源包括市場上的公開數(shù)據(jù)、多家運(yùn)營商數(shù)據(jù)、知識(shí)產(chǎn)權(quán)數(shù)據(jù),還包括定點(diǎn)行業(yè)數(shù)據(jù),實(shí)時(shí)跟蹤并分析每個(gè)項(xiàng)目在投前、投中、投后的信息,包括其所在行業(yè)狀況、資本狀況、項(xiàng)目團(tuán)隊(duì)水平、用戶表現(xiàn)等,通過對(duì)項(xiàng)目信息實(shí)時(shí)收集、結(jié)構(gòu)化分析、處理,幫助用戶準(zhǔn)確、及時(shí)獲取行業(yè)和項(xiàng)目信息。
垂搜產(chǎn)品借助人工智能算法優(yōu)化搜索結(jié)果,大大提升了結(jié)果的精準(zhǔn)度,即可以提供高準(zhǔn)確度的研報(bào)片段,也可以為企業(yè)推薦合適的合作伙伴及潛在并購標(biāo)的。
垂搜將行業(yè)專家的知識(shí)積累與人工智能算法完美結(jié)合,依托于多維度數(shù)據(jù)源、專業(yè)的金融分析模型、邏輯化的數(shù)據(jù)呈現(xiàn)大幅提升了搜索結(jié)果的專業(yè)價(jià)值。
李姜元鴻言論(FDL整理):我們(因果樹)是一家依托大數(shù)據(jù)的人工智能股權(quán)投融資服務(wù)平臺(tái)。整合全網(wǎng)50萬+項(xiàng)目信息,互聯(lián)網(wǎng)公司細(xì)分成1000+行業(yè),通過大數(shù)據(jù)分析、金融建模,制定行業(yè)及企業(yè)KPI。從宏中微三個(gè)角度來看,雖然Fintech很熱,但目前還不能說存在明顯泡沫,很多東西都還沒成長起來。未來比較看好的是智能金融這塊,針對(duì)資產(chǎn)端的創(chuàng)新。我們是投AI股權(quán)融資信息平臺(tái)的,通過我們的數(shù)據(jù)庫,用云圖的方式來展現(xiàn)目前產(chǎn)業(yè)/行業(yè)的項(xiàng)目投資機(jī)會(huì)。
通聯(lián)數(shù)據(jù):通聯(lián)數(shù)據(jù)股份有限公司(DataYes)是由金融和高科技資深專家發(fā)起,萬向集團(tuán)投資成立的一家金融資訊和投資管理服務(wù)公司。致力于通過新一代的信息技術(shù)和投資理念打造國際一流的、具有革命性意義的金融服務(wù)平臺(tái),為客戶提供更專業(yè)和更全面的服務(wù)。總部位于中國上海陸家嘴金融區(qū),在美國硅谷、北京、南京設(shè)有分公司。
通聯(lián)實(shí)際上要做兩件事情,一個(gè)是針對(duì)資產(chǎn)管理行業(yè)提供云計(jì)算服務(wù)平臺(tái),另外提供大數(shù)據(jù)分析平臺(tái)。
官網(wǎng):https://www.datayes.com/
TuShare數(shù)據(jù)接口:TuShare是一個(gè)免費(fèi)、開源的python財(cái)經(jīng)數(shù)據(jù)接口包。主要實(shí)現(xiàn)對(duì)股票等金融數(shù)據(jù)從數(shù)據(jù)采集、清洗加工 到 數(shù)據(jù)存儲(chǔ)的過程,能夠?yàn)榻鹑诜治鋈藛T提供快速、整潔、和多樣的便于分析的數(shù)據(jù),為他們在數(shù)據(jù)獲取方面極大地減輕工作量,使他們更加專注于策略和模型的研究與實(shí)現(xiàn)上。考慮到Python pandas包在金融量化分析中體現(xiàn)出的優(yōu)勢,TuShare返回的絕大部分的數(shù)據(jù)格式都是pandas DataFrame類型,非常便于用pandas/NumPy/Matplotlib進(jìn)行數(shù)據(jù)分析和可視化。當(dāng)然,如果您習(xí)慣了用Excel或者關(guān)系型數(shù)據(jù)庫做分析,您也可以通過TuShare的數(shù)據(jù)存儲(chǔ)功能,將數(shù)據(jù)全部保存到本地后進(jìn)行分析。應(yīng)一些用戶的請(qǐng)求,從0.2.5版本開始,TuShare同時(shí)兼容Python 2.x和Python 3.x,對(duì)部分代碼進(jìn)行了重構(gòu),并優(yōu)化了一些算法,確保數(shù)據(jù)獲取的高效和穩(wěn)定。
TuShare從發(fā)布到現(xiàn)在,已經(jīng)幫助很多用戶在數(shù)據(jù)方面降低了工作壓力,同時(shí)也得到很多用戶的反饋,TuShare將一如既往的用免費(fèi)和開源的形式分享出來,希望對(duì)有需求的人帶來一些幫助。如果您覺得TuShare好用并有所收獲,請(qǐng)通過微博、微信或者網(wǎng)站博客的方式分享出去,讓更多的人了解和使用它,使它能在大家的使用過程中逐步得到改進(jìn)和提升。TuShare還在不斷的完善和優(yōu)化,后期將逐步增加港股、期貨、外匯和基金方面的數(shù)據(jù),所以,您的支持和肯定才是TuShare堅(jiān)持下去的動(dòng)力。
TuShare & DataYes
通聯(lián)數(shù)據(jù)(DataYes)是國內(nèi)目前最大的開放金融數(shù)據(jù)平臺(tái),整合了包括股票、基金、期貨、期權(quán)和港股方面的全品類金融數(shù)據(jù)。從數(shù)據(jù)的多樣性、質(zhì)量性和穩(wěn)定性的角度考慮,遵從TuShare一貫的開放、簡單易用的特點(diǎn),TuShare為用戶集成了絕大部分通聯(lián)數(shù)據(jù)的接口。雖然通聯(lián)數(shù)據(jù)大部分?jǐn)?shù)據(jù)接口都是免費(fèi)使用,但畢竟是一家商業(yè)公司,使用前提是需要注冊通聯(lián)數(shù)據(jù)的用戶賬號(hào),當(dāng)然,注冊過程還是相當(dāng)簡單的。
為了讓TuShare用戶更好的使用通聯(lián)數(shù)據(jù)接口,用戶需要注冊通聯(lián)通行證賬號(hào)。以便在TuShare中調(diào)用通聯(lián)數(shù)據(jù)API接口。
TuShare官網(wǎng):http://tushare.org/index.html
優(yōu)礦:優(yōu)礦是通聯(lián)數(shù)據(jù)旗下的大數(shù)據(jù)時(shí)代的金融量化平臺(tái)。提供高質(zhì)量的金融大數(shù)據(jù)與高效的云計(jì)算工具,復(fù)雜交易策略亦可輕松構(gòu)建、回測并模擬。
官網(wǎng):https://uqer.io/home/
AI慕課開拓方向:通聯(lián)數(shù)據(jù)CEO王政。可讓其安排技術(shù)人員講解一下通聯(lián)數(shù)據(jù)的金融大數(shù)據(jù)庫平臺(tái)的使用方法,并介紹通聯(lián)數(shù)據(jù)開放平臺(tái)的API接口的使用方法,以及介紹TuShare對(duì)通聯(lián)數(shù)據(jù)API的調(diào)用。此外,還可以為學(xué)員介紹優(yōu)礦量化平臺(tái)的使用方法,以快速幫助想學(xué)量化策略的同學(xué)上手。AI慕課課程名稱可擬為:《這里有你想要的所有金融數(shù)據(jù)——通聯(lián)數(shù)據(jù)開放平臺(tái)使用方法》、《大數(shù)據(jù)和機(jī)器智能時(shí)代的量化投資——優(yōu)礦量化平臺(tái)快速上手》。
金融領(lǐng)域云計(jì)算
比較有代表性的企業(yè)有:
興業(yè)數(shù)金-金融行業(yè)云:2015年12月,興業(yè)銀行和高偉達(dá)、金證科技、新大陸等數(shù)家公司共同投資設(shè)立興業(yè)數(shù)字金融服務(wù)股份有限公司(興業(yè)數(shù)金),承接興業(yè)銀行“銀銀平臺(tái)”的科技輸出優(yōu)勢,為中小銀行、非銀行金融機(jī)構(gòu)、中小企業(yè)提供金融行業(yè)云服務(wù)。
興業(yè)數(shù)金在成立伊始就放眼未來,將OpenStack作為新一代云計(jì)算平臺(tái)的技術(shù)方向,并結(jié)合互聯(lián)網(wǎng)金融系統(tǒng)的應(yīng)用特點(diǎn),建設(shè)了中國第一個(gè)基于OpenStack的金融行業(yè)云——興業(yè)數(shù)金云。
官網(wǎng):http://www.cibfintech.com/
AI慕課開拓方向:興業(yè)數(shù)金云計(jì)算工程師。可讓其相關(guān)技術(shù)人員講解一下興業(yè)數(shù)金云平臺(tái)的架構(gòu)和技術(shù)實(shí)現(xiàn)。AI慕課課程名稱可擬為:《普惠金融時(shí)代的拎包入住——興業(yè)數(shù)金云平臺(tái)的技術(shù)架構(gòu)》。
興業(yè)數(shù)金采用開源OpenStack 云平臺(tái)解決方案,一期建設(shè)互聯(lián)網(wǎng)金融業(yè)務(wù)生產(chǎn)云、開發(fā)測試云兩個(gè)云平臺(tái),既結(jié)合了互聯(lián)網(wǎng)金融業(yè)務(wù)的實(shí)際需求,又具備行業(yè)云的推廣擴(kuò)展能力。方案亮點(diǎn)包括:
1、靈活計(jì)費(fèi)策略支撐金融行業(yè)云復(fù)雜計(jì)費(fèi)場景
定制開發(fā)云平臺(tái)計(jì)費(fèi)功能,實(shí)現(xiàn)資源條目基準(zhǔn)價(jià)格配置、計(jì)費(fèi)策略配置、計(jì)費(fèi)報(bào)表導(dǎo)出、在線或管理員后臺(tái)充值及欠費(fèi)處理等功能。這些復(fù)雜的計(jì)費(fèi)體系、計(jì)費(fèi)策略、計(jì)費(fèi)管理等功能,為實(shí)現(xiàn)金融行業(yè)云復(fù)雜計(jì)費(fèi)場景提供了業(yè)務(wù)和技術(shù)融合支撐。
2、復(fù)雜的組織關(guān)系架構(gòu)契合金融行業(yè)云使用場景
考慮到金融行業(yè)云的企業(yè)用戶組織關(guān)系架構(gòu)復(fù)雜,興業(yè)數(shù)金云在設(shè)計(jì)之初就在原有OpenStack Domain、Project組織架構(gòu)基礎(chǔ)上,增加一級(jí)父Project,實(shí)現(xiàn)企業(yè)、部門、項(xiàng)目三層組織關(guān)系架構(gòu)契合金融行業(yè)云企業(yè)用戶自有組織架構(gòu)需求。
3、裸機(jī)資源管理實(shí)現(xiàn)虛實(shí)資源混合使用
考慮到興業(yè)數(shù)金云承載的互聯(lián)網(wǎng)金融業(yè)務(wù)中需要使用物理節(jié)點(diǎn)構(gòu)建大數(shù)據(jù)集群,采用OpenStack Ironic接入管理裸機(jī)資源,并按需提供給數(shù)金云租戶裸機(jī)資源服務(wù)。此外,通過對(duì)接SDN網(wǎng)絡(luò)方案,亦實(shí)現(xiàn)虛擬機(jī)和裸機(jī)混合組網(wǎng)。
4、統(tǒng)一監(jiān)控平臺(tái)
興業(yè)數(shù)金云采用Zabbix對(duì)云平臺(tái)中物理服務(wù)器、網(wǎng)絡(luò)設(shè)備、分布式存儲(chǔ)系統(tǒng)、應(yīng)用系統(tǒng)和虛擬資源統(tǒng)一監(jiān)控,統(tǒng)一監(jiān)控平臺(tái)實(shí)現(xiàn)提供監(jiān)控告警管理功能:包括資源容量、主機(jī)性能、虛擬機(jī)性能、應(yīng)用性能監(jiān)控及告警閾值設(shè)置等功能。
才云科技-容器金融云:才云科技CEO張鑫分享了《基于谷歌級(jí)容器技術(shù)與深度學(xué)習(xí)的金融云解決方案與落地實(shí)踐》,旨在幫助傳統(tǒng)金融行業(yè)適應(yīng)互聯(lián)網(wǎng)環(huán)境下計(jì)算資源彈性變化和業(yè)務(wù)快速部署的需求。他認(rèn)為,金融行業(yè)已從面向標(biāo)準(zhǔn)化組件的大集中和面向資源的虛擬化,轉(zhuǎn)向面向服務(wù)的云計(jì)算,容器已成為軟件交付的標(biāo)準(zhǔn),容器將助力金融行業(yè)實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)的快速微服務(wù)構(gòu)建。
Caicloud TaaS(TensorFlow as a Service)產(chǎn)品的架構(gòu)設(shè)計(jì)和研發(fā)成功,將重新定義容器云服務(wù)的技術(shù)版圖和生態(tài)想象空間。張鑫認(rèn)為:“容器云服務(wù)革命的時(shí)代業(yè)已到來,才云一直在思考在實(shí)踐,我們不僅僅滿足于Docker或容器技術(shù)帶來的輕量級(jí)容器虛擬化標(biāo)準(zhǔn),也不僅僅是容器集群調(diào)度管理所帶來的開發(fā)運(yùn)維流程統(tǒng)一的交付標(biāo)準(zhǔn),而是如何在貼近業(yè)務(wù)第一線為企業(yè)帶來價(jià)值和盈利,從底層至上提供一整套解決方案,這是我們才云企業(yè)服務(wù)的終極目標(biāo)——點(diǎn)燃計(jì)算與數(shù)據(jù)的價(jià)值。”
張鑫表示,決定深度學(xué)習(xí)成效的三要素為數(shù)據(jù)、算法和平臺(tái),而才云推出的TaaS服務(wù)中,算法基于TensorFlow,平臺(tái)則是才云自己的容器集群(基于Kubernetes集群管理系統(tǒng)),只要企業(yè)能夠收集到足夠的數(shù)據(jù)來對(duì)算法模型進(jìn)行校正,才云的TaaS平臺(tái)就能夠不斷提升精度。且企業(yè)只需要很少的配置即可實(shí)現(xiàn)自身的需求。
張鑫介紹,目前單家企業(yè)的算法模型需要一個(gè)月到數(shù)個(gè)月不等的時(shí)間進(jìn)行校準(zhǔn),而從計(jì)算的加速比來看,采用了跨主機(jī)分布式計(jì)算的才云TaaS平臺(tái)能夠發(fā)揮高于TensorFlow本身超過百倍的加速比。“在才云成立初期,基于我們創(chuàng)始人在谷歌底層研發(fā)的經(jīng)驗(yàn)和視野,我們決定賦予Caicloud之C. A. I所蘊(yùn)含的CloudAI理念。在過去2-3年,Docker一片紅海,但我們深知在谷歌內(nèi)部Borg周邊的一系列生態(tài)和其能為企業(yè)IT所產(chǎn)生的價(jià)值。”
才云科技報(bào)告詳情:《谷歌級(jí)容器技術(shù)與金融云落地實(shí)踐》
官網(wǎng):https://caicloud.io/
AI慕課開拓方向:才云科技CEO張鑫。可讓其安排相關(guān)技術(shù)人員講解一下才云TaaS平臺(tái)的架構(gòu)。AI慕課課程名稱可擬為:《當(dāng)TensorFlow遇上金融——才云TaaS容器金融云的落地實(shí)踐》。
AI+金融技術(shù)與應(yīng)用
金融領(lǐng)域語音識(shí)別
由于金融行業(yè)帶有明顯的客戶服務(wù)屬性,加上完整而龐大的業(yè)務(wù)及數(shù)據(jù)積累,因此成為智能語音語義的重要應(yīng)用陣地。當(dāng)前,一些商業(yè)銀行已經(jīng)通過使用語音識(shí)別技術(shù),實(shí)現(xiàn)了語音導(dǎo)航、語音交易、業(yè)務(wù)辦理等基礎(chǔ)服務(wù)。
除了在線客服和呼叫中心,智能語音技術(shù)還被應(yīng)用于語音/語義分析、大數(shù)據(jù)挖掘、身份認(rèn)證等領(lǐng)域。捷通華聲的智能語音分析系統(tǒng)就通過將語音數(shù)據(jù)轉(zhuǎn)化為文本,而后建立語義索引、自動(dòng)提取特征關(guān)鍵詞,再對(duì)文本數(shù)據(jù)進(jìn)行自動(dòng)分類,生成結(jié)構(gòu)化的客服大數(shù)據(jù),為銀行等金融機(jī)構(gòu)提供客服質(zhì)檢、大數(shù)據(jù)挖掘與分析服務(wù)。
此外,隨著聲紋識(shí)別技術(shù)的進(jìn)步,智能語音也將被應(yīng)用于金融領(lǐng)域的身份認(rèn)證,通過語音認(rèn)證實(shí)現(xiàn)業(yè)務(wù)辦理、支付等功能,未來有望和指紋、虹膜、人臉等其他生物特征識(shí)別方式一起使用。
代表性的應(yīng)用/企業(yè):
智能客服:中國平安 95511 呼叫中心(Call Center)
中國平安作為中國最大的個(gè)人金融生活服務(wù)集團(tuán)之一,其全國服務(wù)熱線95511每日電話進(jìn)線量超過70萬,隨著集團(tuán)業(yè)務(wù)的不斷增加,熱線菜單層級(jí)也越來越多,客戶往往需要按鍵3到4次才能開始真正辦理業(yè)務(wù)。隨著智能語音導(dǎo)航系統(tǒng)的上線后,客戶只要“說”可開始業(yè)務(wù)辦理,解決了現(xiàn)今世界上罕有的涵蓋10余家不同公司、不同業(yè)務(wù)、5層按鍵設(shè)置、2000多種種服務(wù)的最復(fù)雜按鍵業(yè)務(wù)導(dǎo)航系統(tǒng)的難題。目前中國平安95511服務(wù)熱線每日已有近55萬的電話呼入用戶使用了該服務(wù),占比超過75%。
官網(wǎng):http://www.pingan.com/
平安服務(wù)熱線95511智能語音導(dǎo)航系統(tǒng),是基于業(yè)界領(lǐng)先的智能語音識(shí)別和交互技術(shù),共同實(shí)現(xiàn)了產(chǎn)險(xiǎn)、壽險(xiǎn)、銀行卡查詢、信用卡查詢、車險(xiǎn)辦理等480項(xiàng)業(yè)務(wù)菜單的語音交互功能,識(shí)別準(zhǔn)確率超過87%,已達(dá)到行業(yè)領(lǐng)先水平。是平安科技堅(jiān)持創(chuàng)新、專業(yè)服務(wù)的又一力作。
平安科技作為平安集團(tuán)全資子公司,“互聯(lián)網(wǎng)+綜合金融”科技服務(wù)提供商,構(gòu)建了一系列業(yè)內(nèi)領(lǐng)先的聯(lián)絡(luò)中心產(chǎn)品線,包括智能語音、可視化IVR、號(hào)碼盾牌、智能外呼、坐席全景視圖等。后續(xù),平安科技將繼續(xù)致力于打造電話、視頻、在線等三位一體的全媒體客戶接觸平臺(tái) ,更好的為集團(tuán)內(nèi)外部企業(yè)用戶提供服務(wù)。
FDL觀點(diǎn):各個(gè)金融機(jī)構(gòu)的Call Center,人和機(jī)器的比例可能會(huì)慢慢走向,現(xiàn)在是人多機(jī)器少,或者現(xiàn)在說幾乎都是人,那可能五年以后,你打電話到Call Center里邊,大概80%的都應(yīng)該是機(jī)器來接聽,然后只有20%是人,這個(gè)趨勢是非常明顯的,這和我們外圍的語音識(shí)別技術(shù)其實(shí)是很有關(guān)系的。就是現(xiàn)在AI的技術(shù)在整個(gè)語音識(shí)別,這些都是速度非常快的,所以這類型的基礎(chǔ)行業(yè),包括還有機(jī)器人在金融機(jī)構(gòu)后臺(tái)的運(yùn)營,我覺得機(jī)器人的這個(gè)方向是不錯(cuò)的。過去我相信大家打Call Center,你都會(huì)很煩。打進(jìn)去以后,它會(huì)告訴你1是什么2是什么3是什么,你點(diǎn)開2以后,它又會(huì)告訴你1是什么2是什么,你可能在旁邊都等得沒有耐心了,但是你現(xiàn)在打就會(huì)不一樣的。比如整個(gè)平安集團(tuán),它是一個(gè)集中的Call Center,不管是證券還是保險(xiǎn)還是銀行,它是一個(gè)號(hào)碼的客服電話,你現(xiàn)在打進(jìn)去以后,它就已經(jīng)有變化了,它會(huì)告訴你說,它的提示音就不是1是什么2是什么,而是說你需要的服務(wù)是什么,你可以直接講出來,然后你一講,它直接就奔著下一個(gè)菜單去了。所以這其實(shí)已經(jīng)是一個(gè)語音轉(zhuǎn)換成文字,文字再具體語義解析的一個(gè)非常典型的例子了。
AI慕課開拓方向:平安科技負(fù)責(zé)開發(fā)智能客服(Call Center)的負(fù)責(zé)人。可讓平安科技首席科學(xué)家肖京安排技術(shù)人員講解一下平安呼叫中心95511的技術(shù)實(shí)現(xiàn)。AI慕課課程名稱可擬為:《平安智能客服95511背后的技術(shù)邏輯》。
金融領(lǐng)域自然語言處理
自然語言處理除了結(jié)合語音識(shí)別技術(shù)對(duì)語音數(shù)據(jù)進(jìn)行挖掘應(yīng)用在智能客服以外,另外的主要應(yīng)用就是智能報(bào)告生成,其利用自然語言處理及OCR技術(shù)(光學(xué)字符識(shí)別)解析文本,提取關(guān)鍵信息嵌入相應(yīng)的報(bào)告模板,自動(dòng)生成報(bào)告。在文本來源方面,還應(yīng)注意到爬蟲技術(shù)的應(yīng)用。
金融領(lǐng)域的爬蟲技術(shù)
八爪魚采集器:八爪魚采集器是深圳視界信息技術(shù)有限公司研發(fā)的一款業(yè)界領(lǐng)先的網(wǎng)頁采集軟件,具有使用簡單,功能強(qiáng)大等諸多優(yōu)點(diǎn)。八爪魚數(shù)據(jù)采集系統(tǒng)以完全自主研發(fā)的分布式云計(jì)算平臺(tái)為核心,可以在很短的時(shí)間內(nèi),輕松從各種不同的網(wǎng)站或者網(wǎng)頁獲取大量的規(guī)范化數(shù)據(jù),幫助任何需要從網(wǎng)頁獲取信息的客戶實(shí)現(xiàn)數(shù)據(jù)自動(dòng)化采集,編輯,規(guī)范化,擺脫對(duì)人工搜索及收集數(shù)據(jù)的依賴,從而降低獲取信息的成本,提高效率。
官網(wǎng):http://www.bazhuayu.com/
AI慕課開拓方向:八爪魚采集器的開發(fā)者。可讓八爪魚CEO安排技術(shù)人員講解一下采集器的操作過程,比如以征信行業(yè)為例。AI慕課課程名稱可擬為:《高效實(shí)用的爬蟲軟件實(shí)操——八爪魚網(wǎng)頁數(shù)據(jù)采集器》。
金融領(lǐng)域的自動(dòng)研報(bào)生成
目前,自動(dòng)報(bào)告生成主要運(yùn)用自然語言處理(NLP)中的兩種技術(shù):
自然語言理解(NLU):將日常話語消化理解,并轉(zhuǎn)化為機(jī)器可后續(xù)處理的結(jié)構(gòu);
自然語言生成(NLG):將由機(jī)器拆分好的結(jié)構(gòu)化數(shù)據(jù)以人們能看懂的自然語句表達(dá)出來。
我們可以將這兩種技術(shù)理解看成對(duì)日常對(duì)話這一原料的拆分加工和整裝成可理解的自然語句——最終產(chǎn)品。
然而真正生成報(bào)告還需要利用以上技術(shù)完成3個(gè)步驟:
1.處理海量異構(gòu)數(shù)據(jù)
將投行分析師需要閱讀的年報(bào),彭博新聞社的實(shí)時(shí)新聞以及數(shù)據(jù),行業(yè)分析報(bào)告,以及法律公告等資源進(jìn)行消化。其中對(duì)于文本中的圖片和表格需要OCR(光學(xué)字符識(shí)別)等技術(shù)解析。
2.分析數(shù)據(jù)
這一過程涉及運(yùn)用知識(shí)圖譜中常用的知識(shí)提取與實(shí)體關(guān)聯(lián)將其關(guān)鍵邏輯主干抽出,結(jié)合事件地點(diǎn)等因素,將關(guān)鍵信息嵌入預(yù)先設(shè)計(jì)好的報(bào)告模板中。
3.文章生成
經(jīng)過處理海量異構(gòu)數(shù)據(jù)與分析數(shù)據(jù)的過程后,即可生產(chǎn)新聞,券商分析研報(bào),上市招股書,企業(yè)年報(bào),定增公告,甚至基金研究員開每日晨會(huì)所需的投資建議書也都可以用類似方式生成。用戶只需選擇符合其需求的模板確定主題與關(guān)鍵信息,以及報(bào)告呈現(xiàn)形式,便可生成基本內(nèi)容。而且投行分析師可以進(jìn)行校對(duì)與人工二次編輯,加入有價(jià)值的觀點(diǎn)與結(jié)論,并提升報(bào)告精準(zhǔn)度。
文因互聯(lián):文因互聯(lián)是一家用人工智能解決金融數(shù)據(jù)分析問題的創(chuàng)業(yè)公司。 2013年建于美國硅谷, 創(chuàng)始團(tuán)隊(duì)來自MIT、RPI、Wright State、 Marvell、Tulane University等知名大學(xué)和公司, 創(chuàng)始團(tuán)隊(duì)深耕人工智能十余年, 是知識(shí)圖譜領(lǐng)域領(lǐng)軍人物, 在學(xué)術(shù)界和工業(yè)界實(shí)施過大型智能系統(tǒng)開發(fā)。 更匯集了來自北交所、同花順、畢馬威、中興、清華大學(xué)等金融和技術(shù)精英。
官網(wǎng):http://www.memect.cn/
AI慕課開拓方向:文因互聯(lián)負(fù)責(zé)自動(dòng)研報(bào)開發(fā)這塊的技術(shù)人員。可讓其講解一下自動(dòng)研報(bào)生成的過程和技術(shù)路徑。AI慕課課程名稱可擬為:《研報(bào)還可以這樣玩——文因互聯(lián)的自動(dòng)研報(bào)生成技術(shù)解析》。
金融領(lǐng)域圖像識(shí)別
圖像識(shí)別技術(shù)是指利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)象的技術(shù)。金融領(lǐng)域的圖像識(shí)別主要在于人臉識(shí)別,用于身份認(rèn)證的應(yīng)用場景。
云從科技:云從科技是一家有中科院+上市公司背景的公司,是國內(nèi)銀行第一大人臉識(shí)別供應(yīng)商,擁有世界一流的自主人臉識(shí)別技術(shù),在金融領(lǐng)域上比其他同業(yè)公司更加深入懂行。此外,云從科技是一家科學(xué)家的企業(yè),其創(chuàng)始人周曦博士畢業(yè)于伊利諾伊大學(xué)(UIUC),在UIUC從事博士后研究工作,師承“計(jì)算機(jī)視覺之父”Thomas Huang教授。
可以預(yù)期的是,隨著技術(shù)的快速發(fā)展,對(duì)用戶的普及程度的提升以及對(duì)復(fù)雜場景的應(yīng)對(duì),再加上金融領(lǐng)域的安全可靠要求,人臉識(shí)別技術(shù)在金融領(lǐng)域?qū)⒌玫酱笠?guī)模的應(yīng)用。在金融領(lǐng)域的應(yīng)用需求,大概可以分為三類:安全需求,營銷需求和創(chuàng)新需求。
“在金融交易中使用人臉識(shí)別技術(shù),可在出現(xiàn)用戶交易抵賴時(shí),將交易過程用到的人臉識(shí)別原始人臉信息作為交易附加信息進(jìn)行舉證,有效預(yù)防抵賴,減少金融交易客戶投訴處理時(shí)間”,云從科技金融事業(yè)部總經(jīng)理張興旺談到,“通過人臉識(shí)別技術(shù)、用戶微表情分析、眼球跟蹤、客戶軌跡跟蹤等相關(guān)技術(shù),金融企業(yè)能夠快速的識(shí)別出客戶的興趣所在,感知客戶的情緒,并以客戶為中心,按照客戶的喜好提供更好的產(chǎn)品和服務(wù)”。總之,云從科技對(duì)人臉識(shí)別用處的總結(jié)就是,臉即身份,臉即介質(zhì),臉即權(quán)力,臉即信息。
云從科技報(bào)告詳情:《人臉識(shí)別技術(shù)構(gòu)建金融科技新生態(tài)》
官網(wǎng):http://www.cloudwalk.cn/
AI慕課開拓方向:云從科技創(chuàng)始人周曦。可讓其安排技術(shù)人員講解一下復(fù)雜場景下的人臉識(shí)別技術(shù)關(guān)鍵要點(diǎn)(在復(fù)雜場景下,云從科技的人臉識(shí)別技術(shù)能夠輕松應(yīng)對(duì)準(zhǔn)確識(shí)別。如有無化妝、年齡增長、有無配飾、發(fā)型變化、有無PS、光照角度變化等,這些場景下的人臉識(shí)別依然能夠達(dá)到極高的水準(zhǔn))。AI慕課課程名稱可擬為:《復(fù)雜場景下的人臉識(shí)別技術(shù)要點(diǎn)》。
Face++:Face++是曠視科技旗下的人工智能開放平臺(tái),以API或SDK形式提供全球領(lǐng)先的計(jì)算機(jī)視覺服務(wù)。產(chǎn)品包括人臉檢測、人臉分析、人臉識(shí)別,以及圖像識(shí)別、OCR證件識(shí)別、文字識(shí)別。
官網(wǎng):https://www.faceplusplus.com.cn/
主要應(yīng)用:人臉識(shí)別(身份認(rèn)證之刷臉)。客戶代表:支付寶。
支付寶則是將刷臉功能融入到了賬戶登錄上,這一點(diǎn)體驗(yàn)是三家中最為直觀便捷的,開啟的方式為,點(diǎn)擊APP右下角我的→右上角“設(shè)置”→安全中心→安全保護(hù)工具。完成之后,還可以進(jìn)行體驗(yàn),同樣需要眨眨眼來完成識(shí)別。然后再次登錄時(shí),便可以通過刷臉來登錄賬戶,整個(gè)識(shí)別過程不需要用戶有任何動(dòng)作,連眼睛都不用眨,識(shí)別速度非常快,大概一兩秒。體驗(yàn)很是出色。
在照片以及視頻的攻擊測試中,沒有出現(xiàn)任何問題,調(diào)整各種角度也無法解鎖;在切換至真人順利解鎖,安全有保證。
AI慕課開拓方向:Face++首席科學(xué)家孫劍。可讓其講解一下Face++人工智能云開放平臺(tái)背后的人臉識(shí)別技術(shù)關(guān)鍵要點(diǎn)(人臉檢測、人臉比對(duì)、人臉?biāo)阉鳌⑷四橁P(guān)鍵點(diǎn)(最多106點(diǎn))、人臉屬性)。AI慕課課程名稱可擬為:《Face++人臉識(shí)別技術(shù)剖析》。
生物特征識(shí)別
生物特征識(shí)別具有不易遺忘和不易偽造的優(yōu)點(diǎn),它利用人體固有特征進(jìn)行身份鑒定,這些“固有特征”可以分為兩種:一種是“生理特征”,又稱為“靜態(tài)特征”,比如我們每個(gè)人與生俱來的指紋、臉紋、眼紋等等;第二種是“行為特征”,又稱為“動(dòng)態(tài)特征”,比如我們的筆跡、聲音、步態(tài)等,雖然這些特征受后天影響較大,但是我們每個(gè)人的行為特征和其他人都不一樣。
生物特征識(shí)別的優(yōu)勢是顯而易見的,但由于這類型識(shí)別設(shè)備的成本過高,所以在早期主要為政府部門所用。比如,美國入境關(guān)口采集來訪者的指紋,從而鑒定他們與簽證申請(qǐng)者的身份是否吻合。商業(yè)領(lǐng)域的使用也主要集中在企業(yè)內(nèi)部驗(yàn)證員工身份,醫(yī)院鑒定患者身份等方面。而隨著該技術(shù)準(zhǔn)確度的提升,硬件成本的下降以及智能手機(jī)的大量普及,生物特征識(shí)別在大眾市場推廣已具備足夠的條件。
根據(jù)2014年美國國家標(biāo)準(zhǔn)技術(shù)研究所對(duì)多項(xiàng)生物特征識(shí)別的技術(shù)測評(píng),其中指紋識(shí)別、人臉識(shí)別和虹膜識(shí)別的最優(yōu)算法在百萬級(jí)數(shù)據(jù)庫中的準(zhǔn)確率都超過了90%。各種生物特征識(shí)別算法的1比N鑒別性能得到進(jìn)一步提升,在數(shù)百萬人中查找一個(gè)人將不再是大海撈針。
人臉識(shí)別前面小節(jié)已經(jīng)詳述,這里不再贅述。指紋識(shí)別在金融領(lǐng)域的應(yīng)用廣泛,是金融機(jī)構(gòu)的“前任”。可以說,生物識(shí)別在金融的應(yīng)用始于指紋識(shí)別。在深度學(xué)習(xí)技術(shù)還未獲得技術(shù)性突破時(shí),人臉識(shí)別的技術(shù)發(fā)展也受到了限制,而指紋識(shí)別早在90年代大規(guī)模進(jìn)軍金融行業(yè)、“獨(dú)霸”天下,也成為了應(yīng)用最廣泛、最成熟的生物識(shí)別技術(shù)。雖然,現(xiàn)在在人臉識(shí)別的火爆行情下,指紋識(shí)別稍顯黯然,但新一代居民身份證將指紋信息納入其中,這成為了指紋識(shí)別再次走向巔峰的關(guān)鍵契機(jī)。“雖然現(xiàn)在金融機(jī)構(gòu)基本以人臉聯(lián)網(wǎng)核查進(jìn)行人證合一核驗(yàn),但是將來指紋識(shí)別肯定會(huì)在這方面分一杯羹,目前很多銀行已經(jīng)在此方面有所布局。
虹膜識(shí)別、指靜脈識(shí)別:探索、觀察階段的“潛力軍”。相對(duì)于人臉識(shí)別和指紋識(shí)別,虹膜識(shí)別、指靜脈識(shí)別顯得“孤傲”的多。目前各大金融機(jī)構(gòu)對(duì)于這兩種技術(shù)的態(tài)度比較一致:探索與觀察。現(xiàn)在為止,作為最安全、最精準(zhǔn)的生物識(shí)別技術(shù),虹膜識(shí)別一般應(yīng)用于金庫管理、押運(yùn)管理的較多,通過虹膜識(shí)別確認(rèn)出入和押運(yùn)人員身份,確保財(cái)產(chǎn)安全;同時(shí),也有部分銀行在嘗試將虹膜識(shí)別和指靜脈識(shí)別集成于自助終端中,實(shí)現(xiàn)更高安全級(jí)別的身份認(rèn)證,以幫助用戶完成自助貸款、自助理財(cái)?shù)葮I(yè)務(wù)的辦理。
多模態(tài)生物識(shí)別是金融科技(Fintech)不可更改的趨勢,單一的人臉識(shí)別或指紋識(shí)別難以滿足金融機(jī)構(gòu)的多樣化需求,而此時(shí),金融機(jī)構(gòu)更為重要的不是考慮布局哪種生物識(shí)別技術(shù),更關(guān)鍵是未來怎么集中管理多樣化的生物識(shí)別系統(tǒng)。
遠(yuǎn)鑒科技:遠(yuǎn)鑒科技是一家高科技創(chuàng)新型企業(yè),專注于人工智能(AI)——生物識(shí)別領(lǐng)域,掌握先進(jìn)的人工智能與機(jī)器學(xué)習(xí)算法。在生物特征識(shí)別、多維身份認(rèn)證領(lǐng)域,具備多年的服務(wù)經(jīng)驗(yàn)與一站式服務(wù)能力。
在聲紋識(shí)別、語音識(shí)別、人臉識(shí)別、關(guān)鍵詞檢索、語種識(shí)別、音頻指紋、活體檢測等方面,遠(yuǎn)鑒擁有完全自主知識(shí)產(chǎn)權(quán)。憑借業(yè)界領(lǐng)先的聲紋識(shí)別、人臉識(shí)別和OTP技術(shù),加之對(duì)身份認(rèn)證業(yè)務(wù)的深刻理解,遠(yuǎn)鑒在國內(nèi)率先獲得了可供商用的“聲紋+人臉+OTP+X”多維身份識(shí)別與認(rèn)證系統(tǒng)軟件著作權(quán),以滿足不同應(yīng)用場景對(duì)身份認(rèn)證服務(wù)的差異化需求。
官網(wǎng):https://www.fosafer.com/
AI慕課開拓方向:遠(yuǎn)鑒科技多維身份識(shí)別與可信認(rèn)證技術(shù)-國家工程實(shí)驗(yàn)室負(fù)責(zé)人。可讓相關(guān)的研究人員講解一下遠(yuǎn)鑒科技多模態(tài)身份識(shí)別和認(rèn)證系統(tǒng)的運(yùn)作過程和技術(shù)原理(聲紋+人臉+OTP+X)。AI慕課課程名稱可擬為:《遠(yuǎn)鑒科技多模態(tài)身份識(shí)別和認(rèn)證系統(tǒng)原理》。
知識(shí)圖譜:知識(shí)圖譜技術(shù)是基于現(xiàn)有數(shù)據(jù)的再加工,包括關(guān)系數(shù)據(jù)庫中的結(jié)構(gòu)化數(shù)據(jù)、文本或XML中的非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)、客戶數(shù)據(jù)、領(lǐng)域本體知識(shí)以及外部知識(shí),通過各種數(shù)據(jù)挖掘、信息抽取和知識(shí)融合技術(shù)形成一個(gè)統(tǒng)一的全局的知識(shí)庫。
整個(gè)知識(shí)圖譜技術(shù)的核心,就是如何把數(shù)據(jù)結(jié)構(gòu)化。在傳統(tǒng)的數(shù)據(jù)庫研究里面,我們已經(jīng)看到了數(shù)據(jù)是結(jié)構(gòu)化的。知識(shí)圖譜技術(shù),從某種程度上來說,是數(shù)據(jù)庫技術(shù)往前的一步,把傳統(tǒng)的表格結(jié)構(gòu)所不能處理的復(fù)雜的關(guān)系,用更新型的數(shù)據(jù)庫來進(jìn)行存儲(chǔ)、表達(dá)。這個(gè)技術(shù)雖然是從2012年開始才為大家所知,但從淵源上講,已經(jīng)有差不多15年到20年的發(fā)展時(shí)間了。
金融領(lǐng)域的知識(shí)圖譜
我們具體再來看金融知識(shí)圖譜,這是我們今天在中國市場上看到主要的各種類型的金融知識(shí)圖譜。這是一個(gè)很粗的分類,每一個(gè)分類下面,都會(huì)有很多更細(xì)分的分類。比如像前面的創(chuàng)投類數(shù)據(jù)庫,滕放騰總,文飛翔文總,還有郭穎哲郭總,他們接下來會(huì)分別向大家介紹自己的經(jīng)驗(yàn)。另外在很多其他類型的市場上,包括一級(jí)市場、二級(jí)市場,我們都看到各種不同的知識(shí)圖譜、數(shù)據(jù)庫陸陸續(xù)續(xù)出現(xiàn)。比如做A股、新三板的公司,其實(shí)還有做港股、美股的公司,各種基本面的數(shù)據(jù),行情的數(shù)據(jù),現(xiàn)在都在陸陸續(xù)續(xù)地知識(shí)圖譜化。以前大家只看 F10,現(xiàn)在一種智能的“F10”出現(xiàn)了,還有公告數(shù)據(jù)、研報(bào)數(shù)據(jù)的提取、公告研報(bào)的檢索等等。泛輿情數(shù)據(jù)、泛企業(yè)數(shù)據(jù)和各種工商數(shù)據(jù),都是我們今天看到的金融知識(shí)圖譜的不同分支。
從應(yīng)用上來講,我能想到的有十幾種。但實(shí)際上會(huì)遠(yuǎn)遠(yuǎn)不止這十幾種。讓人興奮的是,這里面的大多數(shù)應(yīng)用都是在過去一年里頭出現(xiàn)的。一年之前我列這個(gè)列表可能只有四五種,而現(xiàn)在我們可以列出十幾種。所以我們很難想象,明年我們會(huì)列出多少種。在各種投資的分支上面,我們可以看到知識(shí)圖譜有非常廣闊的應(yīng)用。
我覺得要做金融領(lǐng)域的知識(shí)圖譜,還是要從基本的金融數(shù)據(jù)開始,剛開始可能不能完全靠機(jī)器,還是要靠手工。我們要充分利用結(jié)構(gòu)化的數(shù)據(jù),實(shí)質(zhì)性更好的其實(shí)還是來源于文本也就是研報(bào),其中有很多有價(jià)值的數(shù)據(jù)。
最基本的是要有實(shí)體,其次要有更高級(jí)的知識(shí)結(jié)構(gòu)。接下來我們來看知識(shí)圖譜能不能夠做到量化金融。現(xiàn)在有許多學(xué)者,很確信在量化金融領(lǐng)域機(jī)器可以打敗人。現(xiàn)在百度在做概念選股,主題選股,語義就可以幫助做這個(gè)事情,輔助我們更好地進(jìn)行選股。畢竟現(xiàn)在信息太離散。人和人之間的關(guān)系更加不用說了,涉及的數(shù)據(jù)會(huì)更多。
金融搜索引擎——文因搜索
官網(wǎng):http://search.memect.cn/
文因互聯(lián)CEO鮑捷:知識(shí)圖譜的知識(shí)表現(xiàn)方法回顧與展望
在金融的世界里,信息浩瀚如云海,相信每位金融從業(yè)者都有過信息過剩的煩惱,面對(duì)著大量的上市公司公告、財(cái)報(bào)、研報(bào),新聞…,個(gè)人精力似乎總是不夠。現(xiàn)今信息和數(shù)據(jù)是如此地高速膨脹,我們似乎需要一種更為高效的信息處理方式。
數(shù)據(jù)經(jīng)過挖掘、加工處理之后,就能夠成為人們所需要的信息。借助技術(shù)的力量,從海量數(shù)據(jù)中提取有用信息,識(shí)別其中蘊(yùn)藏的模式、規(guī)律和相關(guān)關(guān)系,則是一種人類認(rèn)識(shí)世界的新方式。
例如,在上市公司財(cái)報(bào)中蘊(yùn)藏著大量的人工總結(jié),其中包括大量的因果關(guān)系。因果關(guān)系的識(shí)別可以幫助我們了解事件之間的來龍去脈,獲取事件的演化關(guān)系,有助于預(yù)測和決策。而基于這種認(rèn)識(shí),文因互聯(lián)的工程師王爽利用NLP技術(shù),對(duì)上市公司的年報(bào)進(jìn)行了一次因果關(guān)系的抽取的實(shí)驗(yàn)。
接下來,就讓我們來看看,在一份上市公司的年報(bào)中的一個(gè)抽取結(jié)果項(xiàng)目(下圖為代碼展示):
【raw_text】表示原始的表示因果關(guān)系的句子
【title_path】表示的是句子位于文檔中的位置
【financial_term】表示的是財(cái)務(wù)項(xiàng)目
【trend】表示的是該項(xiàng)目的變化趨勢
【amplitude】表示的是該項(xiàng)目的變換幅度
【cause】表示的是該項(xiàng)目的變化原因
通過這樣的提取工作,我們能夠在短短的幾分鐘之內(nèi)就可得知一份厚厚的年報(bào)中關(guān)鍵的“因果關(guān)系”信息。
AI慕課開拓方向:文因互聯(lián)CEO鮑捷、文因互聯(lián)工程師王爽等。可讓相關(guān)的研究人員講解一下文因互聯(lián)搜索引擎背后的巨大金融知識(shí)圖譜的構(gòu)建過程和技術(shù)細(xì)節(jié)。AI慕課課程名稱可擬為:《金融知識(shí)圖譜是如何一步一步構(gòu)建的》。
企業(yè)知識(shí)圖譜——海致大數(shù)據(jù)
海致大數(shù)據(jù)隸屬海致網(wǎng)絡(luò)技術(shù)(北京)有限公司,是國內(nèi)領(lǐng)先的大數(shù)據(jù)技術(shù)與服務(wù)公司,自成立以來已經(jīng)為二千多家企業(yè)提供了大數(shù)據(jù)咨詢、大數(shù)據(jù)平臺(tái)搭建、數(shù)據(jù)清洗、數(shù)據(jù)整合、數(shù)據(jù)挖掘、可視化數(shù)據(jù)分析等服務(wù)。其中包括中國聯(lián)通、某股份制銀行、青島銀行、海爾集團(tuán)、華聯(lián)超市、雀巢中國、圣戈班、伊利乳業(yè)、百度外賣、58到家等國際國內(nèi)知名企業(yè)。
官網(wǎng):http://www.haizhi.com/
構(gòu)建360度企業(yè)知識(shí)圖譜
通過整合企業(yè)內(nèi)外部數(shù)據(jù),我們快速構(gòu)建起支撐各類企業(yè)級(jí)應(yīng)用的語義實(shí)體庫,結(jié)合強(qiáng)大的圖分析引擎與知識(shí)推理技術(shù),提供了智能、靈活的交互式圖譜分析解決方案。通過建立360度企業(yè)知識(shí)圖譜,幫助某股份制銀行金融部利用大數(shù)據(jù)技術(shù)有效地提升了風(fēng)險(xiǎn)控制和對(duì)公營銷效率。
融入業(yè)務(wù)系統(tǒng),從“人找事”變?yōu)椤笆抡胰恕?/p>
在360度對(duì)公業(yè)務(wù)圖譜之上,根據(jù)我們和客戶一起從業(yè)務(wù)中總結(jié)出來的各種風(fēng)險(xiǎn)與營銷事件規(guī)則,圖譜自動(dòng)將每個(gè)客戶經(jīng)理必須關(guān)注的風(fēng)險(xiǎn)信息和營銷信息融入行內(nèi)業(yè)務(wù)系統(tǒng)并推送到相關(guān)責(zé)任人的手機(jī)客戶 端。讓這些過去需要客戶經(jīng)理和相關(guān)數(shù)據(jù)分析人員辛苦挖掘?qū)ふ业男盘?hào),成為推動(dòng)一線業(yè)務(wù)人員行動(dòng)的簡潔指令與參考,并實(shí)時(shí)進(jìn)行監(jiān)督和反饋。
AI慕課開拓方向:海致大數(shù)據(jù)CEO。可讓相關(guān)的研究人員講解一下海致大數(shù)據(jù)360度企業(yè)知識(shí)圖譜的構(gòu)建所涉及的關(guān)鍵技術(shù)。AI慕課課程名稱可擬為:《360度企業(yè)知識(shí)圖譜之技術(shù)基礎(chǔ)》。
金融領(lǐng)域的機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)有多種衍生方法:包括監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等。不同的目的,需要不同種類的機(jī)器學(xué)習(xí)方法。
在金融領(lǐng)域,監(jiān)督學(xué)習(xí)的目的是建立兩個(gè)數(shù)據(jù)集之間的關(guān)系,并使用一個(gè)數(shù)據(jù)集預(yù)測另一個(gè)數(shù)據(jù)集;無監(jiān)督學(xué)習(xí)的目的是嘗試了解數(shù)據(jù)結(jié)構(gòu),并確定其背后的主要規(guī)則;深度學(xué)習(xí)的目的是使用多層神經(jīng)網(wǎng)絡(luò)來分析事物背后的發(fā)展趨勢;強(qiáng)化學(xué)習(xí)使用算法來尋找最有價(jià)值的交易策略。
J.P. Morgan報(bào)告全文下載:Big Data and AI Strategies - Machine Learning and Alternative Data Approach to Investing - J.P.Morgan
1. 使用監(jiān)督學(xué)習(xí)來預(yù)測趨勢
摩根大通認(rèn)為監(jiān)督學(xué)習(xí)算法通過對(duì)歷史財(cái)務(wù)數(shù)據(jù)的分析,可以找到規(guī)律進(jìn)行預(yù)測。監(jiān)督學(xué)習(xí)算法有兩種形式:回歸和分類方式。回歸形式的監(jiān)督學(xué)習(xí)方法嘗試基于輸入變量來預(yù)測輸出。例如:如果通貨膨脹速度加快,它可能會(huì)判斷下一步市場的走向。分類方法則是將數(shù)據(jù)分類到已有類別中。
2. 無監(jiān)督學(xué)習(xí)將被用于識(shí)別大量變量之間的關(guān)系
在無監(jiān)督學(xué)習(xí)中,機(jī)器被輸入了一整套資產(chǎn)組合的回報(bào),同時(shí)并不知道其中的關(guān)聯(lián)和獨(dú)立變量。無監(jiān)督學(xué)習(xí)方法被歸為聚類或因素分析。聚類分析基于一些相似性概念將數(shù)據(jù)集分成較小的組。例如:它可以包含歷史數(shù)據(jù)中高低波動(dòng)性、經(jīng)濟(jì)上升和下降速率或通貨膨脹的增減。因素分析旨在識(shí)別數(shù)據(jù)的主要內(nèi)在規(guī)律或確定數(shù)據(jù)的最佳表示方法。例如:收益曲線的運(yùn)動(dòng)可以被解釋為曲線的平行位移、曲線變陡峭或變凸。在復(fù)雜資產(chǎn)組合中,因素分析提煉出數(shù)據(jù)的主驅(qū)動(dòng)力,如動(dòng)量、價(jià)值、進(jìn)位、波動(dòng)或流動(dòng)性。
3. 深度學(xué)習(xí)系統(tǒng)將承擔(dān)起難以定義但易于執(zhí)行的任務(wù)
深度學(xué)習(xí)特別適合非結(jié)構(gòu)化大數(shù)據(jù)集的預(yù)處理:例如,可應(yīng)用于分析衛(wèi)星圖像中的汽車、或新聞稿中的情緒。深度學(xué)習(xí)模型可用虛擬財(cái)務(wù)數(shù)據(jù)來預(yù)測市場修正概率。深度學(xué)習(xí)方法基于神經(jīng)網(wǎng)絡(luò),而神經(jīng)網(wǎng)絡(luò)是受到人類大腦神經(jīng)活動(dòng)的形式而受到啟發(fā)的。在網(wǎng)絡(luò)中,每個(gè)神經(jīng)元接收來自其他神經(jīng)元的輸入,并計(jì)算這些「神經(jīng)元」的加權(quán)平均值。權(quán)重的計(jì)算則基于從歷史數(shù)據(jù)中得來的經(jīng)驗(yàn)。神經(jīng)網(wǎng)絡(luò)的特征指標(biāo),其中包括成本函數(shù)、優(yōu)化器、初始化方案、激活函數(shù)和正則化方案。
4. 強(qiáng)化學(xué)習(xí)將被用于行動(dòng)選擇和收益最大化
強(qiáng)化學(xué)習(xí)的目標(biāo)是選擇一系列成功的行動(dòng)以最大化目標(biāo)(或累積)收益。不同于監(jiān)督學(xué)習(xí),強(qiáng)化學(xué)習(xí)模型并不知道每一步的確切行動(dòng)是什么。摩根大通的電子交易部門已經(jīng)開發(fā)了一些基于強(qiáng)化學(xué)習(xí)的算法。下圖顯示了該公司的一些機(jī)器學(xué)習(xí)模型。
數(shù)庫科技
數(shù)庫科技是一家基于機(jī)器學(xué)習(xí)算法的大數(shù)據(jù)量化分析公司,致力于為用戶提供智能化的數(shù)據(jù)服務(wù)。公司成立于2009年,由供職于國內(nèi)外著名金融機(jī)構(gòu)以及技術(shù)方面的專業(yè)人士共同組建。
官網(wǎng):http://www.chinascope.com/
通過數(shù)庫獨(dú)家的挖掘以及分析工具,可以使非結(jié)構(gòu)化、半結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)化;使原本無序沒有關(guān)聯(lián)的數(shù)據(jù)產(chǎn)生關(guān)聯(lián)性,進(jìn)而實(shí)現(xiàn)數(shù)據(jù)智能化,為個(gè)人投資、金融機(jī)構(gòu)投研提供精準(zhǔn)而又全面的技術(shù)服務(wù)。
關(guān)于數(shù)庫科技是如何運(yùn)用機(jī)器學(xué)習(xí)技術(shù)到金融領(lǐng)域的,請(qǐng)查閱數(shù)庫科技CTO夏磊的報(bào)告:如何將機(jī)器學(xué)習(xí)應(yīng)用在金融信息處理中
機(jī)器學(xué)習(xí)是實(shí)現(xiàn)人工智能的基礎(chǔ),數(shù)庫科技使用的機(jī)器學(xué)習(xí)算法有哪些呢?
分類算法
情緒分類: SVM-準(zhǔn)確率89%、LSTM-準(zhǔn)確率85%
擇時(shí)策略: HMM
推薦算法
標(biāo)簽關(guān)聯(lián)、知識(shí)推薦
聚類算法
主題提取
例子1:深度學(xué)習(xí)在命名實(shí)體識(shí)別上的應(yīng)用
例子2:新聞情緒分析
例子3:主題聚類與新主題發(fā)現(xiàn)
AI慕課開拓方向:數(shù)庫科技CTO夏磊。可讓其或者相關(guān)的技術(shù)人員講解一下數(shù)庫科技運(yùn)用機(jī)器學(xué)習(xí)技術(shù)用于解決金融數(shù)據(jù)處理問題的一些實(shí)際案例,可以按照層次遞進(jìn)講解,依次講解分類、關(guān)聯(lián)(推薦)、聚類、回歸等算法。AI慕課課程名稱可擬為:《機(jī)器學(xué)習(xí)在金融數(shù)據(jù)處理中的應(yīng)用》。
技術(shù)綜合:智能投顧
組合的技術(shù):自然語言處理、金融知識(shí)圖譜、量化投資、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘
智能投顧(robo-advisor),是指計(jì)算機(jī)基于客戶年齡、收入水平、家庭結(jié)構(gòu)、理財(cái)需求、風(fēng)險(xiǎn)承受能力、風(fēng)險(xiǎn)偏好等因素,運(yùn)用現(xiàn)代投資組合理論,通過算法搭建數(shù)據(jù)模型,利用人工智能技術(shù)和網(wǎng)絡(luò)平臺(tái)代替人類提供理財(cái)顧問服務(wù)。
根據(jù)美國金融監(jiān)管局(FINRA)2016年3月提出的標(biāo)準(zhǔn),智能投顧服務(wù)包括:客戶分析、大類資產(chǎn)配置、投資組合選擇、交易執(zhí)行、投資組合再平衡、稅收規(guī)劃、投資組合分析。
智能投顧旨在用最少的人力,基于軟件提供的量化算法,給客戶提供理財(cái)組合管理的建議,自動(dòng)化的配置、管理并優(yōu)化客戶的資產(chǎn)。
投顧給出的都是一套資產(chǎn)配置方案,經(jīng)典的資產(chǎn)配置策略以 Markowitz 的均值-方差模型為基礎(chǔ),目標(biāo)是在給定組合風(fēng)險(xiǎn)水平的條件下,尋找預(yù)期收益最高的權(quán)重配置。組合對(duì)降低波動(dòng)性有顯著的作用。
就基金管理類型來說,有兩種方案類型:一種是主動(dòng)管理型,一種是被動(dòng)管理型。主動(dòng)管理是為了獲取超額收益(alpha),被動(dòng)管理則是為了追蹤某個(gè)指數(shù)獲取平均收益(beta)。
在這場主動(dòng)投資與被動(dòng)投資的爭論中,各自的擁護(hù)者各持己見,主要點(diǎn)在于:主動(dòng)型管理基金帶來的超額收益是否能夠覆蓋其像用戶收取的管理費(fèi)成本,或者,退一步講,戰(zhàn)勝市場的概率高么?
對(duì)此國內(nèi)外的智能投顧系統(tǒng)有著不同的觀點(diǎn):
國外智能投顧機(jī)構(gòu),例如 Wealthfront,Betterment 等采用的都是指數(shù)基金的配置方案,也就是利用被動(dòng)基金進(jìn)行資產(chǎn)配置。利用指數(shù)基金進(jìn)行配置可以減少這部分費(fèi)率的費(fèi)用。
國內(nèi) ETF 種類較少,投資者教育也在一個(gè)進(jìn)行階段。國內(nèi)的大部分投顧,例如理財(cái)魔方、摩羯智投,都是通過基金評(píng)級(jí)選出相應(yīng)的主動(dòng)型基金,來做的資產(chǎn)配置。
智能投顧的系統(tǒng)設(shè)計(jì)
要想完成傳統(tǒng)投顧到線下投顧的轉(zhuǎn)化,簡單的切分,需要完成五塊內(nèi)容:
1)用戶信息的處理
用戶信息包括對(duì)客觀信息(年齡因素、家庭收入、可投資金額、家庭負(fù)擔(dān)、投資經(jīng)驗(yàn))及對(duì)主觀信息(可接受虧損收益、其他信息因素)的處理及建模,同時(shí)包括后續(xù)一些反饋數(shù)據(jù),例如用戶交互數(shù)據(jù)、用戶行為數(shù)據(jù)等對(duì)用戶建模的模型進(jìn)行迭代優(yōu)化。
2)資產(chǎn)信息的處理及匹配及建模
選定要參與配置的產(chǎn)品類型,對(duì)于其中標(biāo)準(zhǔn)產(chǎn)品,采用一些公允評(píng)級(jí)機(jī)構(gòu)或者根據(jù)收益、回撤、波動(dòng)等建立一套評(píng)價(jià)體系。篩選出可以參與配置的產(chǎn)品,并賦予其相應(yīng)的屬性值。對(duì)于非標(biāo)準(zhǔn)產(chǎn)品,則需要根據(jù)其產(chǎn)品特性建立標(biāo)準(zhǔn),進(jìn)行評(píng)價(jià)并賦值入庫。
根據(jù)用戶信息、資產(chǎn)信息,以及配置目標(biāo),建立模型,并通過各類市場信息、用戶反饋信息進(jìn)行方案的迭代優(yōu)化,權(quán)衡輸出相應(yīng)的資產(chǎn)配置的方案,并按需給出相應(yīng)的調(diào)倉建議或者操作。
3)交易模塊的設(shè)置
根據(jù)選定的產(chǎn)品,設(shè)計(jì)整套的交易模塊,以支持整體流程的完成度。交易模塊的設(shè)置需要在考量完成度的同時(shí),考慮到整體用戶體驗(yàn)。
4)投后追蹤服務(wù)
投后對(duì)用戶賬戶的定期分析,并給出其相應(yīng)的資產(chǎn)調(diào)整建議,也是智能投顧非常重要的部分。例如 schwab,就給用戶提供了稅收虧損收割和資產(chǎn)再平衡等功能。這也是智能投顧方案的核心競爭力之一,也是其相比傳統(tǒng)投顧的優(yōu)勢所在。
5) 底層系統(tǒng)架構(gòu)支持
以上模塊的實(shí)現(xiàn)均需要相應(yīng)的底層系統(tǒng)架構(gòu)的支持。
總結(jié)
取決于傳統(tǒng)投顧服務(wù)的局限性,并伴隨國內(nèi)外用戶可投資資產(chǎn)的增多,日益增長的投顧需求,智能投顧能夠針對(duì)更廣大的投資者提供專業(yè)化服務(wù)。本質(zhì)上來說,一切技術(shù)創(chuàng)新都是為了提升效率。
與傳統(tǒng)模式相比,互聯(lián)網(wǎng)最大的優(yōu)勢是其極低的邊際成本,這也符合了目前的市場趨勢。就目前而言,無論在投資方案還是系統(tǒng)設(shè)計(jì)上,智能投顧雖是大勢所趨,但探索的道路仍舊漫長。
智能投顧商業(yè)模式
按照人為參與程度的高低,智能投顧分為機(jī)器為主,以人為主和人機(jī)結(jié)合三種模式,并相對(duì)應(yīng)六種的主流的商業(yè)模式。其中,機(jī)器為主中,主要有三種模式,一種是基于現(xiàn)代資產(chǎn)組合的大類資產(chǎn)配置模式,一種是基于量化投資的投資策略型模式,還有一種是基于大數(shù)據(jù)分析的投資輔助型模式;以人為主中,社交跟投型模式是目前主流模式;人機(jī)結(jié)合中,又可細(xì)分為線上引流至線下的O2O模式以及原有平臺(tái)在智能投顧方向上的功能擴(kuò)展。
關(guān)于智能投顧商業(yè)模式和市場公司解析請(qǐng)參考FDL的《智能投顧面面觀之公司篇》文章
財(cái)鯨智能投顧
財(cái)鯨將作為全球股票交易的智能投顧服務(wù)商,將為中國投資者提供全球化的投資熱點(diǎn)精選、優(yōu)質(zhì)股票及組合推薦、便捷開戶及交易、一鍵購買與智能調(diào)倉等一站式投資服務(wù)。每一個(gè)熱點(diǎn)資訊都可能對(duì)應(yīng)于一個(gè)投資機(jī)會(huì),在財(cái)鯨,投資者可以便捷的獲取全球熱點(diǎn)投資機(jī)會(huì),可以得到投資機(jī)會(huì)所對(duì)應(yīng)的優(yōu)質(zhì)投資組合,并基于財(cái)鯨智能化的調(diào)倉建議及便捷化的全球交易系統(tǒng)進(jìn)行投資決策,獲得個(gè)性化的投資體驗(yàn)。
在此過程中,財(cái)鯨將幫助中國投資者一次性解決在全球投資過程中所遭遇的語言及信息獲取困難、海量投資標(biāo)的無從選擇、監(jiān)管和服務(wù)受限以及投資過程中繁雜的開戶、交易、組合調(diào)整等痛點(diǎn);財(cái)鯨還將發(fā)揮其在海外金融市場和監(jiān)管方面的專業(yè)經(jīng)驗(yàn),以及大數(shù)據(jù)、人工智能及量化策略算法,并結(jié)合專業(yè)金融從業(yè)人員的分析復(fù)核等,實(shí)現(xiàn)專業(yè)、靠譜、個(gè)性化的服務(wù)。
財(cái)鯨致力于為中國投資者量身打造一站式全球理財(cái)綜合平臺(tái)。通過準(zhǔn)確把握客戶需求,整合國內(nèi)與海外優(yōu)質(zhì)金融產(chǎn)品和服務(wù),提供線上線下相結(jié)合的服務(wù)和交易通道,滿足客戶不同階段的理財(cái)需求,為中國投資者提供個(gè)性化的全球資產(chǎn)配置建議和投資產(chǎn)品,實(shí)現(xiàn)個(gè)人和家族財(cái)富的保值增值。
主要產(chǎn)品/服務(wù):提供人工智能投資配置建議,開創(chuàng)產(chǎn)品超市、智能配置、安全交易的一體化創(chuàng)新型互聯(lián)網(wǎng)財(cái)富管理平臺(tái)。
官網(wǎng):http://www.caigin.com/
財(cái)鯨智能投顧的核心技術(shù)是“財(cái)鯨深海智能投資系統(tǒng)(Deep Sea)”,該系統(tǒng)由財(cái)鯨團(tuán)隊(duì)自主研發(fā),包含海神(多維空間交互匹配平臺(tái))、遨游(神經(jīng)網(wǎng)絡(luò)認(rèn)知選股系統(tǒng))、豚音(智能分析器配置優(yōu)化系統(tǒng))、洋流(量化擇時(shí)動(dòng)態(tài)調(diào)倉系統(tǒng))、海納(結(jié)構(gòu)化大數(shù)據(jù)平臺(tái))和驚濤(脈沖交易系統(tǒng))。
憑借財(cái)鯨深海智能投資系統(tǒng),財(cái)鯨擁有強(qiáng)大的金融搜索和證券評(píng)估體系,能為客戶提供全球范圍內(nèi)的優(yōu)質(zhì)標(biāo)的,再通過投研專家團(tuán)隊(duì)的嚴(yán)格篩選,根據(jù)投資者不同的投資需求與風(fēng)險(xiǎn)承受能力,為投資者提供量身定制的全球資產(chǎn)配置方案。投資過程中系統(tǒng)每天再對(duì)組合從市場、行業(yè)、組合、用戶等層面進(jìn)行監(jiān)測,出現(xiàn)變動(dòng)時(shí)給用戶提出風(fēng)險(xiǎn)警示。
AI慕課開拓方向:財(cái)鯨智能投顧C(jī)IO王蓁。可讓其或者相關(guān)的技術(shù)人員講解一下財(cái)鯨智能投顧的系統(tǒng)架構(gòu),具體講解一個(gè)智能投顧系統(tǒng)的模塊構(gòu)成,如何構(gòu)建一個(gè)有效的智能投顧系統(tǒng)。AI慕課課程名稱可擬為:《智能投顧的系統(tǒng)架構(gòu)》。
另外,智能投顧在做資產(chǎn)配置時(shí),涉及到很多量化投資的技術(shù),可以結(jié)合量化投資技術(shù),專門講解一些相關(guān)的量化投資策略,如量化選股、量化擇時(shí)、套利策略(期貨套利、期權(quán)套利、統(tǒng)計(jì)套利)、算法交易、SVM、隨機(jī)過程、量化對(duì)沖等等,策略可以參考丁鵬的著作:《量化投資——策略與技術(shù)》,按照這個(gè)來設(shè)計(jì)課程。或者讓通聯(lián)數(shù)據(jù)旗下負(fù)責(zé)優(yōu)礦產(chǎn)品的做策略的同事來講解相關(guān)的量化投資策略,使用Python平臺(tái),AI慕課課程名稱可擬為:《基于Python的量化投資基礎(chǔ)與進(jìn)階》
量化投資策略概覽可以參考FDL的《全棧金融工程師算法技術(shù)解構(gòu)》文章中對(duì)量化投資這塊的描述。
課程可以參考優(yōu)礦的一些技術(shù)帖子:優(yōu)礦手把手教你入門量化投資:《量化分析師的Python日記》系列