AI Edge:百度新自駕車數(shù)據(jù)集 | Stack Overflow 年度調(diào)查:對AI的擔憂 | Allen AI 新的常識問答數(shù)據(jù)集秒殺傳統(tǒng)算法 | 微軟發(fā)布深度學習框架的“羅塞塔石碑”...

From Import AI
謝謝“極光火狐貍” 的贊賞,拿到過最開心的兩塊錢。 _

百度,豐田以及伯克利的研究人員組織自駕車挑戰(zhàn)賽,來自百度新推出的自駕車數(shù)據(jù)集:

... ApolloScape 增加了中國自駕車研究人員的數(shù)據(jù),另外百度說它已加入伯克利的 DeepDrive 自駕車 AI 聯(lián)盟......

一個新的競賽和數(shù)據(jù)集可能會給研究人員提供更好的方法來測試自駕車 AI 的功能和進展。

數(shù)據(jù)集

來自百度的 ApolloScape 數(shù)據(jù)集包含將近 200,000 張RGB圖像,并有相應的逐像素語義注釋。每一幀都有來自25個語義類的標注,包括:汽車,摩托車,人行道,交通錐,垃圾桶,植被等等。每幅圖像的分辨率均為3384 x 2710,每幀間隔一米距離。截至2018年3月8日,已有8萬張圖片。

更多信息Many of the researchers linked to ApolloScape will betalking at a session on autonomous cars at the IEEE Intelligent VehiclesSymposium in China

競賽

新的 WAD 比賽將給人們測試和開發(fā) ApolloScape 和 Berkeley DeepDrive (DeepDrive 數(shù)據(jù)集包含100,000個視頻剪輯,每個視頻剪輯大約40秒長,有一個關鍵幀得到標注) 的數(shù)據(jù)集上的AI 系統(tǒng)的機會。獎金大約為10,000美元,研究人員正在征集有關研究技術的論文:可駕駛區(qū)域分割(drivable area segmentation 能夠找出場景的區(qū)域對應哪些標簽,以及哪些區(qū)域安全); 道路物體檢測(找出路上的東西); 學習從一個語義領域遷移到另一個語義領域,特別是從Berkeley數(shù)據(jù)集(在美國加利福尼亞州拍攝)的訓練到 ApolloScape 數(shù)據(jù)集(在中國北京拍攝)。 更多: 關于'WAD'比賽

面對100,000+開發(fā)人員的調(diào)查顯示對 AI 的擔憂

......開發(fā)人員認為危險和令人興奮的,以及誰該負責......

開發(fā)者社區(qū) StackOverflow 發(fā)布了其社區(qū)年度調(diào)查結果,今年它問到了AI:

  • 開發(fā)人員認為“危險”的

    提高工作自動化程度(40.8%)

  • 開發(fā)人員認為“令人興奮”的

    人工智能超越人類智能,也就是奇點 (Singularity)(28%)

奇點理論,一個根據(jù)技術發(fā)展史總結出的觀點,認為未來將要發(fā)生一件不可避免的事件──技術發(fā)展將會在很短的時間內(nèi)發(fā)生極大而接近于無限的進步

  • 誰需要考慮AI的后果:

    • 開發(fā)人員或創(chuàng)建AI的人員:47.8%

    • 政府或其他監(jiān)管機構:27.9%

  • 不同的角色=不同的擔憂

    技術專家們更傾向于說,比起奇點問題他們更關心公平問題,而設計師和移動開發(fā)人員傾向于更關心奇點。

閱讀更多:開發(fā)者調(diào)查結果2018年(StackOverFlow)。

Allen AI 用新的常識問答數(shù)據(jù)集來讓現(xiàn)在的算法跪一地:

...常識問題旨在挑戰(zhàn)和挫敗當今最優(yōu)秀的算法...

在宣布了1.25億美元的融資,還有如何致力于開展推動 AI 處理常識方面的研究后,艾倫人工智能研究所 (Allen Institute for Artificial Intelligence,簡稱AI2) 發(fā)布了一項新的 ARC 挑戰(zhàn)和數(shù)據(jù)集,研究人員可以用其開發(fā)更智能的算法。

數(shù)據(jù)集

主要的 ARC 測試包含 7787 個自然科學問題,分為一組簡單集和一組困難集。困難集是那些用基于檢索的和詞語共現(xiàn)算法不能正確回答的問題。同時,AI2 正在發(fā)布“ARC語料庫”,其收集了1400萬篇與ARC相關知識的科學相關句,以支持 ARC 算法的開發(fā)。這個語料庫包含與95%挑戰(zhàn)問題相關的知識。

神經(jīng)網(wǎng)絡基線模型

AI2還發(fā)布了三個基線模型,這些模型已經(jīng)在挑戰(zhàn)中進行了測試,在簡單集中取得了一些成功,但卻不能比困難集中的隨機選擇更好。這些模型包括 decomposable attention model(DecompAttn),Bidirectional Attention Flow(BiDAF)和 decomposed graph entailment model(DGEM)。

ARC中的問題旨在測試從定義到空間到代數(shù)知識的所有內(nèi)容,鼓勵使用能夠抽象和概括大數(shù)據(jù)語料庫概念的系統(tǒng)。

基線結果

ARC非常具有挑戰(zhàn)性:AI2 以其神經(jīng)網(wǎng)絡方法為基準發(fā)現(xiàn),簡單問題的分數(shù)最高只為60%,更具挑戰(zhàn)性的問題的分數(shù)最高只有27%。

示例問題

“通過觀察它可以確定哪種礦物性質(zhì)?

(A)光澤[正確](B)質(zhì)量(C)重量(D)硬度”。

SQUAD 接班人

ARC 可能是斯坦福問答數(shù)據(jù)集(SQUAD)和挑戰(zhàn)的可行繼任者; SQuAD 競賽最近取得了一系列里程碑似的成果,從微軟到阿里巴巴的再到科大訊飛都在開發(fā) SQUAD 的解決方案,這些解決方案的表現(xiàn)接近人的表現(xiàn)(ExactMatch 為82%,F(xiàn)1為91%)。

對 SQUAD 主題領域的深入評估讓我們更直觀地了解,為什么這個測試的分數(shù)比 ARC 高得多 - 簡而言之,SQUAD更容易些; 它將大量信息豐富的文本與諸如“大多數(shù)教師從哪里獲得憑據(jù)?”等基本問題放在一起。可以從文本中就檢索到,而不需要太多抽象。

為什么很重要

“我們發(fā)現(xiàn)所有測試的基線系統(tǒng)在挑戰(zhàn)集中都不會超出隨機基線,包括兩個在 SNLI 和 SQuAD 上具有高性能的神經(jīng)模型,” 研究人員寫道。現(xiàn)在最大的問題是這個數(shù)據(jù)集在 Goldilocks 系譜上的位置 - 這是否太容易(請參考Facebook的早期記憶網(wǎng)絡的測試)或太難或恰到好處?如果一個系統(tǒng)在ARC的更具挑戰(zhàn)性的問題上得到75%左右的話,這似乎意味著理解和知識表示向前重要的一大步呢

更多Think you have Solved Question Answering? Try ARC, theAI2 Reasoning Challenge (Arxiv).

更多SQuAD: 100,000+ Questions for Machine Comprehension ofText (Arxiv)

微軟發(fā)布深度學習框架的“羅塞塔石碑”:

羅塞塔石碑,Rosetta Stone.

原本只是一塊刻有古埃及法老托勒密五世詔書的石碑,石碑上用希臘文字、古埃及文字和當時的通俗體文字刻了同樣的內(nèi)容,這使得近代的考古學家得以有機會對照各語言版本的內(nèi)容后,解讀出已經(jīng)失傳千余年的埃及象形文之意義與結構,而成為今日研究古埃及歷史的重要里程碑。之后也指代類似的事物。

... GitHub repo為您提供以下幾種不同方式顯示的基本操作...

微軟發(fā)布了一個GitHub倉庫,其中包含了Caffe2,Chainer,CNTK,Gluon,Keras(后端CNTK / TensorFlow / Theano),Tensorflow,Lasagna,MXNet,PyTorch 和 Julia-Knet 等各個框架。 這里的想法是,如果你在其中一個框架中閱讀一種算法,則可以使用這個算法來了解其他框架。

“我們今天發(fā)布的完整版本就像是一個深度學習框架的Rosetta Stone,展示了在不同框架中的模型構建端到端過程,” 研究人員在一篇博文中寫道,該文章還提供了一些粗略的CNN和RNN的基準訓練時間。

閱讀更多Comparing Deep Learning Frameworks: A Rosetta StoneApproach (Microsoft Tech Net).代碼(Github)

進化算法對 AI 設計的奇怪,美妙,而又潛在的危險影響:

[圖片上傳失敗...(image-e41654-1521681038341)]

...為什么AI安全社群可以從進化中學習...

一個國際研究人員組成的聯(lián)盟發(fā)布了一些奇怪且經(jīng)常有趣的發(fā)現(xiàn),其中進化算法對其被要求解決的任務,找出了一些讓人大跌眼鏡的解決方案和技巧。該論文包含了一系列很有啟發(fā)性的例子,其中算法顛覆了人類觀察者的預期,其中包括:

  • 機會主義的空翻:當試圖讓生物進化進行跳躍時,一些智能體發(fā)現(xiàn)他們可以演變非常高的身體,然后空翻,獲得與地面距離成比例的獎勵。

  • 毫無意義的程序:當研究人員試圖用GenProg 來進化代碼以解決一個錯誤的數(shù)據(jù)排序程序時,GenProg 進化出了一個解決方案:該程序會返回一個空列表,因為空列表不能被計為負值因為它不包含任何內(nèi)容。

  • 物理學黑客:一個機器人計算出正確的振動頻率,以利用在物理模擬器的地板上發(fā)現(xiàn)摩擦bug,讓它通過bug在地面上推動自身。

  • 進化總能找到出路:另一種類型的錯誤是即使研究人員認為這種方式是不可能的,進化也可能成功,就像一個六腿機器人能夠在腳不接觸地面的情況下快速行走一樣(謎底揭曉:它翻轉過來背靠地面,并用腿的運動來推動自己)。

  • 還有很多很多

研究人員認為,進化也可能反應 AI 安全中一些令人不安的問題。研究人員寫道:“數(shù)字化進化中令人驚訝的創(chuàng)造性也具有其他跨領域的影響。例如,本文中”瘋狂選擇“的很多例子都與 AI 安全這樣的新興領域相關。 “因此,這些小故事可以充當進化的證據(jù) - 無論是生物的還是計算的 - 都有內(nèi)在的創(chuàng)造性,并且應該經(jīng)常會是讓人驚訝,高興,甚至強過我們?!?/p>

更多The Surprising Creativity of Digital Evolution: ACollection of Anecdotes from the Evolutionary Computation and Artificial LifeResearch Communities (Arxiv).

自從有了神經(jīng)教練們,我們的 AI 性能也提高啦:

... 也就是,為什么我這有多名專家老師指導的小學生能打敗你那有更大資源但沒老師的高中生......

DeepMind 的研究展示了,如何通過傳輸預先訓練的“教師”智能體的知識,來提高特定智能體對某項任務的績效。該技術在訓練 AI 智能體方面產(chǎn)生了顯著的加速效應,并有些證據(jù)表明,被教授的智能體獲得比沒教的智能更高的性能。

該技術有兩個變種:單師和多師; 如預期的那樣,通過多名教師進行過預訓練的代理比單一訓練的代理要更好。

奇怪而微妙

這種方法有一些特點對開發(fā)更復雜的 AI 智能體似乎有幫助:在一項任務中,DeepMind 用智能體測試如何用短期記憶來獲得高分時。 '小'智能體(只有兩個卷積層)通常無法學會使用記憶,因此也就無法達到某個闕值以上的分數(shù),但通過與多位專業(yè)老師一起訓練后的'小'智能體,卻可以完成任務。

“這很讓人驚訝,因為 Kickstarting 機制只能指導學生智能體采取哪個行動:它不會規(guī)定學生如何構建其內(nèi)部記憶狀態(tài)。然而,學生只能通過記住下一輪開始前的信息來預測教師的行為,這對短期記憶的形成似乎是強大的監(jiān)督信號,我們發(fā)現(xiàn)這與最好的人類教育者的教導方式非常相似:不告訴學生去想什么,而是簡單地讓學生在豐富的學習環(huán)境中為自己學習?!?研究人員寫道。

為什么很重要

像這樣的趨勢表明,科學家可以通過使用這種預先訓練的技術來更好地評估新代理,從而加快自己的研究。這進一步證實了 AI 研究的關鍵輸入將從預先標記的靜態(tài)數(shù)據(jù)集轉為計算。盡管應該指出,這里的數(shù)據(jù)隱含在研究人員可訪問的程序性、可修改的模擬器形式中。更具推測性的是,這意味著可以使用教師混合訓練復雜的智能體,這些智能體的能力遠遠超過其任何一位先輩的能力。

更多:Kickstarting Deep Reinforcement Learning (Arxiv).

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內(nèi)容