數據科學簡訊 2023-03-07


頭條


Brave Search 推出 AI 支持的摘要功能

AI 驅動的功能正在搜索引擎中大量涌現。 Brave Search 推出了一項新的“Summarizer”功能,該功能由不同的大型語言模型 (LLM) 提供支持——OpenAI 的 GPT 技術不是其中之一。顧名思義,它的工作是提供使用不同來源的搜索查詢的概要。摘要功能可供桌面和移動設備上的所有 Brave Search 用戶使用——可通過任何瀏覽器訪問。

2022 年 100 篇被引用次數最多的 AI 論文

谷歌仍然在 AI 研究中占據首位,加州大學伯克利分校在學術團體中享有這一榮譽。考慮到來自 Google 和 Deepmind 等團隊的論文數量,令人印象深刻的是,規模小得多的團隊發表的論文要少得多,但可能更有影響力。

200 年歷史的數學打開了 AI 的神秘黑匣子

無論是設計微芯片還是構想新蛋白質,有時神經網絡似乎無所不能。然而,臭名昭著的是,這些受大腦啟發的人工智能系統以神秘的方式工作,引發了人們對它們所做的事情可能沒有任何意義的擔憂。一項新的研究發現,新的研究表明,已有 200 年歷史的數學可以幫助闡明神經網絡如何執行復雜的任務,例如預測氣候或模擬湍流。研究人員說,這反過來可能有助于提高神經網絡的準確性和它們的學習速度。


研究


通過 ELBO 最大化的鏡頭更好地理解擴散

就樣本質量而言,擴散是目前最好的生成方法之一。這來自損失和去噪過程的良好特性。在社區中,每步噪聲使用不同的加權方案,這導致不同的經驗結果。事實證明,這些非均勻加權方案可以從似然最大化的角度來理解。這是朝著更深入地了解這一現代主力的理論邁出的重要一步。

文本生成與機器人控制

由于機器人缺乏物理世界的經驗,因此將大型語言模型應用于機器人具有挑戰性。為了克服這個問題,使用引導解碼策略來構建一個既可能根據語言模型又可以在環境中實現的動作序列。該策略通過利用兩種模型的知識來解決機器人環境中的復雜任務。他們將自己的工作與 SayCan 進行比較。

無限大小的擴散恢復

本文討論了擴散模型在零鏡頭圖像恢復中的應用,并提出了一種在保持零鏡頭優良特性的同時處理任意尺寸圖像的方法。所提出的方法稱為 Mask-Shift Restoration,解決局部不連貫,而 Hierarchical Restoration 減輕域外問題。這些簡單、無參數的方法不僅可以用于圖像恢復,還可以用于無限大小的圖像生成。


工程


對加速多 GPU 訓練感興趣?梯度積累是你的瓶頸

如果你不小心,分布式 Pytorch 可能會非常慢。在多個 GPU 上運行模型時,您會以預定義的間隔取所有梯度更新的平均值。但是,如果您不小心,您的代碼將在 GPU 之間同步每次向后傳遞。

早期輟學以減輕神經網絡中的欠擬合

該研究表明,僅在訓練的初始階段應用的早期退出可以通過減少梯度的方向方差并將它們與整個數據集的梯度對齊來減輕欠擬合。所提出的方法不斷提高各種視覺任務的泛化精度,并鼓勵對深度學習中的正則化進行進一步研究。

上下文集群:視覺表示的新范例

這項工作引入了上下文聚類 (CoCs),這是一種新的視覺表示范例,它將圖像視為一組無組織的點,并通過簡化的聚類算法提取特征。 CoC 是無卷積和無注意力的,僅依靠聚類進行空間交互。盡管沒有以最先進的性能為目標,但 CoC 在多個基準測試中取得了與 ConvNets 或 ViTs 相當甚至更好的結果。


雜七雜八


ChatGPT 是如何建立的內幕

為了了解 ChatGPT 背后的內幕——它是如何制作的,OpenAI 自發布以來如何對其進行更新,以及它的制造者如何看待它的成功——作者與四個幫助構建它的人進行了交談。他們是 Sandhini Agarwal(在 OpenAI 從事政策工作)、Liam Fedus(從事 ChatGPT 工作的科學家)、John Schulman(OpenAI 的聯合創始人)和 Jan Leike(OpenAI 對齊團隊的負責人)

OpenAI 是否通過 ChatGPT API 賺錢

根據一些假設,盡管價格大幅下跌,但最新的 GPT-Turbo 模型似乎仍可大量獲利。

為什么人工智能不會導致失業

在本文中,馬克·安德森 (Marc Andreessen) 論證了與其他先前新技術類似的情況,人工智能不會導致大規模失業。

有一個人工智能.....

今天為各種應用程序構建的許多有用的 AI 工具的廣泛列表。收集資源或靈感的好地方。

OpenAI-Python (GitHub Repo)

OpenAI-Python 提供從用 Python 編寫的應用程序訪問 OpenAI API。

OpenAI PHP (GitHub Repo)

OpenAI PHP 是一個 PHP API 客戶端,允許您與 OpenAI AI API 進行交互。

Machine Learning Notes (GitHub Repo)

機器學習筆記是有用的機器學習代碼和片段的集合。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容