頭條
Llama 3
Meta 發布了 8B 和 70B 模型,其性能顯著提高,特別是在推理、上下文長度和代碼方面。 它仍在訓練 400B 參數模型,其性能將與 Opus 相匹配。 這些模型無疑是最強大的可用開放模型。
谷歌的 DeepMind AI 可以幫助工程師預測“災難性故障”
數學家和谷歌 DeepMind 研究人員利用人工智能來查找缺乏特定模式的大量對象,幫助理解潛在的災難性故障,例如由于服務器中斷而導致的互聯網中斷。 他們的方法采用大型語言模型來迭代生成和完善無集集合,從而促進最壞情況場景的研究。 這項研究反映了人工智能和人類聰明才智在解決復雜問題方面的綜合力量。
OpenAI 終止 DALL-E 2
OpenAI 的 DALL-E 2 于 2022 年 4 月推出,標志著人工智能歷史上一個開創性且動蕩的時期,一群緊密團結的藝術家和技術愛好者利用該技術探索了語言和視覺藝術之間的交叉點。 然而,這種驚訝和興奮很快就被對未經許可或補償的情況下在受版權保護的創意作品上訓練人工智能模型的道德擔憂所取代,導致了一場兩極分化的爭論,隨著 OpenAI 轉向 DALL-E 3 和 其他人工智能圖像合成模型也出現了。
研究
模型適應的聯邦學習
研究人員開發了一種名為聯邦代理微調(FedPFT)的新方法,可以提高基礎模型對特定任務的適應性,同時保護數據隱私。
優化LLM的情境學習
本文介紹了一種在 Llama-2 和 GPT-J 等大型語言模型中增強上下文學習 (ICL) 的新方法。 它的作者提出了一種新的優化方法,該方法改進了他們所謂的“狀態向量”——模型知識的壓縮表示。
體育分析與比賽狀態重建
SoccerNet-GSR 是一個新的數據集,旨在推進單攝像機足球視頻片段的比賽狀態重建。
工程
使用組件建模進行模型解釋 (GitHub Repo)
組件建模將模型的預測過程分解為其基本元素,例如卷積濾波器和注意力頭,以了解它們對最終輸出的具體貢獻。
AI 網關 (GitHub Repo)
AI Gateway 是應用程序和托管大型語言模型之間的接口。 它使用統一的 API 簡化對 LLM 提供商的 API 請求。 AI Gateway 速度快、占用空間小,并且可以跨多個模型、提供程序和密鑰進行負載平衡。 它有后備措施來確保應用程序的彈性,并根據需要支持插件中間件。
微小視覺模型(GitHub Repo)
Moondream 是一個在 Phi-2 之上訓練的微型視覺語言模型。 就其尺寸而言,它具有極其強大的性能,盡管它仍然與一些幻覺作斗爭。 Moondream 足夠小,可以在手機和邊緣設備上運行。 它實現了無數的商業視覺功能。
雜七雜八
可能的思想空間
復雜人工智能的出現正在挑戰人類的基本概念,并推動我們探索如何在一系列智能生物中體現真正的理解和代理。 為了駕馭這一新景觀,我們必須制定原則框架,將我們的道德關注擴展到存在的基本品質,認識到各種形式的智力之間的相似性和差異,并在完全不同的實體之間培養互利的關系。
句子嵌入簡介
本指南探索使用開源嵌入模型來增強人工智能項目。 它涵蓋了模型選擇的標準和有效部署的方法。 該指南利用開源庫 Sentence Transformers 作為實際示例。
CUDA 仍然是 NVIDIA 的巨大護城河
NVIDIA 在 AI 領域的主導地位不僅依靠硬件,還依靠其 CUDA 軟件生態系統和專有互連技術。 AMD ROCM 等替代方案難以與 CUDA 的易用性和性能優化相媲美,從而確保 NVIDIA 的 GPU 仍然是 AI 工作負載的首選。 對 CUDA 生態系統和社區教育的投資鞏固了 NVIDIA 在 AI 計算領域的優勢。
Stability AI 裁員約 10%
Stability AI 已解雇約 20 名員工。