頭條
Qwen 1.5車型發布
https://qwenlm.github.io/blog/qwen1.5/
從0.5B到72B參數。 這些是令人印象深刻的多語言模型套件。 有趣的是,最小的模型是第一個嚴肅的 sub 1B 參數語言模型。
OpenAI 讓人工智能變得更加“民主”的計劃
https://time.com/6684266/openai-democracy-artificial-intelligence/
2023 年 5 月,Colin Megill 會見了 OpenAI,包括聯合創始人 Wojciech Zaremba,討論整合他的公共審議平臺 Polis,該平臺使用人工智能來增強民主參與。 此次合作旨在通過廣泛的公眾投入使人工智能與人類價值觀保持一致。 它引發了 OpenAI 的“人工智能民主投入”倡議,通過 100 萬美元的資助計劃探索人工智能治理。
研究
Boximator:可控視頻合成
https://arxiv.org/abs/2402.01566
眾所周知,視頻合成很難控制。 這項工作提出使用方框和箭頭來指導隨著時間的推移生成,這改善了人類的偏好判斷,但仍然沒有給用戶提供完美的指導。
一種新的人工智能對齊優化方法
https://arxiv.org/abs/2402.01306v1
卡尼曼-特沃斯基優化 (KTO) 是一種訓練人工智能模型以更好地符合人類思維的新方法。 通過利用 Kahneman 和 Tversky 前景理論中的概念,KTO 專注于效用最大化,而不僅僅是偏好可能性。
人工智能中的多模態幻覺
https://arxiv.org/abs/2402.01345v1
本文闡明了為什么大型視覺語言模型(LVLM)有時會錯誤地描述圖像,這種現象被稱為多模態幻覺。 語義轉移偏差,尤其是段落中斷處的語義轉移偏差,是一個關鍵因素。
工程
Rabbit 的開源替代品 (GitHub Repo)
https://github.com/KillianLucas/01
一個小組正在致力于構建 Rabbit 硬件的開源版本,包括語言建模部分。
NaturalSQL (GitHub Repo)
https://github.com/cfahlgren1/natural-sql
ChatDB 的 NaturalSQL 是一系列在文本到 SQL 指令上具有最先進性能的模型。
從單張照片生成多樣化的人物肖像
https://caphuman.github.io/
CapHuman 是一個框架,可以僅使用一張參考照片創建一個人的各種圖像。 它巧妙地保持了人的身份,同時改變了頭部位置和表情。
雜七雜八
Pearls 上下文教程
https://github.com/facebookresearch/Pearl/blob/main/pearl/tutorials/contextual_bandits/contextual_bandits_tutorial.ipynb
Pearls 是由 Meta 維護的強化學習框架。 本教程將介紹該軟件的基于老虎機的學習問題。
人工智能對勞動力市場的影響比預期慢
https://aisupremacy.substack.com/p/mit-paper-ais-labor-market-impacts
工作論文“超越人工智能曝光:哪些任務通過計算機視覺實現自動化具有成本效益?” 麻省理工學院和 IBM 的研究人員研究了自動化基于視覺的任務的經濟可行性。 研究發現,只有 23% 的自動化具有成本效益。 該論文預測,與更具破壞性的預測相比,多年來勞動力市場的影響將逐漸顯現。
文本嵌入模型的新基準
https://arxiv.org/abs/2402.01613v1
Nomic-Embed-Text-V1 作為開源、完全可復制的文本嵌入模型設立了新標準。 它在短上下文和長上下文任務中都表現出色。 Nomic-Embed-Text-V1 具有獨特的透明度,提供對其訓練代碼、模型權重和包含 2.35 億文本對的龐大數據集的完整訪問。
Matrices
https://matrices.app/
Matrices 是一種人工智能原生電子表格,可以自行創建并填充您需要的任何信息。 它可以僅用自然語言進行擴展。
人工智能如何幫助我們了解鳥類
https://themarkup.org/hello-world/2024/02/03/how-ai-is-helping-us-learn-about-birds
BirdCast 是康奈爾鳥類學實驗室、科羅拉多州立大學和麻省大學阿默斯特分校之間的合作項目,利用機器學習和雷達數據來預測鳥類遷徙。 該項目展示了人工智能通過增強對生態系統健康和遷徙模式的理解來徹底改變鳥類學的潛力。
Roblox 發布實時人工智能聊天翻譯器
https://www.theverge.com/2024/2/5/24061495/roblox-generative-ai-chat-translator
Roblox 開發了一種人工智能模型,能夠實時翻譯 16 種語言的文本聊天內容,通過打破語言障礙來增強用戶參與度。 它在專家混合架構中利用基于變壓器的大型語言模型,以有效利用資源,同時維護隱私和安全流程。