頭條
Perplexity Labs
https://links.tldrnewsletter.com/sUYtq0
Perplexity推出了Perplexity Labs,讓專業(yè)用戶借助網(wǎng)頁瀏覽和代碼執(zhí)行等工具生成報告、電子表格、儀表盤和簡單應用程序,從而將想法付諸實踐 。
用于上下文圖像生成的FLUX.1 KONTEXT
https://bfl.ai/announcements/flux-1-kontext
黑森林實驗室發(fā)布了FLUX.1 Kontext,這是一套基于文本和圖像的上下文圖像編輯與生成的流匹配模型。
Anthropic開源用于人工智能可解釋性的電路追蹤工具
https://www.anthropic.com/research/open-source-circuit-tracing
這些工具能生成“歸因圖”,用于追蹤大語言模型在內(nèi)部如何做決策,揭示輸出背后的逐步推理過程。該庫可與流行的開源模型配合使用,還包含一個交互式的Neuronpedia前端,用于探索模型回路。
深度分析
全球第二的人工智能實驗室與無可爭議的重量級冠軍
https://threadreaderapp.com/thread/1928071179115581671.html
DeepSeek R1 0528在人工分析智能指數(shù)中從60提升到了68。這使得該模型的智能程度高于xAI的Grok 3 mini、英偉達的Llama Nemotron Ultra、Meta的Llama 4 Maverick和阿里巴巴的通義千問3 253,與谷歌的Gemini 2.5 Pro相當。該模型在架構沒有任何變化的情況下,相比前幾代全面提升了智能水平。如今,開源模型和閉源模型之間的差距比以往任何時候都小。
前OpenAI安全研究員解讀人工智能推理變革
https://lilianweng.github.io/posts/2025-05-01-thinking/
莉蓮·翁發(fā)表了一項全面的技術調查,將測試時的計算與人類心理學聯(lián)系起來,借鑒卡尼曼的“快思考與慢思考”來解釋為什么模型在回答前有額外計算步驟時表現(xiàn)更好。該綜述涵蓋了思維鏈背后的科學、驅動o1和R1的強化學習方法,以及獎勵破解帶來的對齊風險。
工程
聊天機器人文本轉語音(GitHub 倉庫)
https://github.com/resemble-ai/chatterbox
Resemble AI發(fā)布了一款開源TTS模型,在基準測試中表現(xiàn)超過ElevenLabs,還具備情感夸張控制功能。
使用Renderformer實現(xiàn)全局光照(GitHub倉庫)
https://microsoft.github.io/renderformer/
RenderFormer是一種神經(jīng)渲染器,能基于三角形的場景表示,在具備完整全局光照的情況下,直接生成逼真的圖像。它無需針對任何場景進行訓練或微調。
網(wǎng)絡評測——對比人工智能瀏覽器代理的新方法
https://blog.skyvern.com/web-bench-a-new-way-to-compare-ai-browser-agents/
Web Bench是用于評估網(wǎng)頁瀏覽代理的新數(shù)據(jù)集。它包含452個不同網(wǎng)站上的5750項任務。根據(jù)Web Bench,Anthropic Sonnet 3.7 CUA目前處于領先水平 。
更便宜的VLM訓練(GitHub代碼庫)
https://github.com/facebookresearch/zero
Meta的研究人員推出了一種名為零樣本嫁接的方法,該方法用一個源自大型大語言模型(LLM)淺層的較小替代模型來訓練視覺編碼器。這能將視覺語言模型(VLM)的訓練成本降低約45%,同時在遷移到完整大語言模型(LLM)時,性能保持不變甚至有所提升。
其他
我最近明白了一點,就是把人工智能研究視為一個“最高性能領域” 。
https://threadreaderapp.com/thread/1928174505148698909.html
“極致表現(xiàn)領域”指的是這樣一些行業(yè):人們只要在工作的某一方面表現(xiàn)出色,就能成為世界級人才。就算你在相關技能方面不怎么樣也沒關系,只要能產(chǎn)生重大影響就行。在某一方面的卓越能力,比在工作其他方面的不足更重要。在極致表現(xiàn)領域工作是一種奢侈,因為這里允許失敗,壓力通常也是自己給自己的 。
人工智能需求增長1000倍
https://tomtunguz.com/nvda-2025-05-29/
英偉達報告稱,從簡單人工智能向更復雜推理轉變,實現(xiàn)顯著增長,推動人工智能需求大幅提升。超大規(guī)模數(shù)據(jù)中心每周部署近7.2萬塊GPU,僅微軟的令牌生成量就增長了五倍。盡管人們努力縮小模型規(guī)模,但需求增加仍需要更多被稱為“人工智能工廠”的數(shù)據(jù)中心。
谷歌發(fā)布MedGemma醫(yī)療人工智能模型
https://developers.google.com/health-ai-developer-foundations/medgemma
MedGemma是基于Gemma 3構建的開源模型,有40億參數(shù)多模態(tài)和270億參數(shù)純文本兩種版本。
Hugging Face推出兩款完全開源的人形機器人
https://techcrunch.com/2025/05/29/hugging-face-unveils-two-new-humanoid-robots/
在收購Pollen Robotics僅一個月后,Hugging Face就推出了全尺寸人形機器人HopeJR,以及用于測試人工智能應用的桌面機器人Reachy Mini。
特拉華州審查OpenAI向盈利性轉變一事
特拉華州總檢察長聘請了一家銀行來獨立評估OpenAI的重組計劃,這可能會讓該公司向盈利模式轉變的行動變得復雜。
馬斯克試圖阻止OpenAI與阿聯(lián)酋的人工智能交易,原因是XAI被排除在外
馬斯克很懊惱,由他的私人對手山姆·奧特曼領導的OpenAI被選為阿聯(lián)酋人工智能園區(qū)項目的合作方。
VIBE編程平臺正火爆起來。
https://threadreaderapp.com/thread/1928154833514836382.html
數(shù)據(jù)顯示,人們在為自己而非全世界制造東西,但建設者們顯然很興奮。
人工智能編碼工具和集成開發(fā)環(huán)境完整列表
https://threadreaderapp.com/thread/1928096496987066604.html
一位開發(fā)者測試了46種不同的人工智能編碼工具,為每個平臺提供了詳細對比和使用案例。