2025-06-03 簡訊 : Perplexity Labs


頭條


Perplexity Labs

https://links.tldrnewsletter.com/sUYtq0

Perplexity推出了Perplexity Labs,讓專業(yè)用戶借助網(wǎng)頁瀏覽和代碼執(zhí)行等工具生成報告、電子表格、儀表盤和簡單應用程序,從而將想法付諸實踐 。

用于上下文圖像生成的FLUX.1 KONTEXT

https://bfl.ai/announcements/flux-1-kontext

黑森林實驗室發(fā)布了FLUX.1 Kontext,這是一套基于文本和圖像的上下文圖像編輯與生成的流匹配模型。

Anthropic開源用于人工智能可解釋性的電路追蹤工具

https://www.anthropic.com/research/open-source-circuit-tracing

這些工具能生成“歸因圖”,用于追蹤大語言模型在內(nèi)部如何做決策,揭示輸出背后的逐步推理過程。該庫可與流行的開源模型配合使用,還包含一個交互式的Neuronpedia前端,用于探索模型回路。


深度分析


全球第二的人工智能實驗室與無可爭議的重量級冠軍

https://threadreaderapp.com/thread/1928071179115581671.html

DeepSeek R1 0528在人工分析智能指數(shù)中從60提升到了68。這使得該模型的智能程度高于xAI的Grok 3 mini、英偉達的Llama Nemotron Ultra、Meta的Llama 4 Maverick和阿里巴巴的通義千問3 253,與谷歌的Gemini 2.5 Pro相當。該模型在架構沒有任何變化的情況下,相比前幾代全面提升了智能水平。如今,開源模型和閉源模型之間的差距比以往任何時候都小。

前OpenAI安全研究員解讀人工智能推理變革

https://lilianweng.github.io/posts/2025-05-01-thinking/

莉蓮·翁發(fā)表了一項全面的技術調查,將測試時的計算與人類心理學聯(lián)系起來,借鑒卡尼曼的“快思考與慢思考”來解釋為什么模型在回答前有額外計算步驟時表現(xiàn)更好。該綜述涵蓋了思維鏈背后的科學、驅動o1和R1的強化學習方法,以及獎勵破解帶來的對齊風險。


工程


聊天機器人文本轉語音(GitHub 倉庫)

https://github.com/resemble-ai/chatterbox

Resemble AI發(fā)布了一款開源TTS模型,在基準測試中表現(xiàn)超過ElevenLabs,還具備情感夸張控制功能。

使用Renderformer實現(xiàn)全局光照(GitHub倉庫)

https://microsoft.github.io/renderformer/

RenderFormer是一種神經(jīng)渲染器,能基于三角形的場景表示,在具備完整全局光照的情況下,直接生成逼真的圖像。它無需針對任何場景進行訓練或微調。

網(wǎng)絡評測——對比人工智能瀏覽器代理的新方法

https://blog.skyvern.com/web-bench-a-new-way-to-compare-ai-browser-agents/

Web Bench是用于評估網(wǎng)頁瀏覽代理的新數(shù)據(jù)集。它包含452個不同網(wǎng)站上的5750項任務。根據(jù)Web Bench,Anthropic Sonnet 3.7 CUA目前處于領先水平 。

更便宜的VLM訓練(GitHub代碼庫)

https://github.com/facebookresearch/zero

Meta的研究人員推出了一種名為零樣本嫁接的方法,該方法用一個源自大型大語言模型(LLM)淺層的較小替代模型來訓練視覺編碼器。這能將視覺語言模型(VLM)的訓練成本降低約45%,同時在遷移到完整大語言模型(LLM)時,性能保持不變甚至有所提升。


其他


我最近明白了一點,就是把人工智能研究視為一個“最高性能領域” 。

https://threadreaderapp.com/thread/1928174505148698909.html

“極致表現(xiàn)領域”指的是這樣一些行業(yè):人們只要在工作的某一方面表現(xiàn)出色,就能成為世界級人才。就算你在相關技能方面不怎么樣也沒關系,只要能產(chǎn)生重大影響就行。在某一方面的卓越能力,比在工作其他方面的不足更重要。在極致表現(xiàn)領域工作是一種奢侈,因為這里允許失敗,壓力通常也是自己給自己的 。

人工智能需求增長1000倍

https://tomtunguz.com/nvda-2025-05-29/

英偉達報告稱,從簡單人工智能向更復雜推理轉變,實現(xiàn)顯著增長,推動人工智能需求大幅提升。超大規(guī)模數(shù)據(jù)中心每周部署近7.2萬塊GPU,僅微軟的令牌生成量就增長了五倍。盡管人們努力縮小模型規(guī)模,但需求增加仍需要更多被稱為“人工智能工廠”的數(shù)據(jù)中心。

谷歌發(fā)布MedGemma醫(yī)療人工智能模型

https://developers.google.com/health-ai-developer-foundations/medgemma

MedGemma是基于Gemma 3構建的開源模型,有40億參數(shù)多模態(tài)和270億參數(shù)純文本兩種版本。

Hugging Face推出兩款完全開源的人形機器人

https://techcrunch.com/2025/05/29/hugging-face-unveils-two-new-humanoid-robots/

在收購Pollen Robotics僅一個月后,Hugging Face就推出了全尺寸人形機器人HopeJR,以及用于測試人工智能應用的桌面機器人Reachy Mini。

特拉華州審查OpenAI向盈利性轉變一事

https://techcrunch.com/2025/05/29/delaware-attorney-general-reportedly-hires-a-bank-to-evaluate-openais-restructuring-plan/

特拉華州總檢察長聘請了一家銀行來獨立評估OpenAI的重組計劃,這可能會讓該公司向盈利模式轉變的行動變得復雜。

馬斯克試圖阻止OpenAI與阿聯(lián)酋的人工智能交易,原因是XAI被排除在外

https://www.cnbc.com/2025/05/29/musk-altman-ai-rivalry-complicating-trumps-dealmaking-in-middle-east.html

馬斯克很懊惱,由他的私人對手山姆·奧特曼領導的OpenAI被選為阿聯(lián)酋人工智能園區(qū)項目的合作方。

VIBE編程平臺正火爆起來。

https://threadreaderapp.com/thread/1928154833514836382.html

數(shù)據(jù)顯示,人們在為自己而非全世界制造東西,但建設者們顯然很興奮。

人工智能編碼工具和集成開發(fā)環(huán)境完整列表

https://threadreaderapp.com/thread/1928096496987066604.html

一位開發(fā)者測試了46種不同的人工智能編碼工具,為每個平臺提供了詳細對比和使用案例。

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內(nèi)容