頭條
奧數大模型發布
https://huggingface.co/AI-MO/NuminaMath-7B-TIR
Hugging Face 團隊發布了一款極其強大且強大的數學模型。
Claude 增加了一個 Prompt Playground,可快速改進 AI 應用
Anthropic 在 Claude 中的新功能允許開發人員自動化提示工程,通過生成、測試和優化帶有快速反饋的提示來改進 AI 應用開發。
微軟、蘋果放棄在 OpenAI 董事會的觀察員席位
由于監管審查,微軟和蘋果選擇不加入 OpenAI 董事會,微軟辭去了觀察員角色,而蘋果則放棄了成為觀察員的計劃。
研究
將圖像生成功能重新添加到 Chameleon
https://arxiv.org/abs/2407.06135
Anole 是一個基于 Meta 的 Chameleon 模型構建的開放式自回歸多模態模型。這項工作通過有針對性的微調將圖像生成功能重新添加到模型中。
個性化文本到圖像模型
https://arxiv.org/abs/2407.06642v1
研究人員引入了一種新的強化學習框架來改進個性化文本到圖像的生成。
自動駕駛的 3D 數據生成
https://arxiv.org/abs/2407.06109v1
PerlDiff 是一種通過集成 3D 幾何信息來提高街景圖像生成精度的方法。
工程
Paints UNDO 生成模型
https://github.com/lllyasviel/Paints-UNDO
Paints UNDO 是由 ControlNet、IC-Light 和許多其他圖像生成系統的創建者開發的系統,該系統中的模型可以創建用于重新創建圖像的筆觸。有趣的是,與以前的筆觸系統不同,該模型可以撤消筆觸,并且經常在過程中完全重新考慮其方法 - 與人類藝術家非常相似。
minRF
https://github.com/cloneofsimo/minRF
可擴展整流流變換器部分用于 Stable Diffusion 3。此存儲庫是此存儲庫的最小實現,其中還包括 muP 超參數掃描。
RouteLLM
https://github.com/lm-sys/RouteLLM
用于服務和評估 LLM 路由器的框架。
雜七雜八
推進自動駕駛中的 3D 感知
https://arxiv.org/abs/2407.06190v1
SuperFlow 是一種新框架,它通過使用連續的 LiDAR-camera 對進行時空預訓練來增強自動駕駛中的 3D 感知。
深入研究 AI 推理初創公司
https://eastwind.substack.com/p/a-deep-dive-on-ai-inference-startups
風險投資的一個熱門領域是為 AI 打造“鎬和鏟子”(例如模型微調、可觀察性和推理)。風險投資家認為,在將 AI 添加到產品中時,公司不會愿意在內部構建東西。AI 推理的 TAM 相當有限。風險投資家需要相信大規模的 TAM 擴展才能讓他們的投資獲得回報。雖然 AI 推理平臺在短期內對初創公司有利,但從長遠來看,它們對初創公司不利。
騎行者無法決定是害怕還是喜歡自動駕駛汽車
https://www.yahoo.com/news/cyclists-t-decide-whether-fear-220824589.html
舊金山的騎行者報告了與 Waymo 和 Cruise 自動駕駛汽車的近距離接觸和安全問題。加州機動車管理局收到了近 200 起投訴,強調這些自動駕駛汽車的駕駛不穩定和險些相撞。雖然這些公司聲稱他們的車輛具有增強的安全功能,但這些事件引發了人們對它們是否準備好在監管審查日益嚴格的情況下進行更廣泛部署的質疑。
OpenAI 和洛斯阿拉莫斯宣布建立生物科學研究合作伙伴關系
https://openai.com/index/openai-and-los-alamos-national-laboratory-work-together/
OpenAI 和洛斯阿拉莫斯國家實驗室 (LANL) 正在合作探索 AI 在生物科學研究中的安全應用,重點是使用 GPT-4o 等模型通過視覺和語音等多模態功能協助實驗室任務。
HF Transformers 的模型初始化速度提高 30 倍
https://github.com/huggingface/transformers/pull/31771
通過在第一次傳遞時將一些延遲加載移至模型,可以顯著加快模型初始化速度,而不會造成每秒Token的太多損失。