頭條
蘋果的機器人技術(shù)旨在解決用戶的第一世界問題
https://appleinsider.com/articles/24/08/25/first-world-problems-drives-apples-robotics-development
蘋果可能正在向機器人領(lǐng)域擴張,可能會推出可移動的設(shè)備,例如安裝在機械臂上的 iPad。在技術(shù)副總裁 Kevin Lynch 的領(lǐng)導(dǎo)下,蘋果的機器人技術(shù)工作在以色列理工學(xué)院等公司專家的幫助下取得了進展,并提議在 Siri 之外加入 AI 界面。雖然仍處于概念階段,但蘋果正在考慮在 2026 年或 2027 年發(fā)布這些新的機器人產(chǎn)品。
Cohere Command R 更新
https://cohere.com/blog/command-series-0824
Command R 和 Command R+ 在所有任務(wù)上都得到了升級。它們現(xiàn)在在回憶、速度、數(shù)學(xué)和推理方面都表現(xiàn)得更好。
Google DeepMind 員工敦促公司放棄軍事合同
https://time.com/7013685/google-ai-deepmind-military-contracts-israel/
近 200 名 Google DeepMind 員工簽署了一封信,敦促 Google 終止軍事合同,聲稱這違反了該公司自己的 AI 道德原則。DeepMind 技術(shù)已被捆綁到 Google Cloud 中并出售給軍方,引發(fā)了與重視道德標準的 AI 員工的內(nèi)部沖突。Google 的回應(yīng)表明了對 AI 原則的遵守,但員工仍然不滿意,尋求加強對其 AI 的軍事用途的治理。
研究
MoE 的無輔助損失負載平衡
https://arxiv.org/abs/2408.15664
將Token路由到 MoE 中的專家有助于稀疏計算。但是,學(xué)習(xí)路由可能具有挑戰(zhàn)性。通常存在復(fù)雜的損失結(jié)構(gòu)。本文展示了一種克服此問題并顯著提高專家平衡和訓(xùn)練穩(wěn)定性的新方法。
提高低光視頻質(zhì)量
https://arxiv.org/abs/2408.14916v1
這個端到端框架同時解決了使用事件攝像機的視頻中的低光增強和運動去模糊問題。
聲源定位
https://arxiv.org/abs/2408.16448v1
研究人員提出了一種新的視聽學(xué)習(xí)框架來增強聲源定位,解決了傳統(tǒng)方法中的假陰性問題。該框架包括兩種方案:自監(jiān)督預(yù)測學(xué)習(xí) (SSPL) 和語義感知對比學(xué)習(xí) (SACL)。SSPL 通過專注于正向?qū)W習(xí)來消除假陰性,而 SACL 則改進對比學(xué)習(xí)過程以改善音頻和視覺特征之間的一致性。
工程
TRL 發(fā)布
https://github.com/huggingface/trl/releases/tag/v0.10.1
這可能是 Transformer 強化學(xué)習(xí)庫的重大改進之一。它包括 onlineDPO、Liger Kernels、WinRate Callbacks 等。
CPU 上 Schnell 的快速 SD 支持
流行的推理庫現(xiàn)在支持在 CPU 上運行的 Flux Schnell。
用于圖像生成的脈沖擴散模型
https://github.com/andycao1125/sdm
脈沖擴散模型 (SDM) 是專為圖像生成而設(shè)計的脈沖神經(jīng)網(wǎng)絡(luò) (SNN) 的新系列,可顯著節(jié)省能源并具有很高的生物合理性。
雜七雜八
Laion 5B 安全發(fā)布
https://laion.ai/blog/relaion-5b/
Laion 5B 是互聯(lián)網(wǎng)上最大的開放圖像數(shù)據(jù)集。由于擔(dān)心圖像不當(dāng)和有害,它被關(guān)閉。該組織已做出重大努力來緩解這些問題,現(xiàn)在正在重新發(fā)布數(shù)據(jù)集。
下一代皮克斯:人工智能將如何融合電影和游戲
https://a16z.com/the-next-generation-pixar/
生成式人工智能有望徹底改變講故事的方式,將敘事深度與視頻游戲的動態(tài)互動性融合在一起。OpenAI 的 Sora 和 Luma AI 的 Dream Machine 等生成模型的最新進展正在加速這一轉(zhuǎn)變,實現(xiàn)實時交互式視頻創(chuàng)作。這一演變有可能在交互式媒體中產(chǎn)生下一個“皮克斯”,將電影、游戲和人工智能融合在一起。
中國機器人制造商追趕特斯拉,提供人形機器人工人
在北京舉行的世界機器人大會上,超過 25 家中國公司展示了旨在實現(xiàn)工廠自動化的人形機器人,這些機器人得到了政府的大量投資支持,并利用了中國深厚的供應(yīng)鏈。預(yù)計到 2035 年,全球人形機器人市場將達到 380 億美元。中國希望在 2025 年前大規(guī)模生產(chǎn)這些機器人,從而加劇與特斯拉即將推出的 Optimus 機器人的競爭。特斯拉預(yù)計明年將在其工廠部署 1,000 臺 Optimus 機器人,而中國公司預(yù)計其模型的成本將大幅降低。
Vybe 籌集 475 萬美元,為 AI 照片帶來樂趣,并提供與朋友聯(lián)系的新方式
Vybe AI 相機應(yīng)用程序使用尖端 AI 將您的自拍照轉(zhuǎn)換為生動、美麗的照片。
蘋果和 Nvidia 可能會投資 OpenAI
https://www.theverge.com/2024/8/29/24231626/apple-nvidia-openai-invest-microsoft
據(jù)報道,OpenAI 正在準備進行一輪重大融資,該公司的估值可能超過 1000 億美元,可能涉及蘋果、Nvidia 和微軟的投資。
波士頓動力公司的新型電動 Atlas 可以做俯臥撐
https://techcrunch.com/2024/08/22/boston-dynamics-new-electric-atlas-can-do-push-ups/
波士頓動力公司在一段新視頻中展示了其電動雙足機器人 Atlas 做俯臥撐的動作,該視頻強調(diào)了其在工廠車間應(yīng)用的早期商業(yè)化階段中強大的執(zhí)行器。