頭條
AMD發布新型AI芯片 與Nvidia競爭
https://www.fastcompany.com/91134766/amd-unveils-new-ai-chips-to-compete-with-nvidia
AMD 在 Computex 展會上發布了最新的人工智能處理器,包括將于 2024 年第四季度推出的 MI325X 加速器。它還詳細介紹了通過每年發布新的 AI 芯片與 Nvidia 競爭的計劃。MI350 系列預計于 2025 年推出,與 MI300 系列相比,其推理性能有望提高 35 倍。MI400 系列將于 2026 年發布。
Claude 3 Opus 可在 Vertex AI 上使用
谷歌云現在提供 Claude 3 Opus 工具和小型模型,作為其 Vertex AI 產品的一部分。
Mamba-2
https://goombalab.github.io/blog/2024/mamba2-part1-model/
Mambda 是一個功能強大的狀態空間模型。其團隊發布了第二個版本,并對模型和改進之處進行了詳細的解釋。
研究
FineWeb:最高質量的網絡規模文本數據集
https://huggingface.co/spaces/HuggingFaceFW/blogpost-fineweb-v1
訓練語言模型需要數以萬億計的高質量詞庫。有關這些數據集構建的許多信息都沒有公布。這篇出色的博文討論了數據集清理和過濾的不同策略。其作者發布了許多用于語言模型訓練的最佳數據集。
醫療健康領域的 LLMs
https://arxiv.org/abs/2405.12217v1
InvariantSelectPR 是一種方法,旨在提高大型多模態模型(LMM)在醫療保健等特定領域的適應性。
提高數據稀缺領域的 LLM 性能
https://arxiv.org/abs/2405.20192v1
TrainAllInfAttn 是一種在數據有限的專業領域提高大型語言模型性能的方法。
工程
使用原始視頻制作肖像動畫
https://megvii-research.github.io/MegFaceAnimate/
MegActor 是一種利用原始視頻制作更逼真人像動畫的新模型。它采用新穎的數據生成框架和背景編碼技術,通過解決身份泄露和背景干擾問題,取得了令人矚目的成果。
3D 網格生成
https://arxiv.org/abs/2405.20853
MeshXL 是一種可生成高質量 3D 網格的新模式。
使用 Ollama 和 Continue 的完全本地編碼助手
https://ollama.com/blog/continue-code-assistant
現在,人們可以在設備上運行自動完成功能和聊天功能,最近在編碼方面進行了強大的改進,并采用了多種開放式模型。
雜七雜八
人工智能天氣預報已取得巨大進步
天氣預報界正在經歷一場人工智能模型的革命,如 WindBorne 的 WeatherMesh,該模型使用豐富的 ERA5 數據集,在大大降低計算能力的同時,性能優于傳統模型。
手寫數學識別
https://arxiv.org/abs/2405.09032
隱含字符輔助學習(ICAL)提高了手寫數學表達式的識別能力。
人工智能的通信革命
https://www.digitalnative.tech/p/ais-communication-revolution-were
在實時整合音頻、視覺和文本的 OpenAI GPT-4o 的推動下,人工智能正在引領一場通信革命。這種轉變使人工智能的互動更加自然,將人與人工智能的交流轉變為數字互動的核心模式,并可能帶來重大的社會變革和專注于以人工智能為中心的交流的新初創公司。
Amazon's Project Pi AI Looks For Product Defects Before They Ship
亞馬遜的 Project PI 利用人工智能和計算機視覺在發貨前檢測產品缺陷或不正確的規格,從而改進質量控制并減少退貨。
Bestever
功能強大的全新人工智能創意套件,用于制作廣告。
胸部 X 射線異常檢測
https://github.com/sunzc-sunny/ppad
本研究探討了如何使用基于 CLIP 的方法來檢測胸部 X 光片中的異常。