頭條
GROK 3似乎曾短暫屏蔽對特朗普和馬斯克不利的言論
馬斯克的Grok 3人工智能模型在錯誤信息查詢中曾短暫屏蔽有關唐納德·特朗普和馬斯克的內容,但在用戶反饋后恢復。xAI的工程負責人證實,一名員工出于好意做了這一改動,但這與公司價值觀不符。此前一些模型有左傾傾向,馬斯克希望讓Grok保持政治中立 。
亞馬遜Alexa增強版
https://www.aboutamazon.com/news/devices/new-alexa-generative-artificial-intelligence
亞馬遜推出了Alexa+,這是其語音助手的升級版。Alexa+是由生成式人工智能驅動的助手,更智能,也更能像人一樣對話。
ElevenLabs的語音轉文本
https://elevenlabs.io/blog/meet-scribe
ElevenLabs將推出自己的轉錄模型Scribe。它將高精度支持99種語言,具備逐字時間戳、說話人識別,以及適應真實環境音頻的能力。
研究
QWQ Max 預覽
https://qwenlm.github.io/blog/qwq-max-preview/
通義千問預覽了一款推理模型,該模型在數學和代碼方面取得了出色成績。它打算與強大的Max模型一起開放權重發布此模型。
本地模型充當“小跟班”
https://hazyresearch.stanford.edu/blog/2025-02-24-minions
Hazy Research發現,如果你通過Ollama使用本地模型,并使用長上下文云模型作為編排器,就能以17%的成本實現97%的任務性能。
大語言模型中的系統2思維
https://arxiv.org/abs/2502.17419v1
一項針對像OpenAI的o1/o3和DeepSeek的R1這類推理大語言模型(LLMs)的調查,該調查分析了它們的逐步邏輯推理能力,并將它們的性能與人類認知能力進行了對比測試 。
工程
用于PDF文本提取的OLMOCR
https://olmocr.allenai.org/blog
艾倫人工智能公司通過在20多萬份PDF文件上持續微調通義萬相視覺大模型(Qwen VL),訓練出了一款強大的PDF文件提取模型。
人工智能安全評估(GitHub 倉庫)
https://github.com/thu-coai/AISafetyLab
AISafetyLab是一個全面的人工智能安全框架,涵蓋攻擊、防御和評估。它包括模型、數據集、實用工具,以及一份精心整理的人工智能安全相關論文列表。
基于調查微調的民意預測(GitHub 倉庫)
https://github.com/josephjeesungsuh/subpop
SubPOP推出用于微調大語言模型(LLMs)的大型數據集,以預測調查回應分布,縮小預測差距并提升對未知調查的泛化能力 。
其他
MAGMA:用于多模態人工智能智能體的基礎模型(Hugging Face 中心)
https://huggingface.co/microsoft/Magma-8B
Magma是用于視覺智能體任務的全新基礎模型,在視頻理解和UI導航方面表現出色。它很容易進行調整。
Claude AI助力Alexa+
https://www.anthropic.com/news/claude-and-alexa-plus
Anthropic公司的Claude AI現已通過亞馬遜云服務Bedrock集成到Alexa+中,在增強其功能的同時,還具備強大的安全防護,可防止越獄和濫用。
微軟發布新的專為多模態處理優化的Phi模型
微軟發布了兩款新的開源語言模型Phi-4-mini和Phi-4-multimodal,強調硬件效率和多模態處理。Phi-4-mini有38億個參數,專注于文本任務;Phi-4-multimodal有56億個參數,能處理文本、圖像、音頻和視頻。這兩款模型性能優于同等規模的其他模型,將以MIT許可協議在Hugging Face上提供。
查塔醫療公司籌集810萬美元
查塔醫療(Charta Health)在貝恩資本風險投資公司(Bain Capital Ventures)領投下籌集810萬美元,用于加強人工智能驅動的計費前病歷審查,減少計費錯誤并挽回損失的收入。
FLORA為創意人士推出Cursor
https://threadreaderapp.com/thread/1894794612398792974.html
FLORA是首款為創意專業人士打造的、由人工智能驅動的創意工作流程工具,能讓他們的創意產出提高10倍。
谷歌新人工智能視頻模型VEO 2每秒收費50美分
https://techcrunch.com/2025/02/23/googles-new-ai-video-model-veo-2-will-cost-50-cents-per-second/
谷歌的Veo 2人工智能視頻模型每秒0.5美元,相當于每分鐘30美元。