2025-03-28 簡訊 : OpenAI 改進圖像生成技術


頭條


OpenAI 改進圖像生成技術

https://links.tldrnewsletter.com/KsWq7r

OpenAI的GPT-4o在圖像生成方面有改進,能精準呈現文本、遵循指令,還支持多輪編輯。

DeepSeek V3-0324 發布,遵循 MIT 許可

https://api-docs.deepseek.com/news/news250325

DeepSeek發布了新的V3-0324模型,該模型在大多數基準測試中表現優于GPT 4.5,性能有重大提升。

通義千問2.5 320億參數視覺語言模型

https://qwenlm.github.io/blog/qwen2.5-vl-32b/

通義千問發布了一款強大的視覺語言模型,它是開源的,且能在消費級硬件上較好運行。


研究


調整大語言模型的后期訓練以實現多樣化創意寫作

https://arxiv.org/abs/2503.17126

Midjourney發布了一些成果,旨在提升創意寫作模型的多樣性。該公司能夠對一個小型7B模型進行后期訓練,這個模型在創意寫作方面的表現優于許多更大的開源和閉源模型。

視頻T1

https://liuff19.github.io/Video-T1/

測試時計算用于處理視頻,該視頻使用引導模型剔除不符合物理規律或用戶指定提示的幀路徑。在這項任務中使用測試時計算可顯著提升基準測試性能。

3D面部編輯

https://arxiv.org/abs/2503.17095v1

FFaceNeRF克服了基于NeRF方法中固定蒙版的限制,提升了3D面部編輯效果。


工程


視覺幾何基礎Transformer(GitHub代碼庫)

https://github.com/facebookresearch/vggt

VGGT是一種前饋神經網絡,能在數秒內,從一個、幾個或數百個場景視圖中,直接推斷出場景所有關鍵的3D屬性,包括相機的外部和內部參數、點圖、深度圖以及3D點軌跡。

消除任何圖像的反射

https://abuuu122.github.io/DAI.github.io/

去反射任意圖像(DAI)引入了一種全新的基于擴散的去反射方法,利用了高質量數據集和漸進式訓練。

帶FastCurl的慢思考推理模型(GitHub代碼庫)

https://github.com/nick7nlp/FastCuRL

FastCuRL-1.5B-Preview通過課程強化學習推動慢思考推理模型發展,用更少訓練步驟取得了頂尖成果。


其他


單圖像迭代主體驅動生成與編輯

https://siso-paper.github.io/

SISO是一種推理時優化方法,無需訓練就能根據單張主體圖像定制圖像。它可以定制給定圖像的主體,或者生成帶有該主體的新圖像。

曼尼·梅迪納的新初創公司:PAID

https://techcrunch.com/2025/03/25/outreach-founder-manny-medina-has-a-new-startup-that-helps-ai-agents-get-paid/

Outreach創始人曼尼·梅迪納推出了Paid平臺,該平臺旨在幫助人工智能智能體初創企業管理定價和盈利能力。在頂級投資者的支持下,Paid旨在重新定義在新興的智能體經濟中,人工智能智能體如何計費和估值。

DeepMind一位關鍵的機器人研究員離開谷歌,英偉達已對他的秘密初創公司進行投資

https://techcrunch.com/2025/03/19/a-key-deepmind-robotics-researcher-left-google-and-nvidia-has-already-backed-his-stealth-startup/

皮特·弗洛倫斯此前是DeepMind的資深研究科學家,如今離職創立了通用人工智能公司(Generalist AI),這是一家獲英偉達風投部門NVentures支持的機器人初創企業。該公司旨在打造通用機器人,弗洛倫斯強調其愿景是將體力勞動的邊際成本降至零。在英偉達于人工智能領域影響力日增之際,弗洛倫斯和其他前DeepMind科學家一同投身科技創業。

克勞德現在可以搜索網絡了

https://links.tldrnewsletter.com/MRRtx3

Claude現在具備網絡搜索功能,可提供實時見解和最新回復,還帶有來源引用。

在 API 中推出下一代音頻模型

https://links.tldrnewsletter.com/xD3bfz

OpenAI推出了新的音頻模型,包括語音引擎,它能根據簡短樣本生成逼真的語音。

據報道,Perplexity正在洽談融資事宜,計劃以180億美元的估值籌集至多10億美元。

https://techcrunch.com/2025/03/20/perplexity-is-reportedly-in-talks-to-raise-up-to-1b-at-an-18b-valuation/

人工智能搜索初創公司Perplexity正洽談以180億美元估值籌集10億美元。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 230,825評論 6 546
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,814評論 3 429
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 178,980評論 0 384
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 64,064評論 1 319
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,779評論 6 414
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 56,109評論 1 330
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 44,099評論 3 450
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 43,287評論 0 291
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,799評論 1 338
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,515評論 3 361
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,750評論 1 375
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 39,221評論 5 365
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,933評論 3 351
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 35,327評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,667評論 1 296
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,492評論 3 400
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,703評論 2 380

推薦閱讀更多精彩內容