人工智能(AI)的發展速度超乎想象,是不知疲倦的探索者,正以前所未有的力量推動著各個行業的變革。近期,DeepSeek公司憑借其R1大語言模型在華爾街掀起了一場風暴,引發了美國公司模型成本及人工智能股票泡沫破裂的廣泛討論,進而導致美股科技股拋售潮的出現。然而,這僅僅是DeepSeek帶給我們的震撼的開始。
DeepSeek的R1大語言模型憑借其強大的性能,不僅震撼了硅谷,更讓華爾街的投資者們措手不及。一時間,科技股紛紛下跌,其中芯片巨頭英偉達股價暴跌約16.86%,單日市值蒸發約600億美元(原文中的6000億美元應為筆誤,根據上下文及市場常識判斷應為600億美元),博通、超威半導體公司、美光科技、臺積電等芯片及科技企業股價也紛紛走低。此外,與人工智能相關的衍生品,如電力供應商也未能幸免,美國聯合能源公司和Vistra的股價分別下跌了20.85%和28.33%。這一系列連鎖反應,無疑彰顯了DeepSeek R1模型在業界的巨大影響力。
然而,面對這場風暴,白宮人工智能和加密貨幣總管David Sacks卻持樂觀態度。他在社交媒體上表示,DeepSeek R1的表現證明了人工智能競爭的激烈程度,并認為美國總統特朗普廢除拜登行政命令是正確的決定。Sacks認為,拜登的行政命令束縛了美國的人工智能公司,而DeepSeek等企業的崛起則展示了美國在該領域的強大實力。他強調:“我對美國充滿信心,但我們不能自滿。”
就在R1模型引發廣泛討論的同時,DeepSeek又在深夜放出了大招。1月27日晚間,DeepSeek創始人梁文鋒在社交媒體上透露,新版本即將發布。僅僅三個多小時后,人工智能開源社區HuggingFace就展示了DeepSeek發布的一系列開源多模態模型,包括Janus-Pro和JanusFlow,這些模型的參數大小從10億到70億不等。這一消息再次震驚了業界,也讓我們看到了DeepSeek在多模態領域的深厚積累。
本次發布的Janus-Pro系列模型,在文生圖能力方面取得了顯著突破。其中,70億參數的Janus-Pro-7B在GenEval和DPG-Bench基準測試中,分別以80%和84.2%的準確率擊敗了OpenAI的DALL-E3和StableDiffusion等頂尖圖像生成模型。這一成績不僅證明了Janus-Pro的強大性能,也彰顯了DeepSeek在多模態理解和生成方面的深厚實力。
據DeepSeek發布的報告介紹,Janus-Pro是此前發布的Janus模型的改進版本。相較于Janus,Janus-Pro在訓練策略、訓練數據以及模型規模等方面都進行了優化。這些改進使得Janus-Pro在多模態理解和文本到圖像指令跟隨能力方面取得了顯著進步,同時提升了文本到圖像生成的穩定性。
作為一種新穎的自回歸框架,Janus-Pro將多模態理解和生成統一起來,通過解耦視覺編碼來實現這一目標。它將視覺編碼解耦為單獨的路徑,以解決以前方法的局限性,同時仍然使用單一、統一的轉換器架構進行處理。這種設計不僅提高了模型的性能,還使得模型在處理多模態任務時更加靈活和高效。
值得注意的是,DeepSeek在訓練Janus-Pro模型時投入了大量的計算資源。對于1.5B和7B這兩個參數的模型,整個訓練過程在16/32節點的集群上進行,每個節點配備8塊Nvidia A100(40GB)GPU。經過7/14天的訓練,DeepSeek就成功訓練出了能夠擊敗OpenAI DALL-E3和StableDiffusion的模型。這一成績不僅彰顯了DeepSeek的技術實力,也讓我們看到了AI技術在不斷突破極限。
除了強大的文生圖能力外,Janus-Pro-7B還具備圖像識別功能。它能夠根據提供的圖片猜測地點,并給出詳細的描述和分析。例如,當給Janus-Pro-7B提供一張中國杭州西湖的圖片時,它能夠準確識別出圖片中的景點是三潭映月島,并進一步分析出圖片中的建筑、湖水和山脈等特點。這一功能不僅展示了Janus-Pro-7B在圖像識別方面的強大性能,也為我們帶來了更加智能和便捷的圖像處理體驗。
事實上,DeepSeek一直在多模態領域進行探索和創新。去年,他們就推出了基于自回歸的多模態理解與生成統一模型Janus。而進入2025年,他們將Janus進一步升級至Janus-Pro。這一系列動作不僅彰顯了DeepSeek在多模態領域的深厚積累和創新精神,也讓我們看到了AI技術在不斷推動各個行業的變革和發展。
然而,盡管DeepSeek在C端應用上主要聚焦于文本能力,還無法直接生成圖片或識別圖像,但隨著Janus-Pro的發布和技術的不斷進步,用戶或許很快就可以使用DeepSeek進行圖像、視頻等領域的創作。這將為用戶帶來更加智能和便捷的創作體驗,也將推動AI技術在更多領域的應用和發展。
綜上所述,DeepSeek憑借其強大的技術實力和創新精神,在多模態領域取得了顯著突破。Janus-Pro的發布不僅為AI技術的發展注入了新的活力,也為我們帶來了更加智能和便捷的生活體驗。在未來的發展中,我們有理由相信,DeepSeek將繼續引領AI技術的潮流,推動各個行業的變革和發展。讓我們共同期待AI技術為我們帶來的更加美好的未來!