數據科學簡訊 2023-03-24


頭條


GitHub Copilot X

Copilot 即將推出新的對話界面、GPT-4 升級、錯誤修復建議、文檔編寫和自動拉取請求。這些發布是 GitHub 成為開發者工具包強國目標的下一步。

谷歌和微軟的聊天機器人在錯誤信息的對決中相互引用

根據 The Verge 上的一篇評論文章,微軟、谷歌和 OpenAI 等大型科技公司倉促推出 AI 聊天機器人有可能破壞網絡的信息生態系統。作者舉了一個例子,微軟的 Bing 聊天機器人錯誤地指出谷歌的 Bard 聊天機器人已經被關閉,并引用了一條推文、一條 Hacker News 評論和假新聞作為證據。這篇文章表明,人工智能語言模型無法區分事實與虛構,可能會在整個網絡上釋放出一系列錯誤信息和不信任,而且這些公司對機器人進行實驗的免責聲明是一種站不住腳的辯護。

Nvidia 進入基礎模型即服務(foundation models as a service)

機器人、圖像、文本、簡歷等等! Nvidia 已經將他們的帽子扔進了戒指。基礎模型即服務將在企業領域首次亮相,為專有數據提供量身定制的解決方案。憑借其多模式功能,該平臺可以處理一系列數據類型,包括文本、圖像、視頻,甚至 3D 內容,允許構建定制的多模式語言模型和生成模型以適應特定用例。與 Getty Images、Shutterstock 和 Adobe 等行業領導者的合作確保版權問題得到有效解決。


研究


我們其他人的 Data Deduplication

圍繞重復數據刪除的有用性爭論的雙方都有很多論文。無論如何,對同一個數據點進行 300,000+ 次訓練似乎是一種浪費。這里一個簡單的重復數據刪除技術是嵌入你的數據點,聚類成 k(例如,10k 個聚類),然后刪除與其他數據點具有非常高余弦相似性的子集。這種技術似乎對嵌入的選擇和集群的數量很穩健,只要集群足夠高。它也適用于各種模式。

Text to Room

從來沒有一個社區比目前的生成 AI 社區對室內設計更感興趣。這項工作非常符合當前的趨勢。他們需要做很多新穎的調整才能使整個 3D 空間與提示對齊。總之,非常有趣的 3D 資產生成工作。

FreeDoM:一種無需訓練的條件擴散模型

本文介紹了 FreeDoM,這是一種無需訓練的條件擴散模型,它利用現成的預訓練網絡來構建與時間無關的能量函數,從而能夠在各種條件下進行有效生成。所提出的方法在簡單、有效和低成本方面具有優勢,并且比現有的免訓練方法具有更廣泛的應用范圍,如在不同數據域(包括圖像和潛在代碼域)上的實驗所證明的那樣。


工程


ChatLlama (Website)

圍繞指令調整的Alpaca 模型的一個很好的包裝器接口。目前只有 70億參數模型可用,其他型號即將推出。雖然質量不及 ChatGPT,但它是一個有代碼的有趣的開放替代方案。

Generative models for medical (GitHub Repo)

朝著評估、創建和管理生成模型邁出的重要一步,適用于各種任務,特別是醫學。該項目旨在通過為生成性醫療任務構建工具來提供幫助,并提供指標和教程來幫助用戶入門。


雜七雜八


人工智能是下一個技術壟斷嗎?

由于構建其中一些 AI 系統需要巨大的資金需求,因此尚不清楚它們是否會以人們希望的方式顛覆和帶來創新。它們難以復制且不透明,但可以作為建立大量公司的基礎。

Mozilla 推出專注于可信賴人工智能的新初創公司

Firefox 瀏覽器的開發商 Mozilla 正在啟動一家 AI 初創公司,以構建開源且“值得信賴”的 AI。 Mozilla 執行總裁兼 Mozilla.ai 負責人 Mark Surman 表示,這家新成立的公司名為 Mozilla.ai,其使命不僅僅是構建任何人工智能——它的使命是構建開源且“值得信賴”的人工智能.

摩根斯坦利和 OpenAI

摩根士丹利正在使用 OpenAI 的 GPT-4 為內部聊天機器人提供支持,幫助財富管理人員查找相關信息。關于投資策略、市場研究和分析師見解的大量信息存放在許多內部網站上,主要以 PDF 格式提供,需要顧問瀏覽大量信息以找到特定問題的答案。該模型將對財富管理內容進行全面搜索,“有效解鎖摩根士丹利財富管理的累積知識”。

斯坦福大學下架 Alpaca

斯坦福大學的研究人員以成本和安全問題為由取消了 Alpaca。

視頻游戲開發商 Ubisoft 正在使用 AI 編寫對話

流行視頻游戲《刺客信條》的發行商育碧現在正在使用一種名為 Ghostwriter 的人工智能工具來幫助為其游戲編寫對話。

Next.js ChatGPT (GitHub Repo)

Next.js ChatGPT 是一個負責任的聊天應用程序,由 GPT-4 提供支持。

The HustleGPT Challenge (GitHub Repo)

HustleGPT Challenge 是一個精選的 HustleGPT 列表。

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,565評論 6 539
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,115評論 3 423
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,577評論 0 382
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,514評論 1 316
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,234評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,621評論 1 326
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,641評論 3 444
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,822評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,380評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,128評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,319評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,879評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,548評論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,970評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,229評論 1 291
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,048評論 3 397
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,285評論 2 376

推薦閱讀更多精彩內容