數據科學簡訊 2023-03-15


頭條


Alpaca:一個強大的開源指令跟隨模型

GPT-3.5 (text-davinci-003)、ChatGPT、Claude 和 Bing Chat 等指令跟隨模型變得越來越強大。然而,指令遵循模型仍然存在許多缺陷:它們會產生虛假信息、傳播社會刻板印象并產生有毒語言。為了在解決這些緊迫問題方面取得最大進展,學術界的參與很重要。 Alpaca 是從 LLaMA 7B 模型在 52K 指令跟隨演示中微調的模型。

一起發布 OpenChatKit

OpenChatKit 提供了一個強大的開源基礎,可以為各種應用程序創建專用和通用聊天機器人。 OpenChatKit 是 OpenAI 的 ChatGPT 的 Together 版本。該模型的所有權重、代碼和訓練數據均可在線獲得。它甚至接受了 100% 負碳計算的訓練。

Grammarly 推出生成式 AI 產品 GrammarlyGO

語法檢查工具 Grammarly 宣布支持生成式 AI 工具,該工具可以按照您的個人寫作風格編寫內容。 “GrammarlyGO”將在未來幾個月推出,是一款生成式人工智能產品,旨在“提高人們寫作時的生產力”。與 ChatGPT 一樣,GrammarlyGO 能夠根據簡短提示創建文本,不過 Grammarly 的特殊技巧是生成的內容會復制您通常的寫作風格


研究


詹森不等式

對于應用數學家和機器學習從業者來說,這是一個非常有用的不等式。這篇文章探討了這種經常倒退但有用的不平等現象。如果您希望了解更多 ML 背后的數學知識,那么這篇文章值得一讀。

StyleGANEX:使用擴張卷積重新縮放 StyleGAN 以實現穩健的未對齊面部操作

本文針對 StyleGAN 的局限性提出了一種解決方案,該局限性僅限于以固定圖像分辨率裁剪對齊的人臉。該解決方案涉及使用擴張卷積在不改變模型參數的情況下重新調整 StyleGAN 中淺層的感受野,從而產生可以適應可變分辨率并更好地表征未對齊面孔的特征。此外,該論文還介紹了一種編碼器,它提供了擴展 StyleGAN 的第一層特征,并驗證了該方法在各種面部操作任務中的有效性,包括超分辨率、面部屬性編輯、草圖/面具到面部轉換,以及臉部美白。

MVImgNet:多視圖圖像的大規模數據集

作者介紹了 MVImgNet,這是一個用于 3D 視覺的大規模多視圖圖像數據集。它包含來自真實世界對象的 650 萬幀,彌合了 2D 和 3D 視覺之間的差距。還介紹了 3D 對象點云數據集 MVPNet。


工程


Hyper light speed GPT (GitHub Repo)

基于 NanoGPT 存儲庫,此代碼可以在短短 3 分鐘內將僅解碼器的 Transformer 模型訓練到一定程度的合理困惑度。它旨在易于理解、易于破解,并且可以快速收斂,供研究人員探索他們的想法。

Guardrails (GitHub Repo)

Guardrails 是一個 Python 包,允許用戶為 LLM 的輸出添加結構、類型和質量保證。

Whisperboard (GitHub Repo)

Whisperboard 是一款基于 OpenAI 的 Whisper 模型的 iOS 應用程序,用于隨時隨地錄制和轉錄音頻。


雜七雜八


人工智能錯位的熱點理論

許多機器學習研究人員擔心構建人工智能的風險。一種流行的 AI 風險集中在 AGI 失調上。它假定我們將構建一個超級智能、超級能力的 AI,但 AI 的目標將被錯誤指定并且與人類價值觀不一致。如果人工智能足夠強大,并且足夠不靈活地追求其目標,那么即使是細微的偏差也可能對人類構成生存風險。

GPT-4 升級將包括文本轉視頻

微軟德國 CTO Andreas Braun 表示,OpenAI 即將進行的 GPT-4 升級將允許用戶將文本轉換為視頻。 Braun 補充說,更強大的人工智能將在本周推出,結束對其發布的猜測。 “我們將在下周推出 GPT-4,在那里我們將擁有提供完全不同可能性的多模態模型——例如,視頻,”布勞恩說。

人工智能可以預測下一次糧食危機

一項新的研究表明,人工智能能夠在世界各地爆發糧食不安全事件之前就更好地識別它們。

通用汽車計劃讓您通過 ChatGPT 與汽車交談

微軟和通用汽車之間的一項新合作將使 ChatGPT 聊天機器人能夠被添加到通用汽車的汽車中

ChatGPTNet (GitHub Repo)

ChatGPTNet 是 .NET 的 ChatGPT 集成庫

?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容