頭條
微軟將其新的人工智能 Bing 帶到 Windows 11 任務(wù)欄
微軟正在發(fā)布 Windows 11 的重大更新,將公司新的人工智能 Bing 搜索添加到任務(wù)欄。新的 Windows 11 更新將提供對(duì)新 Bing 聊天功能的快速訪問(wèn)以及一系列新功能。一個(gè)新的 Bing 圖標(biāo)將出現(xiàn)在任務(wù)欄的搜索框中,微軟在搜索彈出窗口中突出顯示新的聊天答案體驗(yàn)??雌饋?lái)微軟正在明確表示人工智能是他們的未來(lái),就像幾年前谷歌所做的那樣。
Typeface 融資 6500 萬(wàn)美元,為企業(yè)帶來(lái)生成式人工智能
Typeface 是一家開(kāi)發(fā)用于起草營(yíng)銷文案和圖像的人工智能儀表板的初創(chuàng)公司,本周從 Lightspeed Venture Partners、GV(谷歌風(fēng)投)、M12(微軟風(fēng)險(xiǎn)基金)和 Menlo Ventures 獲得了 6500 萬(wàn)美元的風(fēng)險(xiǎn)投資支持。 Typeface 由前 Adobe 首席技術(shù)官 Abhay Parasnis 創(chuàng)立,試圖將生成式 AI 與品牌基調(diào)、受眾和工作流程結(jié)合起來(lái)——正如 Parasnis 頗為雄心勃勃地說(shuō)的那樣——“重新構(gòu)想”內(nèi)容工作流程和企業(yè)內(nèi)容開(kāi)發(fā)。
PromptLoop:構(gòu)建由 AI 提供支持的電子表格模型
使用 Google 表格和 Excel 中的 PromptLoop 構(gòu)建電子表格模型,使用我們的 AI 模型轉(zhuǎn)換、提取或匯總?cè)魏挝谋?。該公式的設(shè)計(jì)類似于 SUM 或 VLOOKUP,并使用強(qiáng)大的 AI 模型生成答案。
研究
使用具有多個(gè)標(biāo)簽的圖來(lái)學(xué)習(xí)具有零標(biāo)簽的圖
零樣本遷移學(xué)習(xí)是一種方法,它允許您在沒(méi)有標(biāo)簽的目標(biāo)域上提高模型的性能,但可以遷移相關(guān)源域中模型學(xué)習(xí)的知識(shí)。 Google 的這項(xiàng)新工作概述了如何在具有多種數(shù)據(jù)類型的異構(gòu)圖上執(zhí)行此過(guò)程。他們引入了許多創(chuàng)新,使他們能夠?qū)W習(xí)標(biāo)簽豐富和標(biāo)簽差的圖之間的強(qiáng)映射。他們發(fā)現(xiàn)在各個(gè)領(lǐng)域都有 24% 到 190% 的顯著改進(jìn)。
拼貼擴(kuò)散:對(duì)基于擴(kuò)散的圖像生成的細(xì)粒度控制
文本條件擴(kuò)散模型可以生成高質(zhì)量的圖像,但它們通常需要額外的控制來(lái)確保精確的圖像輸出。在這篇論文中,作者介紹了 Collage Diffusion,這是一種拼貼條件擴(kuò)散算法,允許用戶控制場(chǎng)景中對(duì)象的空間排列和視覺(jué)屬性。通過(guò)定義具有有序圖層序列的拼貼畫,每個(gè)圖層都有一個(gè) RGBA 圖像和相應(yīng)的文本提示,用戶可以逐層控制圖像協(xié)調(diào)并編輯生成圖像中的單個(gè)對(duì)象,同時(shí)保持其他對(duì)象固定。 Collage Diffusion 使用 alpha 掩碼修改文本-圖像交叉注意力,以確保輸入文本的不同部分對(duì)應(yīng)于輸入拼貼層中指定的各個(gè)位置。這種方法生成全局協(xié)調(diào)的圖像,比以前的方法更好地保持所需的對(duì)象位置和視覺(jué)特征。
工程
RLHF 以減少語(yǔ)言模型的毒性
對(duì)齊語(yǔ)言模型很困難。一種方法使用“人類反饋”來(lái)訓(xùn)練獎(jiǎng)勵(lì)模型。但是,如果我們可以根據(jù)每個(gè)示例即時(shí)計(jì)算獎(jiǎng)勵(lì)模型,就不需要昂貴的反饋。在這個(gè)例子中,他們使用另一種語(yǔ)言模型來(lái)對(duì)一段文本的毒性進(jìn)行評(píng)分。他們可以將其用作減少模型輸出毒性的獎(jiǎng)勵(lì)。
Bing Chat 的間接提示注入
如果用戶允許,Bing Chat 可以查看當(dāng)前打開(kāi)的網(wǎng)站。作者表明,攻擊者可以在用戶正在訪問(wèn)的網(wǎng)站中植入注入,這會(huì)悄無(wú)聲息地將 Bing Chat 變成尋找并滲透?jìng)€(gè)人信息的社會(huì)工程師。用戶無(wú)需詢問(wèn)網(wǎng)站或執(zhí)行任何操作,只需在瀏覽器中打開(kāi)網(wǎng)站時(shí)與 Bing Chat 進(jìn)行交互即可。
雜七雜八
ChatGPT 和 Whisper API
OpenAI 已將 gpt-3.5-turbo 添加到他們的 API 中,這與支持 ChatGPT 的模型相同。它比 API 中的其他 GPT3.5 模型便宜 10 倍。它在包含文本和元數(shù)據(jù)的聊天標(biāo)記語(yǔ)言上運(yùn)行。他們展示了商業(yè)示例,概述了該模型更適合許多非聊天用途,并已正式將他們的語(yǔ)音轉(zhuǎn)文本 Whisper 模型添加到 API。鑒于他們最近關(guān)于 AGI 的帖子談到放慢未來(lái)的部署,我們可能需要一段時(shí)間才能發(fā)布另一個(gè)這樣的版本。
使用 GPT 構(gòu)建世界
這篇文章是為那些對(duì)在 GPT 之上構(gòu)建交互工具感興趣并希望看到作者遇到的一些事情的人而寫的。我們知道 GPT 非常擅長(zhǎng)生成列表、提供自然語(yǔ)言上下文和創(chuàng)建結(jié)構(gòu)化輸出。作者利用這些好處創(chuàng)建了一座城市——從建筑類型和建筑到人和家具。
Nvidia 最新的 GPU 驅(qū)動(dòng)程序可以升級(jí)舊的模糊的 YouTube 視頻
Nvidia 今天發(fā)布了新的 GPU 驅(qū)動(dòng)程序,它將在 RTX 30 和 40 系列卡上升級(jí)舊的模糊網(wǎng)絡(luò)視頻。 RTX Video Super Resolution 是 Nvidia 的一項(xiàng)新的 AI 升級(jí)技術(shù),可在 Chrome 或 Edge 中運(yùn)行,通過(guò)銳化對(duì)象的邊緣和減少視頻偽影來(lái)改善瀏覽器中的任何視頻。
YouTube 的新領(lǐng)導(dǎo)者戲弄人工智能工具
YouTube 新任負(fù)責(zé)人尼爾·莫漢 (Neal Mohan) 在上個(gè)月上任后首次向社區(qū)發(fā)表講話時(shí),概述了他的主要優(yōu)先事項(xiàng),并戲弄了該媒體平臺(tái)即將推出的一些功能。在他的信中,Mohan 首先說(shuō)他將“繼續(xù)把 [創(chuàng)作者] 放在第一位”,并回顧了該平臺(tái)最近添加的一些功能。他還取笑了一個(gè)特別有趣的新工具:YouTube 正在為內(nèi)容創(chuàng)作者開(kāi)發(fā)生成式 AI 工具。
Meta 的 AI 驅(qū)動(dòng)的廣告系統(tǒng)分裂了營(yíng)銷人員
Meta 為響應(yīng) Apple 的隱私變化而對(duì)其廣告技術(shù)進(jìn)行全面改革的努力為品牌帶來(lái)了豐碩的成果,但也讓營(yíng)銷人員擔(dān)心他們被迫放棄對(duì)社交媒體平臺(tái)的過(guò)多控制。近幾個(gè)月來(lái),該公司一直在投入大量資金,將機(jī)器學(xué)習(xí)和人工智能應(yīng)用于其廣告系統(tǒng)。