隨著DALL-E-2和Midjourney的發布,您可能聽說過最近 AI 生成藝術的繁榮。這些人工智能模型如何在幾秒鐘內創造性地生成逼真的圖像,這絕對是令人興奮的。您可以在這里查看其中的一些:DALL-E-2 gallery和Midjourney gallery
但是這些模型是封閉源代碼并且在付費墻后面(非常有限的免費使用),我實際上不得不等待 1 個月才能訪問 DALL-E-2,限制為每月大約 15 次免費使用提示。
Stability剛剛為公眾發布了 DALL-E-2 和 Midjourney 背后技術的開源替代版本,稱為Stable Diffusion。演示和源代碼以擁抱的方式發布。
最好的部分是它可以在具有高于平均水平的 Nvidia GPU(VRAM 低于 8GB)容量的本地機器上運行,也可以在 M1 和 M2 Macbooks 上運行!
這很有趣,因為穩定擴散似乎比其他 AI 模型更強大和動態。它甚至可以在兩個不同的文本提示之間進行插值和做夢。可愛的開源社區的所有力量使這成為可能?
??本博客將介紹在 Windows 10 機器上進行穩定擴散的步驟
先決條件(適用于 Windows 10)
硬件要求
- 可用磁盤空間 - 至少 10GB
- RAM - 16GB 用于更快的安裝(也應該在 8GB 機器上工作)
- 具有 CUDA 內核的 Nvidia GPU - 至少 6GB
我正在使用我的游戲 PC,它有 16GB 的 RAM 和 Nvidia RTX 2070 Super 和 8GB VRAM
軟件要求
- 下載并安裝Git,這應該很簡單
- 下載并安裝anaconda dist
-
conda --version
安裝后,確保您已安裝 git bash 并通過在命令行中運行來檢查 conda 安裝。- 如果未找到 conda,則
PATH
按照本教程在您的環境中添加 conda 變量
- 如果未找到 conda,則
- 下載模型檢查點文件(? 大約 4GB,您需要創建一個帳戶)
- 從這里下載并解壓穩定的擴散模型加載器和夢想腳本
配置conda
- 打開 git bash
- 您需要通過運行設置 conda shell
conda init bash
- 重新打開 git bash
加載輔助模型和包以實現穩定的擴散夢想
- 打開 git bash
- 通過在命令行中運行創建 conda env
```
conda env create -f environment.yaml
```
-
激活 conda 環境
conda activate ldm
-
此時,你的 git bash 應該是這樣的(注意前面的 ldm)
(ldm) user@user-name MINGW64 ~/stable-diffusion-main
此過程應安裝所有必需的軟件包,這可能需要一段時間
-
加載模型,這可能還需要一段時間,如果你沒有在 SSD 上運行它,那么去喝杯咖啡? 并等待
success
消息。python scripts/preload_models.py
加載檢查點文件
- 如果您在嘗試運行夢想腳本時遇到以下錯誤,這是必要的先決條件...
super(_open_file, self).__init__(open(name, mode))
FileNotFoundError: [Errno 2] No such file or directory: 'models/ldm/stable-diffusion-v1/model.ckpt'
- 將 4GB 檢查點文件重命名為
model.ckpt
- 將該文件復制到穩定擴散克隆回購中
stable-diffusion-main\models\ldm\stable-diffusion-v1\model.ckpt
升空??
-
你現在應該準備好運行夢想腳本了?
python scripts/dream.py
這應該會給你一個 repl,你可以用它給出任何提示,它會生成一個圖像!
在 RTX 2070 Super 中為我生成單個圖像最多需要 15 秒,它可能因 GPU 和圖像大小而異。
- 運行腳本后監控你的 GPU,腳本應該已經使用了你 GPU 近 95% 的 VRAM ????
如果您不是 CLI 的忠實擁護者,您可以使用 Web GUI,并通過運行來啟動夢想服務器
python3 scripts/dream.py --web
導航到http://localhost:9090/并輸入任何內容!你的創造力就是你的極限。要獲得一些靈感,您可以訪問lexica.art以獲得一些即時的想法。
?? 對于 M1 和 M2 用戶,步驟應該是相同的,但有一些修改,你可以按照這里或這里的演練
如果你設法讓它工作,請在下面用你的提示評論??