控制Stable Diffusion的不受控制的力量
人工智能藝術社區的興奮在最近幾天達到頂峰,讓我想起了去年 Stable Diffusion 的首次發布。本次重點介紹基于Stable Diffusion 1.5的輕量級預訓練模型ControlNet,可以檢測輸入圖像中的邊緣、深度圖或姿態骨架,結合文字提示,精準指導Stable Diffusion中圖像的生成.
下圖是ControlNet論文中的demo,使用Canny邊緣檢測提取輸入圖像中小鹿的輪廓特征,提示“一張高質量、詳細、專業的圖像”生成4張結果圖在 SD 1.5 中。
image.png
2 月 10 日,ControlNet 論文發布,同時發布了預訓練模型的開源權重和論文中提到的所有輸入條件檢測器。社區迅速在 Huggingface 中部署了一個試用 demo,并將其打包為可在 Stable Diffusion WebUI 中使用的擴展。