Midjourney 是一个由同名研究实验室开发的人工智能程序,可根据文本生成图像,于2022年7月12日进入公开测试阶段,用户可透过 Discord 的机器人指令进行操作。该研究实验室由 Leap Motion 的创办人大卫·霍尔兹负责领导。—— Wikipedia
可以加入 Beta 计划从 Discord 群中向机器人提交作图指令。官网服务也提供付费订阅。
微软借助 OpenAI 的 DALL-E 图像生成 AI ,提供了这个在线图片生成服务。用户输入一段文本提示,仅需数秒即可获得一组 AI 生成的与之匹配的图像。
Preview 阶段,每位普通用户媒体可以快速生成 25 次,超过次数需要排队等待。
在线服务效果好,但是有使用次数限制。如果你需要更多的自由度,那么可以考虑自己搭建一套 AI 做图环境。
Stable Diffusion GUI
AI 绘图已经火出圈,自然开源社区里也有许多 Stable Diffusion 的图形界面,方便用户上手体验。
有专门提供给 MacOS 桌面端的 DiffusionBee,还有跨平台的 Stable Diffusion UI v2 。
而本文我们着重介绍可以部署在云端的 Web UI 。
AUTOMATIC1111(简称 A1111)Stable Diffusion Web UI 是为高级用户提供的 Stable Diffusion GUI。
多亏了活跃的开源社区,大多数新功能都会先支持上这个免费的 Stable Diffusion GUI 。
但要使用它并不容易。文档不够详尽,以及提供的茫茫功能列表都会让新手迷茫。
购买一台云主机
初次体验,先试试最便宜的 GPU 主机。
P.S 最低配的也完全够用,生成图片很快!
我开通的云主机的配置如下:
- 系统: Ubuntu22.04
- 显卡: 1 * NVIDIA T4
- CPU/内存: 4 核 32 G
- 系统盘: 200GB
- 带宽: 10Mbps
顺畅的网络环境
略,自己想办法
机器开通后,可以直接从 Web 端一键登录:
也可以使用 ssh 登录,在 “更多操作” 下拉菜单中选择重制密码,即可重新设定一个 root 账号的登录密码,然后云主机会重启。
具体的你可以参考文档产品文档。
登录云主机后,可以先检查一下显卡型号:
货真价实,没有问题,那么开始搭建吧!
安装一些必要的依赖软件
验证 cuda 是否安装成功: