去年刷视频看到别人玩AI绘图眼馋,自己也想试试,结果光安装就折腾了三天。今天跟大伙唠唠踩过的坑,新手看完少走弯路。
一、环境配置就给我整蒙了
第一次装Stable Diffusion,教程说"一键安装包简单"。结果下载完点开,突然报错CUDA out of memory!满屏红色鬼画符吓得我手抖。翻半天论坛才知道显卡驱动太老,重新下了驱动,又弹出torch版本不兼容。气得我晚饭都没吃,按着网友发的年月日对照表,挨个重装Python、Cudnn、Pytorch才算跑通。
- 教训:千万别信什么"小白专用包",老老实实查显卡型号,看官方文档装对应版本
二、喂图喂出四不像
好不容易能训练了,随手拍了20张自家猫当素材。训练完出的图猫有六条腿,背景全是马赛克。重新整理素材发现照片里居然有半个人影!还有个塑料瓶反光。逼得我把200张素材全放大检查:
- 删所有带文字商标的零食包装
- 拿PS把背景抠成纯白
- 每张图统一调成512x512尺寸
这回再训练,猫终于正常长四条腿了。
三、参数调得我头秃
看教程说学习率设0.0001效果结果训练到500步就过拟合——猫长出来的人眼睛看得我发毛。半夜两点还在改参数:
- 批量size从4改成1才不吃显存
- 每轮步数降到1500轮就停
- 开梯度裁剪设0.5防崩图
笔记本风扇嚎得像拖拉机,老婆说我半夜对着屏幕叹气像中邪。
四、出图变惊悚片
兴冲冲拿训练好的模型画妹子,结果手指长成珊瑚,裙子变成液态金属。翻教程发现漏了关键设置:
- 生成时一定要勾面部修复
- 采样步数卡在25到30之间
- CFG值7.5最保险
凌晨三点调出来的人像终于有正常五官,我激动得泡面汤洒键盘上。
五、总结的血泪经验
- 显卡不行别硬扛——我GTX1060跑300张图的模型得烧六个小时,咖啡凉透三杯
- 素材整理要命细——宁可少图也不能带杂质
- 参数不是玄学——拿本子记下每次组合结果,实测比盲从大佬教程管用
- 新手从画风模型练起——比人物模型容错率高十倍
现在回头看刚开始练的畸形猫,感觉能当恐怖片海报。但亲手喂出能画水墨风猫咪的模型时,这半个月折腾也值了。有啥问题评论区喊我,今晚测试新模型去咯!