昨天刚折腾完AI语音训练,趁着热乎劲赶紧记下来。你们不是老问怎么入门吗?这回我可算摸出点门道了,手把手带你们走一遍我的翻车实录。
第一步 备齐家伙事儿
翻出吃灰的USB麦克风(淘宝60块那种),插上电脑发现没反应。折腾半小时才明白得用3.5mm接口的耳机麦,连夜跑楼下便利店买了个9.9元耳麦。录音软件直接搜的免费开源的,装好差点被满屏英文劝退,靠手机截图翻译才找到开始按钮。
第二步 当人肉复读机
本以为照着稿子念就行,结果:
- 刚念两句空调外机开始轰隆隆
- 重录时邻居突然剁排骨
- 念到第三遍快递员哐哐砸门
钻进衣柜里裹着棉被录,汗流浃背搞出30段干声。剪噪音时发现棉被摩擦声比人声还大,又返工两次。
第三步 喂给AI当饲料
把音频拖进训练工具时傻眼了:
- 软件报错说采样率不对
- 改完参数发现语音时长超标
- 切分段时手抖把"你好"切成了"你~嚎"
终于听见电子人说话
拿自己微信语音试转换,出来效果笑到头掉:
- "晚上吃烧烤"变成"晚上吃沙雕"
- 念数字"5201314"自带电音颤音
- 说快点就发出开水壶烧开的啸叫
但当我用1.0倍速说"欢迎关注我的频道",那个电子音居然有七分像我!虽然带着老式收音机的杂音,可尾音上扬的小习惯完全复刻了。
折腾三天饭都没好好吃,拿这个电子音给老妈发微信,她秒回:"你感冒了?嗓子这么哑"——这工具真的行!