我这几天一直都在搞这个GPT-SOVITS,第一天的时候就觉得麻烦了,先是拿自己录了一段音试一下效果。结果搞半天整出来的模型是废的,根本不能跑,做了几遍之后才行。
于是我就想着能不能搞一下游戏角色模型,把游戏脚本搞到手了,语音音频也解包出来了,但是实际操作的话,是想让我死吗,假如我只用50条。
首先我不懂日语,其次我得再脚本里面找出对应的台词。你的意思是,要我在这么一大串东西里找吗?
![]()
这还只是其中的一个,总的有二百多个文档,一个个找,找一辈子。
台词也是少的一百条,多的大几千。一句句听吗,而且不能太长太短。
所以说,光靠人力肯定是不行的。
我就想,能不能自己写一个脚本,自动给我把这些玩意提取出来。一年之前学过unity,懂一点c#,可是早就忘的差不多了,而且如果做出来有个窗口互动就更好了,以前学的只能用在unity上,果然还是不行的。
那就只有学校里教过的python了,这东西我几乎完全没听,考试还是偷偷摸摸让ai给我写的。这不就对了,让ai给我写。
以前让ai编程基本都是一坨,也不知道现在水平怎么样,眼下专业点的ai都有点麻烦才能用。先拿deepseek试一下。
![]()
我其实一开始想的是让ai给我整理,后面才想到的写脚本。
只是提取我要求的固定内容的话,ds还是很容易就搞好的。轻轻松松就全部找出来了。但是这样还是有点麻烦,我还要一个个复制粘贴。
![]()
于是就让他给我写脚本,居然很有效果。
![]()
![]()
![]()
我就让他继续写,我想到什么就加什么。
可是,改的次数多了的话,ai就会犯错
后面他就会改原本没有问题的地方,自己乱加东西,导致我也要多次进行对话,最后
达到对话上限
这完蛋了。
没办法,只好慢慢试,经过多次实验后,花了两天时间,得出了一个比较好的方案。
我的方法:
1:最好提前想要自己要实现的所有功能,一次告诉ai。
![]()
对话完后还是可以进行修改的,可以多次完善。这个工具,我后面也加入了一些功能,没对话太多次数。
2:不要想着做太复杂的,ai也做不到。
我本来想着做一个可以通过在窗口界面添加代码就能实现匹配多种游戏脚本格式的功能,甚至可以一个脚本就能完成多个功能,实际上,ai也做不到呀。
3:有什么问题报错直接问。
这个不用细说,如果是问问题和一些简单的报错,可以直接修改句子来保证不消耗对话次数。有的时候多次报错也没办法解决的话,直接放弃这次对话吧,再开一条。
![]()
4:最好自己也懂一点编程基础
真的只要一点就行,有些小地方能看懂就能改,比如什么输出时候的文件格式或者名称,我的这个运行方式是识别脚本里面固定的格式来实现的,只要看懂固定的内容就行。要求不是很高,比较我也只会一点。
最后介绍一下我的几个工具
文本提取工具
![]()
文本提取,实际上并不能完美提取,面对分段式的就做不到了。而且只能提取有配音的,因为炼模型只需要配音。
音频筛选工具
![]()
直接根据音频时长进行筛选,非常方便,但是音频内容就没有办法了,不过影响不大,完全够用。一次处理几千条完全没有问题。
标注工具
![]()
我是自己看过了标注文件的格式,让ai也根据这个格式来匹配提取的台词和音频文件名称对应,最后输出标注文件的。加了一个删除无法匹配就删掉和中日文就修改标注里面的一个部分的功能,效果还不错。
最后,我实际上也有一些其他的小工具,比如音频合成,都是没有问题的,所以说,用ai来代替自己的一些工作非常有用,不然我这几天的工作量起码翻了百倍。
更多游戏资讯请关注:电玩帮游戏资讯专区
电玩帮图文攻略 www.vgover.com
