仿声项目？赛博女友喊我起床？！

我不美死

最新开源的一个文本转语音克隆的AI项目，在不需要额外训练的条件下可以生成非常相似的声音。

那么，我们是否可以生成我的赛博老婆喊我起床的声音当起床铃呢？！(亦或者恶搞亲爱的室友喊我为义父大人)

话不多说，3！2！1！上链接！

https://github.com/SparkAudio/Spark-TTS

这个项目主要有几个特点：

双语支持：支持中英文，并具备跨语言、代码切换场景的零样本语音克隆能力。

可控语音生成：支持通过调整性别、音调、语速等参数创建虚拟说话人。

心动了吗！

接下来是详细的部署方法

进入链接，“code”这里下载项目，得到项目文件之后解压缩

链接买一送一https://www.anaconda.com/download，这里下载anaconda（submit下面有一个小小的registration，直接下载）

然后运行下载的安装程序吧

next到这里，勾选如图（第三个选择性勾选），然后install，完成之后

接下来win+R进入cmd，运行

conda create -n sparktts python=3.12 -y
conda activate sparktts

进入（sparktts）就是成功啦

在Spark-TTS文件里打开终端

运行

pip install -r requirements.txt

依赖项安装完成之后，还差一个PyTorch就可以下载模型啦

回到我们的cmd运行

conda install pytorch torchvision torchaudio cpuonly -c pytorch

确认下载，完成之后，进入Spark-TTS的文件夹

新建一个文本文档，命名为download_model.py

在里面粘贴下面的代码

from huggingface_hub import snapshot_download
import os

# Set download path

model_dir = "pretrained_models/Spark-TTS-0.5B"

# Check if model already exists

if os.path.exists(model_dir) and len(os.listdir(model_dir)) > 0:
    print("Model files already exist. Skipping download.")
else:
    print("Downloading model files...")
    snapshot_download(
        repo_id="SparkAudio/Spark-TTS-0.5B",
        local_dir=model_dir,
        resume_download=True # Resumes partial downloads
    )
    print("Download complete!")