仿聲項目？賽博女友喊我起牀？！

我不美死

最新開源的一個文本轉語音克隆的AI項目，在不需要額外訓練的條件下可以生成非常相似的聲音。

那麼，我們是否可以生成我的賽博老婆喊我起牀的聲音當起牀鈴呢？！(亦或者惡搞親愛的室友喊我爲義父大人)

話不多說，3！2！1！上鍊接！

https://github.com/SparkAudio/Spark-TTS

這個項目主要有幾個特點：

雙語支持：支持中英文，並具備跨語言、代碼切換場景的零樣本語音克隆能力。

可控語音生成：支持通過調整性別、音調、語速等參數創建虛擬說話人。

心動了嗎！

接下來是詳細的部署方法

進入鏈接，“code”這裏下載項目，得到項目文件之後解壓縮

鏈接買一送一https://www.anaconda.com/download，這裏下載anaconda（submit下面有一個小小的registration，直接下載）

然後運行下載的安裝程序吧

next到這裏，勾選如圖（第三個選擇性勾選），然後install，完成之後

接下來win+R進入cmd，運行

conda create -n sparktts python=3.12 -y
conda activate sparktts

進入（sparktts）就是成功啦

在Spark-TTS文件裏打開終端

運行

pip install -r requirements.txt

依賴項安裝完成之後，還差一個PyTorch就可以下載模型啦

回到我們的cmd運行

conda install pytorch torchvision torchaudio cpuonly -c pytorch

確認下載，完成之後，進入Spark-TTS的文件夾

新建一個文本文檔，命名爲download_model.py

在裏面粘貼下面的代碼

from huggingface_hub import snapshot_download
import os

# Set download path

model_dir = "pretrained_models/Spark-TTS-0.5B"

# Check if model already exists

if os.path.exists(model_dir) and len(os.listdir(model_dir)) > 0:
    print("Model files already exist. Skipping download.")
else:
    print("Downloading model files...")
    snapshot_download(
        repo_id="SparkAudio/Spark-TTS-0.5B",
        local_dir=model_dir,
        resume_download=True # Resumes partial downloads
    )
    print("Download complete!")