仿聲項目?賽博女友喊我起牀?!

我不美死

最新開源的一個文本轉語音克隆的AI項目,在不需要額外訓練的條件下可以生成非常相似的聲音。

那麼,我們是否可以生成我的賽博老婆喊我起牀的聲音當起牀鈴呢?!(亦或者惡搞親愛的室友喊我爲義父大人)

話不多說,3!2!1!上鍊接!

https://github.com/SparkAudio/Spark-TTS

這個項目主要有幾個特點:

雙語支持:支持中英文,並具備跨語言、代碼切換場景的零樣本語音克隆能力。

可控語音生成:支持通過調整性別、音調、語速等參數創建虛擬說話人。

心動了嗎!

接下來是詳細的部署方法

進入鏈接,“code”這裏下載項目,得到項目文件之後解壓縮

鏈接買一送一https://www.anaconda.com/download,這裏下載anaconda(submit下面有一個小小的registration,直接下載)

然後運行下載的安裝程序吧

next到這裏,勾選如圖(第三個選擇性勾選),然後install,完成之後

接下來win+R進入cmd,運行

conda create -n sparktts python=3.12 -y

conda activate sparktts

進入(sparktts)就是成功啦

在Spark-TTS文件裏打開終端

運行

pip install -r requirements.txt

依賴項安裝完成之後,還差一個PyTorch就可以下載模型啦

回到我們的cmd運行

conda install pytorch torchvision torchaudio cpuonly -c pytorch

確認下載,完成之後,進入Spark-TTS的文件夾

新建一個文本文檔,命名爲download_model.py

在裏面粘貼下面的代碼

from huggingface_hub import snapshot_download

import os

 

# Set download path

 

model_dir = "pretrained_models/Spark-TTS-0.5B"

 

# Check if model already exists

 

if os.path.exists(model_dir) and len(os.listdir(model_dir)) > 0:

    print("Model files already exist. Skipping download.")

else:

    print("Downloading model files...")

    snapshot_download(

        repo_id="SparkAudio/Spark-TTS-0.5B",

        local_dir=model_dir,

        resume_download=True  # Resumes partial downloads

    )

    print("Download complete!")

然後運行這個py

python download_model.py

這樣就OK啦

然後我們就可以 python webui.py

(如果有pycharm就更好了)

這樣就可以開始我們的仿聲啦 

(hym要把這個項目用作正途啊

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com