前言
在人工智能浪潮席卷全球的今天,声音克隆技术正以前所未有的速度改变着我们与数字世界的互动方式。Index-TTS,作为一款卓越的工业级可控高效零样本文本转语音系统,让普通用户也能轻松体验到将任意声音“复刻”并应用于文本转语音的强大能力。然而,许多高性能的AI应用通常部署在本地环境中,这使得远程访问和共享成为一大挑战。幸运的是,cpolar 内网穿透技术为我们提供了一个完美的解决方案,它能够将本地服务安全、高效地暴露到公网,让您的AI声音服务真正实现“随时随地,触手可及”。
本文将为您揭示如何将 Index-TTS 整合包与 cpolar 内网穿透技术强强联手,从零开始搭建一个功能强大、可远程访问的AI声音克隆服务。无论您是AI爱好者、内容创作者,还是希望探索声音技术边界的开发者,本教程都将为您提供详细的步骤和实用的指导,助您轻松驾驭声音的未来!
1 什么是Index-TTS
Index-TTS的GitHub官网:https://github.com/index-tts/index-tts
Index-TTS(Index Text-to-Speech)是一个工业级的、可控且高效的零样本文本转语音(TTS)系统。它主要基于 XTTS 和 Tortoise 等先进的语音合成技术,旨在提供高质量、高效率的语音克隆和文本转语音服务。Index-TTS 的核心优势在于其“零样本”能力,这意味着它只需要极少量的参考音频(甚至无需预先训练),就能学习并模仿特定音色的语音风格,从而生成自然、富有表现力的语音。
Index-TTS 的主要特点包括:
- 工业级品质: 具备在实际应用中稳定运行和提供高质量语音输出的能力。
- 可控性: 允许用户对语音的语速、音调、情感等多个维度进行精细化控制,以满足不同场景的需求。
- 高效性: 优化了语音合成的效率,能够在较短时间内完成文本到语音的转换。
- 零样本学习: 仅需少量参考音频即可实现声音克隆,极大地降低了使用门槛。
- 多语言支持: 能够支持中文和英文等多种语言的语音合成。
简而言之,Index-TTS 让普通用户也能轻松拥有一个“声音克隆工厂”,无论是为视频配音、制作有声读物,还是为智能应用提供个性化语音,都能得心应手。
2 Index-TTS下载及启动
由于官方的开源代码方式部署环境较为复杂不适宜新手小白入门上手,所以本教程演示的将使用@宇宙重女库瓦特罗,@心空 12138 制作的整合包,让新手小白入门上手变得更加简单!
2.1 硬件与系统要求
NVIDIA 50 系显卡/ AMD 显卡 / MAC 用户:请下载对应的专用整合包。
⚠️MAC 专用包仅限 M 芯片可使用
在开始使用 Index-TTS 整合包之前,请确保您的计算机满足以下基本要求:
硬件/软件类别 | 最低要求 | 推荐配置 | 说明 |
---|---|---|---|
操作系统 | Windows 10 | Windows 11 | 确保系统已安装最新的系统更新和驱动程序 |
显卡类型 | NVIDIA 显卡 | NVIDIA 显卡 | 必须支持CUDA |
显存容量 | 6GB | 8GB 或更高 | 显存越大,处理速度越快 |
显卡型号 | GTX 1060 6GB | RTX 3060 及以上 | 推荐RTX系列以获得更好性能 |
处理器 | Intel i5 / AMD Ryzen 5 | Intel i7 / AMD Ryzen 7 | 多核心处理器有助于提升性能 |
内存(RAM) | 8GB | 16GB 或更高 | 内存不足可能导致程序崩溃 |
存储空间 | 10GB 可用空间 | 20GB 可用空间 | 用于安装和运行,模型文件较大 |
网络速度 | 2MB/s | 5MB/s 或更高 | 首次运行需要下载模型文件 |
⚠️ 特别提醒:
情况 | 说明 | 建议 |
---|---|---|
无独立显卡 | 可以使用CPU进行推理 | 处理速度会非常慢,请做好心理准备 |
首次启动 | 系统会自动下载模型文件 | 这可能需要较长时间,请耐心等待 |
运行环境 | 建议关闭其他占用显存的应用程序 | 以确保最佳性能 |
满足以上要求的计算机可以流畅运行 Index-TTS 整合包,为您提供高质量的声音克隆服务。
2.2 整合包下载
整合包可以访问百度网盘获取:
链接: https://pan.baidu.com/s/1SXPXYqcw3ZesFUMf_GVMAQ?pwd=jpp6
提取码: jpp6
这边将以windows操作系统进行操作演示,所以这里下载windows的整合包。
2.3 启动整合包
将解压工具7-Zip
下载下来后安装,使用7-Zip
工具进行解压整合包:
- Win11 用户可能需要先点击“显示更多选项”才能看到 7-Zip 菜单。
⚠️请务必使用 7-Zip 进行解压!Windows 自带解压,WPS 解压,360 压缩等工具可能会导致文件缺失或损坏,引发后续各种奇怪的错误。
接着进入到解压后的目录,找到脚本run.ps1
,右键点击使用PowerShell运行
:
🚫 路径禁忌:
解压后的文件夹路径,绝对不能包含中文、空格或特殊字符!
错误示范:
D:\AI工具\IndexTTS\index-tts-test
正确示范:
D:\AI\IndexTTS\index-tts-test
运行后,会弹出PowerShell窗口
:
可能会弹出是否允许Python通过防火墙,点击
允许
即可⚠️控制台如果显示乱码,不影响正常使用,可以参考如下图
等待一会儿,浏览器会自动打开网页:
http://localhost:9874
可以看到,Index-TTS正常启动啦!
3 Index-TTS声音克隆使用
首先,在网页上点击1-TTS推理
,然后点击打开TTS推理WebUI
按钮,如下图:
接着,将准备好的音频素材
放入工作目录WORKSPACE
中:
D:\AI\IndexTTS\index-tts-test\WORKSPACE\source\灵笼-白月魁
这里将音频素材
放在工作目录的source
目录下:
接着,回到页面,依次如下图操作:
点击刷新文本后,滚动到下方,上传原素材参考音频,然后点击生成音频
按钮:
生成完成后,可以点击播放按钮进行播放,也可以将其下载,下来:
也可以在工作目录中找到克隆生成的音频文件:
让我们试听一下原素材的音频和克隆后的音频对比:
原素材(灵笼-白月魁 [分离人声-43s]):
克隆后的音频文件:
好啦,是不是特别的像?到这儿,Index-TTS克隆声音的教程就结束啦!
4 使用cpolar将Index-TTS穿透至公网
4.1为什么要穿透Index-TTS?
很多时候我们在本地电脑或服务器上部署了 Index-TTS,但又希望能在外面随时访问,比如和同事协作、给客户演示,或者让别人直接调用生成语音。问题是本地服务默认只能在局域网里用,外网是访问不到的。通过 cpolar 我们可以把本地的 Index-TTS 安全地映射到公网,得到一个随时可用的公网地址,这样无论身处何地,都能方便地远程使用和共享,再也不用折腾复杂的网络配置或购买固定公网 IP。
4.2 什么是cpolar?
- cpolar 是一款内网穿透工具,可以将你在局域网内运行的服务(如本地 Web 服务器、SSH、远程桌面等)通过一条安全加密的中间隧道映射至公网,让外部设备无需配置路由器即可访问。
- 广泛支持 Windows、macOS、Linux、树莓派、群晖 NAS 等平台,并提供一键安装脚本方便部署。
4.3 下载cpolar
打开cpolar官网的下载页面:https://www.cpolar.com/download
点击立即下载 64-bit
按钮,下载cpoalr的安装包:
下来下来是一个压缩包,解压后执行目录种的应用程序,一路默认安装即可,安装完成后,打开cmd窗口输入如下命令确认安装:
cpolar version
出现如上版本即代表安装成功!
4.4注册及登录cpolar web ui管理界面
4.4.1 注册cpolar
官网链接:https://www.cpolar.com/
访问cpolar
官网,点击免费注册
按钮,进行账号注册
注册页面:
4.4.2 访问web ui管理界面
注册完成后,在浏览器中输入如下地址访问 web ui管理界面:
http://127.0.0.1:9200
输入刚才注册好的cpolar账号登录即可进入后台页面:
4.5 穿透Index-TTS的WebUI界面
前面可以看到,TTS推理WebUI的界面,端口显示为:9872
所以我们需要将该端口进行穿透以支持咱们公网访问!
4.5.1 随机域名方式(免费方案)
随机域名方式适合预算有限的用户。使用此方式时,系统会每隔 24 小时左右 自动更换一次域名地址。对于长期访问的不太友好,但是该方案是免费的,如果您有一定的预算,可以查看大纲4.2 的固定域名方式,且访问更稳定。
点击左侧菜单栏的隧道管理
,展开进入隧道列表
页面,页面下默认会有 2 个隧道:
- ssh隧道,指向22端口,tcp协议
- website隧道,指向8080端口,http协议(http协议默认会生成2个公网地址,一个是http,另一个https,免去配置ssl证书的繁琐步骤)
点击website隧道
的编辑
按钮,填写如下信息:
- 注意:每个用户创建的隧道显示的公网地址都不一样!
接着,点击左侧菜单的状态
菜单,接着点击在线隧道列表
菜单按钮,可以看到有2个website的隧道,一个为http协议,另一个为https协议:
接下来在浏览器中访问website隧道生成的公网地址(http和https皆可)
这里以https为例:
可以看到成功访问啦!
4.5.2 固定域名方式(升级任意套餐皆可)
进入官网的预留页面:https://dashboard.cpolar.com/reserved
列表中显示了一条已保留的二级子域名记录:
- 地区:显示为
China Top
。 - 二级域名:显示为
indextts
。
注:二级域名是唯一的,每个账号都不相同,请以自己设置的二级域名保留的为主
进入侧边菜单栏的隧道管理
下的隧道列表
,可以看到名为index-tts
的隧道
点击编辑
按钮进入编辑页面,修改域名类型为二级子域名
,然后填写前面配置好的子域名,点击更新按钮:
来到状态
菜单下的在线隧道列表
可以看到隧道名称为index-tts
的公网地址已经变更为二级子域名+固定域名主体及后缀
的形式了:
这里以https协议做访问测试:
访问成功!
接下来进行测试,这里使用原来的音频素材,文案换一个如下:
cpolar 是一款内网穿透工具,可以将你在局域网内运行的服务(如本地 Web 服务器、SSH、远程桌面等)通过一条安全加密的中间隧道映射至公网,让外部设备无需配置路由器即可访问。
操作步骤参考图如下:
可以看到,成功生成且下载下来了克隆的音频文件,让我们听一下输出的效果:
这样一来,即使 Index-TTS 服务部署在家中或本地服务器,使用 cpolar 将其映射到公网后,人在外地也可以像访问普通网站一样通过浏览器直接使用家中的语音服务。无论是远程协作、给客户演示,还是随时生成语音内容,都无需担心网络配置复杂或公网 IP 问题,让使用更加灵活便捷。
5 给Index-TTS服务添加授权验证
由于Index-TTS
服务的WebUI界面无需登录即可进行访问,为了保护个人的隐私即安全,cpolar的隧道服务支持给网站添加授权验证功能,防止您部署在家中的Index-TTS
服务被滥用。
首先,打开隧道列表,点击编辑index-tts
的隧道:
然后,点击高级按钮,展开,按照如下图进行配置:
点击更新按钮后,访问穿透的地址,可以发现需要授权验证:
https://indextts.cpolar.top
输入用户名admin
和密码123456
进行登录:
可以发现,成功登录进来啦!这样,一个可以随时访问且带有安全性的Index-TTS
网页端就弄好啦!
总结
借助 Index-TTS 整合包与 cpolar 内网穿透,本地语音克隆服务能够被安全、稳定地映射至公网,实现随时随地的远程访问与协作。本文完成了从环境说明、WebUI 启动,到使用 cpolar 提供的两种公网访问方案(随机域名与固定二级子域名)的完整演示:
- 随机域名(免费):快速上线、零门槛试用,适合临时演示与短期协作;
- 固定子域名(升级):稳定可预期的长期地址,便于脚本集成、对外联调与团队协作。
通过该组合方案,创作者可在外网直接调用本地 TTS 服务进行配音、审核与交付;企业可将内部语音服务开放给远程成员与合作方;个人用户亦可在不同终端灵活访问家中 GPU 设备,显著降低运维与网络配置成本。若需扩展访问控制、带宽与并发能力,可在 cpolar 控制台按需升级相应能力,以获得更高可用性与更优体验。
感谢您阅读本篇文章,有任何问题欢迎留言交流。cpolar官网-安全的内网穿透工具 | 无需公网ip | 远程访问 | 搭建网站