1.项目
EasyVoice 是一个开源的文本、小说智能转语音解决方案,旨在帮助用户轻松将文本内容转换为高质量的语音输出。可以把长篇文章(甚至几百万字的小说)变成流畅的语音,并支持多角色配音和字幕生成,非常适合做有声书、有声小说、视频配音或AI广播剧。
1.1项目介绍
🔑 主要功能亮点:
功能 | 说明 |
---|---|
📖 超大文本支持 | 可一次处理百万字以上的长篇内容,没有长度限制。 |
🗣️ 多角色语音合成 | 支持为不同角色设置不同声音,适合小说对话、广播剧。 |
🌍 多语言支持 | 可合成中文、英文、日文等多种语言。 |
⏱️ 流式语音生成 | 文本输入后几秒内就开始合成,不需要等全部生成完。 |
📝 字幕生成 | 自动生成字幕(srt 文件),方便配合视频使用。 |
🤖 智能推荐角色声音 | 使用 AI 分析自动选择不同段落的配音声音(可关闭)。 |
🔌 支持多个 TTS 引擎 | 可接入 OpenAI TTS、Edge-TTS、Azure TTS 等语音引擎。 |
🧰 支持 API/CLI 调用 | 适合集成进你的应用或自动化脚本中。 |
1.2项目展示



2.相关地址
gitHub开源项目:https://github.com/cosin2077/easyVoice?tab=readme-ov-file
3.搭建环境
- 服务器:这里为了方便搭建项目使用的是莱卡云的境外香港云服务器。(国内用户连接建议使用国内的服务器(需备案域名或者IP+端口)延迟会更低)
- 莱卡云服务器促销活动性价比会更高。查看官网购买链接:https://www.lcayun.com
- 资源配置:2核2G 30G硬盘
由于国内服务器访问海外源较慢,这边为了方便演示直接使用海外服务器搭建。 - 服务器系统:Debian-12
- 【必需】安装Docker:安装好 Docker、Docker-compose
- 【非必需】域名一枚,可用于解析到服务器上使用域名访问

4.搭建视频
哔哩哔哩:
5.搭建方式
5.1 安装docker和docker-compose
安装教程:服务器上安装docker和docker-compose教程
5.2 创建EasyVoice的docker文件
#在opt目录下创建EasyVoice文件夹
mkdir /opt/EasyVoice
#打开EasyVoice文件
cd /opt/EasyVoice
#编辑docker-compose.yml文件
vi docker-compose.yml
5.3 安装EasyVoice镜像
services:
easyvoice:
image: cosincox/easyvoice:latest # 使用的镜像名称和标签
container_name: easyvoice # 容器的名称
ports:
- 3780:3000 # 映射端口:主机的3780端口 -> 容器的3000端口
volumes:
- ./audio:/app/audio # 将当前目录下的 audio 文件夹挂载到容器内的 /app/audio 路径
restart: always # 设置容器在退出时自动重启(始终重启)

填完按esc键 输入 :wq 保存退出
5.4 运行EasyVoice的docker镜像
我们先启动docker
# 启动docker
docker compose up -d
# 重启docker
docker compose stop
docker compose start
# 升级docker
docker compose down
docker compose pull
docker compose up -d
访问IP:3780端口就可以有界面出现了。
http://ip:3780


6.结尾
EasyVoice 提供了一个 Web 界面,你可以上传 TXT 文件或直接粘贴文本,然后选择语言、声音、角色划分,一键生成音频和字幕。