💻

编程分类

文本转声音

共找到 5 个AI工具

个工具

主分类: 编程

子分类: 文本转声音

找到 5 个匹配工具

相关AI工具

点击任意工具查看详细信息

Orpheus TTS

Orpheus TTS 是一个基于 Llama-3b 模型的开源文本转语音系统，旨在提供更加自然的人类语音合成。它具备较强的语音克隆能力和情感表达能力，适合各种实时应用场景。该产品是免费的，旨在为开发者和研究者提供便捷的语音合成工具。

人工智能开源机器学习 +2

编程访问

Zonos

Zonos 是一个先进的文本到语音模型，支持多种语言，能够根据文本提示和说话者嵌入或音频前缀生成自然语音。它还支持语音克隆，只需几秒钟的参考音频即可准确复制说话者的声音。该模型具有高质量的语音输出（44kHz），并允许对语速、音调变化、音频质量和情绪（如快乐、恐惧、悲伤和愤怒）进行精细控制。Zonos 提供了 Python 和 Gradio 接口，方便用户快速上手，并支持通过 Docker 部署。该模型在 RTX 4090 上的实时因子约为 2 倍，适合需要高质量语音合成的应用场景。

多语言支持文本到语音语音克隆 +2

编程访问

kokoro-onnx

kokoro-onnx是一个基于Kokoro模型和ONNX运行时的文本到语音（TTS）项目。它支持英语，并计划支持法语、日语、韩语和中文。该模型在macOS M1上具有接近实时的快速性能，并提供多种声音选择，包括耳语。模型轻量级，约为300MB（量化后约为80MB）。该项目在GitHub上开源，采用MIT许可证，方便开发者集成和使用。

开源语音合成轻量级 +2

编程访问

opensource_notebooklm

opensource_notebooklm是一个开源项目，旨在通过结合Deepseek-V3语言理解和PlayHT文本转语音技术，实现自然、教育性的对话生成。该项目能够生成类似播客的对话，适用于教育和娱乐领域。其主要优点包括强大的语言生成能力和高质量的语音输出，使其在教育内容创作和语言学习应用中具有重要价值。

开源教育内容创作 +2

编程访问

Llama-lynx-70b-4bitAWQ

Llama-lynx-70b-4bitAWQ是一个由Hugging Face托管的70亿参数的文本生成模型，使用了4-bit精度和AWQ技术。该模型在自然语言处理领域具有重要性，特别是在需要处理大量数据和复杂任务时。它的优势在于能够生成高质量的文本，同时保持较低的计算成本。产品背景信息显示，该模型与'transformers'和'safetensors'库兼容，适用于文本生成任务。

自然语言处理机器学习文本生成 +4

编程访问

探索更多编程工具

文本转声音是编程分类下的热门子分类，包含 5 个优质AI工具

浏览编程分类分类

文本转声音

相关AI工具

Orpheus TTS

Zonos

kokoro-onnx

opensource_notebooklm

Llama-lynx-70b-4bitAWQ

相关子分类

开发与工具

AI模型

代码助手

AI开发助手

模型训练与部署

AI代码助手

开发平台

研究工具

探索更多编程工具

文本转声音

相关AI工具

Orpheus TTS

Zonos

kokoro-onnx

opensource_notebooklm

Llama-lynx-70b-4bitAWQ

相关子分类

开发与工具

AI模型

代码助手

AI开发助手

模型训练与部署

AI代码助手

开发平台

研究工具

探索更多 编程 工具

探索更多编程工具