🎵 音乐

Play.ht

AI语音生成器，实现真实的文字转语音

#语音合成

#文字转语音

#语音生成器

#AI声音

Play.ht

产品详情

PlayHT是一款AI语音生成器，提供超过600种AI声音。使用先进的AI技术，将文字转换为真实的语音，支持多种语言和用途。可以将生成的语音下载为MP3和WAV文件。

主要功能

1

提供超过600种AI声音

2

支持多种语言和口音

3

将文字转换为真实的语音

4

下载生成的语音为MP3和WAV文件

适用人群

适用于视频配音、音频出版、教育培训等场景

快速访问

访问官网 →

所属分类

🎵 音乐

› 文本转声音

› 语音生成

相关推荐

发现更多类似的优质AI工具

VoiSpark

VoiSpark

VoiSpark是一个AI语音生成平台，能生成逼真的文本转语音，克隆声音，并为视频、播客等定制独特AI声音。该平台具有100%免费试用。

AI 多语言支持

Kokoro-82M

Kokoro-82M

Kokoro-82M是一个由hexgrad创建并托管在Hugging Face上的文本到语音（TTS）模型。它具有8200万参数，使用Apache 2.0许可证开源。该模型在2024年12月25日发布了v0.19版本，并提供了10种独特的语音包。Kokoro-82M在TTS Spaces Arena中排名第一，显示出其在参数规模和数据使用上的高效性。它支持美国英语和英国英语，可用于生成高质量的语音输出。

语音合成开源模型

TangoFlux

TangoFlux

TangoFlux是一个高效的文本到音频（TTA）生成模型，拥有515M参数，能够在单个A40 GPU上仅用3.7秒生成长达30秒的44.1kHz音频。该模型通过提出CLAP-Ranked Preference Optimization (CRPO)框架，解决了TTA模型对齐的挑战，通过迭代生成和优化偏好数据来增强TTA对齐。TangoFlux在客观和主观基准测试中均实现了最先进的性能，并且所有代码和模型均开源，以支持TTA生成的进一步研究。

开源机器学习

CosyVoice语音生成大模型2.0-0.5B

CosyVoice语音生成大模型2.0-0.5B

CosyVoice语音生成大模型2.0-0.5B是一个高性能的语音合成模型，支持零样本、跨语言的语音合成，能够根据文本内容直接生成相应的语音输出。该模型由通义实验室提供，具有强大的语音合成能力和广泛的应用场景，包括但不限于智能助手、有声读物、虚拟主播等。模型的重要性在于其能够提供自然、流畅的语音输出，极大地丰富了人机交互的体验。

人工智能自然语言处理

百宝音

百宝音

百宝音是一个在线免费文字转语音的配音合成软件，提供近百种配音模板，主打影视解说配音、专题片配音、广告配音等，具有高度定制化的优势，可根据用户需求定制各种音色风格。

文字转语音配音合成

VoiceBar

VoiceBar

VoiceBar提供最逼真的AI语音合成服务，包括多国语言和口音，具有高级的语音质量和真实感。无需订阅，使用极具竞争力。适用于语音留言、多语言文本转语音、TikTok、解说视频、学习等场景。

AI 语音合成

Suno all in one

Suno all in one

Suno是一款高效的AI工具，可将文本转化为音乐，使音乐创作更加简单。它提供各种音乐风格和声音效果的生成，支持快速、方便的音乐创作。Suno致力于为创作者提供便利的音乐创作工具，帮助他们更轻松地生成高质量的音乐、声音效果。

音乐创作文本转音乐

Stability AI text-to-speech models

Stability AI text-to-speech models

Stability AI 高保真文本转语音模型旨在提供对大规模数据集进行训练的语音合成模型的自然语言引导。它通过标注不同的说话者身份、风格和录音条件来进行自然语言引导。然后将此方法应用于45000小时的数据集，用于训练语音语言模型。此外，该模型提出了提高音频保真度的简单方法，尽管完全依赖于发现的数据，但在很大程度上表现出色。

语音合成高保真

XspaceGPT

XspaceGPT

XspaceGPT是您将Twitter Spaces转换为MP3和文本的首选平台。它利用先进的GPT技术，快速可靠地将Twitter Spaces转换为MP3和文本，并生成具有洞察力的摘要和思维导图。此外，我们还提供Twitter视频下载器，将视频转换为MP4格式。快速、可靠、免费。

思维导图文本转换

VoiceDual

VoiceDual

VoiceDual是一款基于人工智能的语音转换工具，能够将您的声音转换为不同的语言或声音效果。无论您是想要在视频中添加不同语言的配音，还是想要给自己的声音添加特效，VoiceDual都能满足您的需求。该产品支持30多种语言，让您的声音可以轻松变换成全球各地的语言。VoiceDual定价灵活合理，适用于个人用户和小型团队，旨在为用户提供便捷、高效的语音转换体验。

人工智能多语言支持

Text2Audio

Text2Audio

Text2Audio是一个免费的在线TTS工具，能够轻松将文本转化为自然、逼真的语音。无论是用于什么目的，都能轻松创建清晰、生动的语音。

在线工具文本转语音

Listnr AI

Listnr AI

Listnr AI是一款由AI驱动的语音和视频生成工具。它提供900多种语音和142种语言选择，可以生成逼真的语音和视频内容。用户可以免费开始使用，并在需要时选择付费计划。Listnr AI适用于各种场景，包括生成视频、创建语音广告、制作音频文章、播客制作等。它提供透明的定价，用户可以根据自己的需求选择合适的付费计划。

AI 视频生成

Splash Pro

Splash Pro

Splash Pro是一个使用简单的文本提示就可以在几秒内生成歌曲的AI。它使用生成模型产生高质量的音乐。您还可以应用我们的创新式文本转歌声生成AI,为您的歌曲添加自定义的歌唱或说唱人声。

Speaking AI

Speaking AI

Speaking AI是一款使用先进的大语言模型技术实现的文本到语音转换工具，能够以自然的情感进行对话并实现零样本语音克隆。它可以捕捉你独特的音调、音高和调节，让你以前所未有的方式复制和利用自己的声音。Speaking AI通过先进的技术实现了声音克隆的突破，让语音克隆听起来更加自然。使用Speaking AI，你可以通过录制自己的声音，在短短10秒钟内进行克隆。我们致力于将最先进的AI技术用于推动人类进步，特别是在促进语音克隆技术的发展和应用方面。

Fluxon

Fluxon

Fluxon是一个超逼真的AI语音生成器，可以将文本转化为任何语言的超逼真声音。它可以在不到10分钟的示例音频中克隆任何声音。您可以在同一个音频文件中使用多个声音创建对话。还可以通过训练自定义声音来合成单一声音，创建嘴唇同步视频。Fluxon提供了REST API，可以将AI语音生成集成到您的应用程序中。它可以用于各种用途，如为营销和演示视频添加专业和逼真的配音，从文本生成清晰高质量的有声书，为NPC生成逼真的人声，为内容创建专业翻译，为聊天机器人创建更自然的声音，将任何文本内容自动转化为播客等。

AI 聊天机器人

Acoust

Acoust

Acoust是一款强大的文本转语音（TTS）服务，使用最新的AI技术生成自然的声音音频。它提供30多种语言的200多种语音，并允许用户以MP3、WAV和OGG格式下载音频文件。使用Acoust，您可以为视频创建专业的配音，讲述有声读物，并增强培训材料。该服务快速、价格实惠、易于使用。

人工智能视频

浏览更多工具