搜索结果

找到 280 条结果

·

用时 0.169 秒

·

关键词： "语音合成"

Azure 认知服务语音

Azure 认知服务语音

Azure 认知服务语音是微软推出的一款语音识别与合成服务，支持超过100种语言和方言的语音转文本和文本转语音功能。它通过创建可处理特定术语、背景噪音和重音的自定义语音模型，提高听录的准确度。此外，该服务还支持实时语音转文本、语音翻译、文本转语音等功能，适用于多种商业场景，如字幕生成、通话后听录分析、视频翻译等。

多语言支持语音识别语音合成 +2

🔧 其他 speech.microsoft.com

AudioLCM

AudioLCM

AudioLCM是一个基于PyTorch实现的文本到音频生成模型，它通过潜在一致性模型来生成高质量且高效的音频。该模型由Huadai Liu等人开发，提供了开源的实现和预训练模型。它能够将文本描述转化为接近真实的音频，具有重要的应用价值，尤其是在语音合成、音频制作等领域。

语音合成音频生成PyTorch +1

🎵 音乐 github.com

seed-tts-eval

seed-tts-eval

seed-tts-eval 是一个用于评估模型零样本语音生成能力的测试集，它提供了一个跨领域目标的客观评估测试集，包含从英语和普通话公共语料库中提取的样本，用于衡量模型在各种客观指标上的表现。它使用了Common Voice数据集的1000个样本和DiDiSpeech-2数据集的2000个样本。

语音合成自动语音识别说话人相似度

💻 编程 github.com

ChatTTS.com

ChatTTS.com

ChatTTS是一个为对话场景设计的声音生成模型，特别适用于大型语言模型助手的对话任务，以及对话式音频和视频介绍等应用。它支持中英文，通过使用约10万小时的中英文数据训练，展现出高质量和自然度的语音合成能力。

开源多语言语音合成 +1

🔧 其他 chattts.com

讯飞A.I.智能客服解决方案

讯飞A.I.智能客服解决方案

A.I.智能客服解决方案是科大讯飞基于其先进的语音技术，为企业提供的一套完整的客户服务系统。该系统通过电话、Web、APP、小程序、自助终端等多种渠道，实现智能外呼、智能接听、语音导航、在线文字客服、质检分析、坐席辅助等功能。它通过高识别率的语音识别引擎、自然流畅的语音合成技术、智能打断能力、IVR导航以及客服平台中间件等技术，帮助企业提高客服效率，降低人力成本，同时提升客户服务体验。

自动化语音识别语音合成 +2

📈 商业 www.aifuwus.com

Hume AI EVI

Hume AI EVI

Hume AI的同理心语音接口(EVI)是一种由同理心大型语言模型(eLLM)驱动的API,可以理解和模拟语音音调、词语重音等,从而优化人机交互。它基于10多年的研究成果、数百万专利数据点和30多篇发表在顶尖期刊的论文。EVI旨在为任何应用程序提供更自然、富有同情心的语音界面,让人与AI的互动更加人性化。该技术可广泛应用于销售/会议分析、健康与保健、AI研究服务、社交网络等领域。

自然语言处理语音合成人机交互 +3

💬 聊天 www.hume.ai

ApolloAI

ApolloAI

ApolloAI是一款人工智能平台，提供AI图像、视频、音乐、语音合成等功能。用户可以通过文本或图片输入生成多种类型的内容，具备商业使用权。定价灵活，提供订阅和一次性购买两种模式。

人工智能图像生成视频生成 +2

💼 生产力 useapollo.app

VoiceBar

VoiceBar

VoiceBar提供最逼真的AI语音合成服务，包括多国语言和口音，具有高级的语音质量和真实感。无需订阅，使用极具竞争力。适用于语音留言、多语言文本转语音、TikTok、解说视频、学习等场景。

AI语音合成TTS

🎵 音乐 www.voicebar.ai

VideoTrans视频翻译配音工具

VideoTrans视频翻译配音工具

VideoTrans是一款免费开源的视频翻译配音工具。它可以一键识别视频字幕、翻译成其他语言、进行多种语音合成,最终输出带字幕和配音的目标语言视频。该软件使用简单,支持多种翻译和配音引擎,能大幅提高视频翻译的效率。

语音合成视频翻译机器翻译 +1

🎬 视频 pyvideotrans.com

Stability AI text-to-speech models

Stability AI text-to-speech models

Stability AI 高保真文本转语音模型旨在提供对大规模数据集进行训练的语音合成模型的自然语言引导。它通过标注不同的说话者身份、风格和录音条件来进行自然语言引导。然后将此方法应用于45000小时的数据集，用于训练语音语言模型。此外，该模型提出了提高音频保真度的简单方法，尽管完全依赖于发现的数据，但在很大程度上表现出色。

语音合成高保真自然语言引导

🎵 音乐 www.text-description-to-speech.com

Gotalk.ai

Gotalk.ai

Gotalk.ai 是一个强大的 AI 语音生成器，能够在几分钟内创建逼真的语音。完美适用于 YouTube、播客和电话系统问候语。通过先进的 AI 算法和深度学习技术，体验自然语音合成。我们的平台提供先进的 AI 语音合成，是寻找创新高效语音生成工具的专业人士的首选解决方案。

语音合成音频生成逼真语音 +1

📁 声音 gotalk.ai

Crikk

Crikk

Crikk是一款价格实惠的强大文本转语音工具，支持56种语言，提供真实的语音合成技术。无论是用于语音播报、有声书还是教育，Crikk都能为用户提供高质量的声音合成。用户可以选择免费试用或者采用月费20美元的专业版，月额度为500,000个字符，拥有6种不同的声音和56种语言。此外，Crikk还将推出移动应用，实现图片或PDF的文字转语音。Monster Incorporation Inc.位于Delaware，United States。

教育语音合成文本转语音 +2

🎮 趣味 crikk.com

audio2photoreal

audio2photoreal

audio2photoreal是一个从音频生成照片级逼真avatar的开源项目。它包含了一个pytorch实现,可以从音频中合成交谈中的人类形象。该项目提供了训练代码、测试代码、预训练的运动模型以及数据集访问。它的模型包括人脸扩散模型、人体扩散模型、人体VQ VAE模型和人体引导变换器模型。该项目让研究人员和开发者能够训练自己的模型,并基于语音合成高质量的逼真avatar。

AI图像生成语音合成 +2

🖼️ 图像 github.com

OpenVoice

OpenVoice

OpenVoice是一个开源的语音克隆技术,可以准确地克隆参考音色,生成多种语言和口音的语音。它可以灵活地控制语音风格,如情感、口音等参数,以及节奏、停顿和语调等。它实现了零样本跨语言语音克隆,即生成语音和参考语音的语言都不需要出现在训练数据中。

语音合成语音克隆零样本学习

🔧 其他 github.com

呱呱有声

呱呱有声

呱呱有声有声制作AI+是一款全流程一体化的声音制作工具，结合人机合作、语音合成、虚拟录音棚和全链条数据，旨在提高制作效率、降低成本。用户可以利用AI辅助画本和全自动对轨功能，轻松完成声音制作。产品支持海量产出有声作品，并拥有国际领先的语音合成技术，提供多种音色选择。同时，产品还提供虚拟录音棚和全链条数据管理功能，使制作过程更加高效和透明。

语音合成AI辅助声音制作 +2

🎵 音乐 www.gstudios.com.cn

声音复刻

声音复刻

声音复刻是一套高效化的轻量级音色定制方案。用户在开放环境中录制秒级别录音即可极速拥有专属 AI 定制音色。核心产品优势包括超低成本、极速复刻、高度还原和技术领先。适用场景包括视频配音、语音助手、车载助手、在线教育和有声阅读等。

语音合成音色定制AI 音频

🎵 音乐 www.volcengine.com

TurnVoice

TurnVoice

TurnVoice 是一个命令行工具，可以转换和翻译 YouTube 视频中的声音。它提供了语音转换和语音翻译的功能，可以替换特定的发言人声音，支持本地文件处理，并保留原始背景音频。该工具使用了多个语音合成引擎，并支持多种语言。TurnVoice 适用于各种场景，如创意视频制作、语音翻译等。该产品目前处于开发阶段，支持的功能和定价等详细信息请参考官方网站。

语音合成视频制作语音转换 +1

🎵 音乐 github.com

Video Translate

Video Translate

Video Translate可以一键翻译上传的视频,同时保持语音的自然风格。支持60秒内300MB以下的MP4、AVI、MOV格式视频。翻译支持多种语言,语音合成源自领先的语音技术公司。定价方面,提供免费和付费版本,付费版本可享受更高清晰度的输出。该产品定位于帮助用户无缝地翻译视频内容,从而拓展多语言观众群。

语音合成视频翻译免费翻译

🎬 视频 content.akool.com

AuroraAI

AuroraAI

AuroraAI是由Incribo开发的产品，可以生成安全高质量的训练数据，为您的AI模型加速发展。它可以用于多种用途，包括语音合成、音频分割、人物建模、景观设计、图像处理等。AuroraAI注重隐私保护，成本高效，支持多模态数据生成，具有无限的变化可能性，用户拥有数据所有权，并且可以直接使用。目前处于早期访问阶段，欢迎加入我们的社区。

图像处理语音合成合成数据 +5

🖼️ 图像 incribo.com

GetLogit

GetLogit

GetLogit是一个人工智能平台，为用户提供智能写作助手、AI图像生成器、12个聊天机器人专家、语音转文本、AI语音合成、AI代码生成器等功能。用户可以使用智能写作助手快速生成优秀文本，利用AI图像生成器创建精美图片和图形，与12个专家聊天机器人进行交流，将语音转录为文本，利用AI语音合成将文字转为语音录音，以及快速生成高质量的编程代码等。

人工智能聊天机器人语音合成 +4

💼 生产力 getlogit.com

Toogi AI

Toogi AI

Toogi AI是一款先进的内容创作平台，包括文字、图片和语音等高质量内容生成工具。它能够帮助用户轻松生成引人入胜的文章、博客、社交媒体更新，并提供优质的图像和语音合成功能。Toogi AI提供多种功能，包括智能写作、图像生成、语音合成、转录等，帮助用户提高生产效率并节省时间。Toogi AI的定价灵活，并提供免费试用。

AI图像生成内容创作 +2

💼 生产力 toogiai.com

BuzzWork

BuzzWork

BuzzWork.ai是一款AI内容生成工具，提供全面的故事创作、博客文章生成、聊天机器人、健身计划生成、语音合成等功能。它能够帮助用户快速生成各类内容，提高创作效率。

AI写作语音合成 +1

✍️ 写作 buzzwork.ai

DupDub

DupDub

DupDub是一款全能内容创作平台，助您轻松打造内容并优化工作流程。通过AI语音合成，将您的内容栩栩如生地呈现，节省录音棚或语音艺术家的时间和预算。利用AI视频编辑功能，将图片转为视频，实现更加生动的内容创作。DupDub还提供AI字幕、视频本地化等专业编辑功能，助您轻松创造高质量的内容。定价灵活，适用于各种行业和用途。

AI内容创作视频编辑 +3

💼 生产力 www.dupdub.com

MiniMax开放平台

MiniMax开放平台

MiniMax 开放平台是一个具备文本大模型能力的开放平台。它提供精确的信息提取能力，适用于会议纪要、摘要提取等总结说明场景。平台提供高质量的文本理解及语音合成能力，为用户提供一个客观且全面的内容总结。

语音合成信息提取文本大模型

4 / 12