💬

聊天分类

AI语音合成

共找到 5 个AI工具

个工具

主分类: 聊天

子分类: AI语音合成

找到 5 个匹配工具

相关AI工具

点击任意工具查看详细信息

LLaMA-Omni

LLaMA-Omni是一个基于Llama-3.1-8B-Instruct构建的低延迟、高质量的端到端语音交互模型，旨在实现GPT-4o级别的语音能力。该模型支持低延迟的语音交互，能够同时生成文本和语音响应。它在不到3天的时间内使用仅4个GPU完成训练，展示了其高效的训练能力。

多模态语音交互高质量 +2

聊天访问

EVI 2

EVI 2是Hume AI推出的新型基础语音对语音模型，能够以接近人类的自然方式与用户进行流畅对话。它具备快速响应、理解用户语调、生成不同语调、以及执行特定请求的能力。EVI 2通过特殊训练增强了情感智能，能够预测并适应用户的偏好，维持有趣且引人入胜的性格和个性。此外，EVI 2还具有多语言能力，能够适应不同应用场景和用户需求。

人工智能个性化多语言 +2

聊天访问

心辰Lingo语音大模型

心辰Lingo语音大模型是一款先进的人工智能语音模型，专注于提供高效、准确的语音识别和处理服务。它能够理解并处理自然语言，使得人机交互更加流畅和自然。该模型背后依托西湖心辰强大的AI技术，致力于在各种场景下提供高质量的语音交互体验。

人工智能自然语言处理语音识别 +1

聊天访问

SpeechGPT2

SpeechGPT2是由复旦大学计算机科学学院开发的端到端语音对话语言模型，能够感知并表达情感，并根据上下文和人类指令以多种风格提供合适的语音响应。该模型采用超低比特率语音编解码器（750bps），模拟语义和声学信息，并通过多输入多输出语言模型（MIMO-LM）进行初始化。目前，SpeechGPT2还是一个基于轮次的对话系统，正在开发全双工实时版本，并已取得一些有希望的进展。尽管受限于计算和数据资源，SpeechGPT2在语音理解的噪声鲁棒性和语音生成的音质稳定性方面仍有不足，计划未来开源技术报告、代码和模型权重。

语音对话情感表达端到端模型 +1

聊天访问

Hume AI EVI

Hume AI的同理心语音接口(EVI)是一种由同理心大型语言模型(eLLM)驱动的API,可以理解和模拟语音音调、词语重音等,从而优化人机交互。它基于10多年的研究成果、数百万专利数据点和30多篇发表在顶尖期刊的论文。EVI旨在为任何应用程序提供更自然、富有同情心的语音界面,让人与AI的互动更加人性化。该技术可广泛应用于销售/会议分析、健康与保健、AI研究服务、社交网络等领域。

自然语言处理语音合成人机交互 +3

聊天访问

探索更多聊天工具

AI语音合成是聊天分类下的热门子分类，包含 5 个优质AI工具

浏览聊天分类分类

AI语音合成

相关AI工具

LLaMA-Omni

EVI 2

心辰Lingo语音大模型

SpeechGPT2

Hume AI EVI

相关子分类

聊天机器人

AI聊天机器人

客户服务

开发与工具

情感陪伴

AI模型

个人助理

AI信息平台

探索更多聊天工具

AI语音合成

相关AI工具

LLaMA-Omni

EVI 2

心辰Lingo语音大模型

SpeechGPT2

Hume AI EVI

相关子分类

聊天机器人

AI聊天机器人

客户服务

开发与工具

情感陪伴

AI模型

个人助理

AI信息平台

探索更多 聊天 工具

探索更多聊天工具