-->
RayNeo AI是雷鸟自主研发的人工智能语音助手,集成了自然语言处理、语音识别、语音合成等核心技术,可实现自然语言交互、语音控制等功能。该产品已在雷鸟XR系列产品中进行内测,支持行程规划、天气查询、百科知识问答等服务,提升了产品的智能化水平。下一步,RayNeo AI计划推出视觉识别等多模态交互能力,实现更丰富的人机交互体验。
雷鸟自主研发的AI语音助手
用户可通过语音询问天气、规划路线
用户可用语音控制雷鸟XR系列产品
用户可与RayNeo AI进行自然语言闲聊
发现更多类似的优质AI工具
EVI 2是Hume AI推出的新型基础语音对语音模型,能够以接近人类的自然方式与用户进行流畅对话。它具备快速响应、理解用户语调、生成不同语调、以及执行特定请求的能力。EVI 2通过特殊训练增强了情感智能,能够预测并适应用户的偏好,维持有趣且引人入胜的性格和个性。此外,EVI 2还具有多语言能力,能够适应不同应用场景和用户需求。
Gemini Live是谷歌推出的AI助手Gemini的新功能,它允许用户进行自由流畅的对话,支持多声道选择,无需手持操作,提供更自然、会话式的交互体验。它是数字助理领域的重大升级,能够处理复杂任务,节省用户宝贵的时间。
Voice Assistant Plugin for GPT 是一款专为GPT设计的语音助手插件,旨在通过语音交互提升用户体验。该插件结合了先进的语音识别技术,允许用户通过语音命令与GPT进行交流,实现更加自然和便捷的对话体验。产品背景信息显示,该插件由Air Tech Studio开发,支持多语言,并且注重用户数据安全,不与第三方分享任何数据。
SpeechGPT2是由复旦大学计算机科学学院开发的端到端语音对话语言模型,能够感知并表达情感,并根据上下文和人类指令以多种风格提供合适的语音响应。该模型采用超低比特率语音编解码器(750bps),模拟语义和声学信息,并通过多输入多输出语言模型(MIMO-LM)进行初始化。目前,SpeechGPT2还是一个基于轮次的对话系统,正在开发全双工实时版本,并已取得一些有希望的进展。尽管受限于计算和数据资源,SpeechGPT2在语音理解的噪声鲁棒性和语音生成的音质稳定性方面仍有不足,计划未来开源技术报告、代码和模型权重。
Character Calls是Character.AI社区推出的一款应用,旨在通过无缝的双向语音对话功能,让用户与他们喜爱的角色进行互动,就像与朋友通话一样。这项服务完全免费,支持多种语言,包括英语、西班牙语、葡萄牙语、俄语、韩语、日语、中文等。它代表了Character.AI在提升用户与角色互动方式、地点和时间上的一个重大里程碑。
Real-time Voice AI Agent是一个高度灵活的实时语音交互模型,它能够在大约500毫秒内通过语音回答任何查询。该模型支持用户选择任何大型语言模型、文本到语音(TTS)模型和语音到文本(STT)模型。它非常适合用于客户服务机器人、接待员等涉及语音的应用场景。
june是一个结合了Ollama、Hugging Face Transformers和Coqui TTS Toolkit的本地语音聊天机器人。它提供了一种灵活、注重隐私的解决方案,可以在本地机器上进行语音辅助交互,确保没有数据被发送到外部服务器。产品的主要优点包括无需联网即可使用、保护用户隐私、支持多种交互模式等。
bilibot是一个基于哔哩哔哩用户评论训练的本地聊天机器人,支持文字聊天和语音对话。它使用Qwen1.5-32B-Chat作为基础模型,并结合苹果的mlx-lm LORA项目进行微调。语音生成部分基于GPT-SoVITS项目,使用派蒙语音模型。该机器人可以快速生成对话内容,适用于需要智能对话系统的场合。
Siri-Ultra是一个基于云的智能助手,可以在Cloudflare Workers上运行,并且可以与任何大型语言模型(LLM)配合使用。它利用了LLaMA 3模型,并且通过自定义函数调用来获取天气数据和在线搜索。这个项目允许用户通过Apple Shortcuts来使用Siri,从而消除了对专用硬件设备的需求。
Hume AI的同理心语音接口(EVI)是一种由同理心大型语言模型(eLLM)驱动的API,可以理解和模拟语音音调、词语重音等,从而优化人机交互。它基于10多年的研究成果、数百万专利数据点和30多篇发表在顶尖期刊的论文。EVI旨在为任何应用程序提供更自然、富有同情心的语音界面,让人与AI的互动更加人性化。该技术可广泛应用于销售/会议分析、健康与保健、AI研究服务、社交网络等领域。
TeleChat是由中电信人工智能科技有限公司研发的星辰语义大模型,具备强大的对话生成能力,支持多轮对话,适用于多种场景的智能问答和内容生成。模型经过大量高质量中英文语料训练,具备优秀的通用问答、知识类、代码类、数学类问答能力。
GPT Chat是一个基于最先进的AI技术的个人ChatGPT伙伴,通过WhatsApp为您提供个性化的聊天体验。它具有自然语言理解和对话能力,可以作为您的虚拟助手,随时随地与您聊天。无论您需要帮助、想要进行有趣的对话还是寻求信息,GPT Chat都会在这里帮助您。
WhisperFusion是一款基于WhisperLive和WhisperSpeech功能的产品,通过在实时语音转文字流程中集成Mistral大型语言模型(LLM)来实现与AI的无缝对话。Whisper和LLM均经过TensorRT引擎优化,以最大程度提升性能和实时处理能力。WhisperSpeech则使用torch.compile来优化。产品定位于提供超低延迟的AI实时对话体验。
通过多语言TTS文本转语音和STT语音转文本功能,使GPT聊天具备语音交互能力。
GeminiChatUp是一个基于Google Gemini API开发的多功能聊天工具。它拥有流畅的界面和强大的自定义功能。用户可以与Gemini AI进行自然语言交流,获得智能回复。同时支持图片识别,实现更高质量的对话。用户可以保留多组对话记录,并分别设置各组的基础聊天参数。GeminiChatUp还支持响应式布局,在移动端也能流畅使用。
Talk to GPT是一个Chrome插件,使用语音与ChatGPT进行交流。它通过分析你的语音,将你说的话转录成文字,并发送给ChatGPT。ChatGPT能够以100多种语言回答你的问题。插件还支持自动校正和语言水平选择。定价请查看官方网站。