-->
共找到 30 个AI工具
点击任意工具查看详细信息
EVI 2是Hume AI推出的新型基础语音对语音模型,能够以接近人类的自然方式与用户进行流畅对话。它具备快速响应、理解用户语调、生成不同语调、以及执行特定请求的能力。EVI 2通过特殊训练增强了情感智能,能够预测并适应用户的偏好,维持有趣且引人入胜的性格和个性。此外,EVI 2还具有多语言能力,能够适应不同应用场景和用户需求。
Gemini Live是谷歌推出的AI助手Gemini的新功能,它允许用户进行自由流畅的对话,支持多声道选择,无需手持操作,提供更自然、会话式的交互体验。它是数字助理领域的重大升级,能够处理复杂任务,节省用户宝贵的时间。
Voice Assistant Plugin for GPT 是一款专为GPT设计的语音助手插件,旨在通过语音交互提升用户体验。该插件结合了先进的语音识别技术,允许用户通过语音命令与GPT进行交流,实现更加自然和便捷的对话体验。产品背景信息显示,该插件由Air Tech Studio开发,支持多语言,并且注重用户数据安全,不与第三方分享任何数据。
SpeechGPT2是由复旦大学计算机科学学院开发的端到端语音对话语言模型,能够感知并表达情感,并根据上下文和人类指令以多种风格提供合适的语音响应。该模型采用超低比特率语音编解码器(750bps),模拟语义和声学信息,并通过多输入多输出语言模型(MIMO-LM)进行初始化。目前,SpeechGPT2还是一个基于轮次的对话系统,正在开发全双工实时版本,并已取得一些有希望的进展。尽管受限于计算和数据资源,SpeechGPT2在语音理解的噪声鲁棒性和语音生成的音质稳定性方面仍有不足,计划未来开源技术报告、代码和模型权重。
Character Calls是Character.AI社区推出的一款应用,旨在通过无缝的双向语音对话功能,让用户与他们喜爱的角色进行互动,就像与朋友通话一样。这项服务完全免费,支持多种语言,包括英语、西班牙语、葡萄牙语、俄语、韩语、日语、中文等。它代表了Character.AI在提升用户与角色互动方式、地点和时间上的一个重大里程碑。
Real-time Voice AI Agent是一个高度灵活的实时语音交互模型,它能够在大约500毫秒内通过语音回答任何查询。该模型支持用户选择任何大型语言模型、文本到语音(TTS)模型和语音到文本(STT)模型。它非常适合用于客户服务机器人、接待员等涉及语音的应用场景。
june是一个结合了Ollama、Hugging Face Transformers和Coqui TTS Toolkit的本地语音聊天机器人。它提供了一种灵活、注重隐私的解决方案,可以在本地机器上进行语音辅助交互,确保没有数据被发送到外部服务器。产品的主要优点包括无需联网即可使用、保护用户隐私、支持多种交互模式等。
bilibot是一个基于哔哩哔哩用户评论训练的本地聊天机器人,支持文字聊天和语音对话。它使用Qwen1.5-32B-Chat作为基础模型,并结合苹果的mlx-lm LORA项目进行微调。语音生成部分基于GPT-SoVITS项目,使用派蒙语音模型。该机器人可以快速生成对话内容,适用于需要智能对话系统的场合。
Siri-Ultra是一个基于云的智能助手,可以在Cloudflare Workers上运行,并且可以与任何大型语言模型(LLM)配合使用。它利用了LLaMA 3模型,并且通过自定义函数调用来获取天气数据和在线搜索。这个项目允许用户通过Apple Shortcuts来使用Siri,从而消除了对专用硬件设备的需求。
Hume AI的同理心语音接口(EVI)是一种由同理心大型语言模型(eLLM)驱动的API,可以理解和模拟语音音调、词语重音等,从而优化人机交互。它基于10多年的研究成果、数百万专利数据点和30多篇发表在顶尖期刊的论文。EVI旨在为任何应用程序提供更自然、富有同情心的语音界面,让人与AI的互动更加人性化。该技术可广泛应用于销售/会议分析、健康与保健、AI研究服务、社交网络等领域。
TeleChat是由中电信人工智能科技有限公司研发的星辰语义大模型,具备强大的对话生成能力,支持多轮对话,适用于多种场景的智能问答和内容生成。模型经过大量高质量中英文语料训练,具备优秀的通用问答、知识类、代码类、数学类问答能力。
GPT Chat是一个基于最先进的AI技术的个人ChatGPT伙伴,通过WhatsApp为您提供个性化的聊天体验。它具有自然语言理解和对话能力,可以作为您的虚拟助手,随时随地与您聊天。无论您需要帮助、想要进行有趣的对话还是寻求信息,GPT Chat都会在这里帮助您。
WhisperFusion是一款基于WhisperLive和WhisperSpeech功能的产品,通过在实时语音转文字流程中集成Mistral大型语言模型(LLM)来实现与AI的无缝对话。Whisper和LLM均经过TensorRT引擎优化,以最大程度提升性能和实时处理能力。WhisperSpeech则使用torch.compile来优化。产品定位于提供超低延迟的AI实时对话体验。
通过多语言TTS文本转语音和STT语音转文本功能,使GPT聊天具备语音交互能力。
GeminiChatUp是一个基于Google Gemini API开发的多功能聊天工具。它拥有流畅的界面和强大的自定义功能。用户可以与Gemini AI进行自然语言交流,获得智能回复。同时支持图片识别,实现更高质量的对话。用户可以保留多组对话记录,并分别设置各组的基础聊天参数。GeminiChatUp还支持响应式布局,在移动端也能流畅使用。
RayNeo AI是雷鸟自主研发的人工智能语音助手,集成了自然语言处理、语音识别、语音合成等核心技术,可实现自然语言交互、语音控制等功能。该产品已在雷鸟XR系列产品中进行内测,支持行程规划、天气查询、百科知识问答等服务,提升了产品的智能化水平。下一步,RayNeo AI计划推出视觉识别等多模态交互能力,实现更丰富的人机交互体验。
Talk to GPT是一个Chrome插件,使用语音与ChatGPT进行交流。它通过分析你的语音,将你说的话转录成文字,并发送给ChatGPT。ChatGPT能够以100多种语言回答你的问题。插件还支持自动校正和语言水平选择。定价请查看官方网站。
Moemate是一个由AI驱动的虚拟陪伴助手,可以进行生动的对话,提供日常生活中的有价值的帮助,成为一个有趣和智能的助手,为你的生活带来乐趣。它可以进行随和的交谈,当你孤单或无聊时陪伴你。它也可以提供日常生活中的协助,比如提醒日程安排、搜索信息等。与Moemate的交互就像与一个有趣的朋友聊天一样。
Aya 是一款基于 ChatGPT 的语音助手。她可以像与普通人交谈一样与你对话。你可以向她提问,她会回答你。Aya 具有自然语言理解和生成能力,能够帮助用户解答问题、提供信息和进行对话交互。Aya 还可以通过语音回答问题,提供更便捷的使用体验。定价详细信息请参考官方网站。
这个插件可以通过语音与GPT进行聊天,具有将语音转换为文本、将GPT回复转换为语音、建议更好的表达句子、创建与GPT的对话脚本等特点,使对话更加专注和自然。它允许定制语速和声音以满足不同熟练水平的用户。
Talk with chat gpt是一个Chrome扩展,允许您与chatGPT进行对话。您可以通过录音或点击按钮向chatGPT发送语音或文本消息,chatGPT会以文本形式回答您。这个扩展适合练习口语和听力。
Summme是一个插件,为您喜欢的AI聊天机器人添加自然语言的语音合成功能。它支持ChatGPT、Bard、Bing Chat、Claude.ai等多个聊天机器人平台。您可以自动或手动将聊天机器人的回复转换为语音,享受更加自然的语音交流体验。Summme提供多种语音音调和语言选择,支持调节语速,还可以根据您的名字进行个性化问候。完全免费且无需注册。尝试Summme,为您的聊天机器人增添声音。
Talk to Poe AI是一个插件,为Poe的所有AI,包括Sage、GPT-4和Claude+,提供了语音控制和朗读功能。您可以使用语音与Poe的AI进行对话,并以多种语言听取其回复。该插件还可以将AI的回复以清晰自然的语音读出,支持多种语言。安装简便,无需键盘输入,让您更轻松地与AI交流。
ChatGPT Voice Assistant是一款增强版的ChatGPT插件,集成了语音控制和文本转语音功能。该插件允许您通过录音按钮捕捉和发送语音查询给ChatGPT,省去了打字的必要性。AI的回答会通过语音播放,确保无缝的听觉交互。这样,您可以轻松地与智能对话伙伴互动,并探索先进AI的能力。 特点: - 捕捉语音输入并发送给ChatGPT - 回答会通过语音播放(如果您喜欢阅读,可以关闭语音播放) - 支持多种语言 - 通过点击麦克风按钮或按住空格键来捕捉语音 - 重复播放语音回答 ChatGPT Voice Assistant使用浏览器的本地语音识别功能。请确保在提示时授予麦克风权限。
ChatGPT - 语音聊天是一个能够为ChatGPT增加语音交互功能的插件。用户可以通过快捷键进行语音提问,并听取ChatGPT生成的回答。
Talk-to-ChatGPT是一个通过麦克风与ChatGPT交流并听到其语音回复的Chrome插件。它使用了语音识别和文本转语音技术。您无需键盘即可与ChatGPT进行互动!它完全免费且开源。 打开ChatGPT首页即可使用。页面右上角会出现一个小框 - 点击“开始”按钮即可开始使用。您还可以调整设置:语言、速度、音调... 该插件支持Google Chrome API的所有语音识别和文本转语音语言,这意味着支持所有主要语言。您还可以使用ElevenLabs API来访问无数的ChatGPT语音。
Speaksai是一款创新的应用,结合了人工智能和自然语言处理的强大功能,通过简单的语音交互提供即时问题解答。与Speaksai进行对话,它具有上下文感知和友好的对话能力。
GPTChatBot是一款连接ChatGPT的Android应用,可通过语音和Whatsapp分享与之交流。它是你的个人AI聊天机器人助手,能帮助你完成日常任务,回答问题并提供娱乐。使用GPTChatBot,你可以即时获得问题的智能回答,与家人和朋友保持联系,获得日常任务的帮助,甚至玩游戏。该应用具有简单易用和无缝体验的特点。
Intelli Chat是一款基于人工智能的聊天机器人应用程序,旨在以自然高效的方式与用户进行对话。它具备先进的自然语言处理能力,能够理解和解释包括文本和语音在内的多种形式的人类语言。采用了GPT-3.5模型作为基础架构,能够分析大量数据,并生成准确和相关的回答。Intelli Chat能够从与用户的互动中学习,不断提高对语言和人类行为的理解,从而在将来提供更准确和有帮助的回应。它可以回答各种话题的问题,从技术和科学到历史和流行文化。它还可以帮助安排约会、预订和在线查找信息等任务。总之,Intelli Chat的目标是通过提供快速、高效和个性化的对话体验,使用户的生活更加轻松。无论您需要解决特定问题还是只是想聊天,Intelli Chat都会提供帮助和支持。
AnswerMate是一款AI聊天应用,让你与ChatGpt模型训练出的智能虚拟助手进行自然而有信息量的对话。无论你是想快速获得问题的答案,与AI进行有趣的聊天,还是想提高语言能力,AnswerMate都能满足你的需求。你可以提问任何问题,从天气和新闻到哲学和科学,AnswerMate都能给出详细且有趣的回答。
探索 聊天 分类下的其他子分类
730 个工具
218 个工具
134 个工具
125 个工具
114 个工具
110 个工具
94 个工具
80 个工具
AI语音助手 是 聊天 分类下的热门子分类,包含 30 个优质AI工具