💻 编程

kotaemon

kotaemon是一个开源的、基于RAG(Retrieval-Augmented Generation)模型的工具,旨在通过聊天界面与用户文档进行交互。它支持多种语言模型API提供商和本地语言模型,提供了一个干净、可定制的用户界面,适用于终端用户进行文档问答以及开发者构建自己的RAG问答流程。

#开源
#聊天机器人
#RAG
#文档问答
定价: 免费
kotaemon

产品详情

开源的RAG基础聊天工具,与文档对话。

主要功能

1
支持多用户登录,私有/公共文件集合中组织文件。
2
支持本地语言模型和流行的API提供商(如OpenAI、Azure、Ollama、Groq)。
3
提供混合RAG流程,结合全文和向量检索器以及重新排名以确保最佳检索质量。
4
支持多模态问答,包括对包含图表的文档进行问答,并支持多模态文档解析。
5
提供详细的引用以确保LLM答案的正确性,并在浏览器内的PDF查看器中直接查看带有高亮的引用。
6
支持复杂推理方法,使用问题分解来回答复杂或多跳问题。
7
提供可配置的设置界面,用户可以在界面上调整检索和生成过程中的大多数重要方面。
8
可扩展性,基于Gradio构建,允许用户自定义或添加任何UI元素。

使用教程

1
1. 克隆kotaemon的GitHub仓库到本地环境。
2
2. 安装所需的Python包和依赖。
3
3. 根据需要配置环境变量,包括API密钥和端点。
4
4. 启动web服务器,并通过浏览器访问UI。
5
5. 使用默认或自定义的用户账号登录系统。
6
6. 上传或组织文档,开始通过聊天界面与文档进行交互。
7
7. 根据需求调整设置,如检索和生成过程的配置。
8
8. 利用kotaemon的多模态和复杂推理功能,深入分析和检索文档内容。

使用示例

用户可以使用kotaemon来查询文档中的数据,获取准确的答案。

开发者可以利用kotaemon构建一个定制的问答系统,用于特定领域的文档分析。

团队可以部署kotaemon,以支持多人协作,共同管理和检索文档信息。

快速访问

访问官网 →

所属分类

💻 编程
› AI聊天机器人
› AI问答

相关推荐

发现更多类似的优质AI工具

rag-chatbot

rag-chatbot

rag-chatbot是一个基于人工智能技术的聊天机器人模型,它能够让用户通过自然语言与多个PDF文件进行交互。该模型使用了最新的机器学习技术,如Huggingface和Ollama,来实现对PDF内容的理解和回答生成。它的重要性在于能够处理大量文档信息,为用户提供快速、准确的问答服务。产品背景信息表明,这是一个开源项目,旨在通过技术创新提升文档处理的效率。目前该项目是免费的,主要面向开发者和技术爱好者。

llm rag
💻 编程
voice-chat-pdf

voice-chat-pdf

voice-chat-pdf是一个基于LlamaIndex项目,使用Next.js构建的示例,它通过简单的RAG系统,允许用户通过语音与PDF文档进行交互。这个项目需要OpenAI API密钥来访问实时API,并在项目中生成文档的嵌入向量,以便进行语音交互。它展示了如何将先进的机器学习技术应用于提高文档交互的效率和便捷性。

机器学习 OpenAI
💻 编程
gradio-bot

gradio-bot

gradio-bot是一个可以将Hugging Face Space或Gradio应用转化为Discord机器人的工具。它允许开发者通过简单的命令行操作,将现有的机器学习模型或应用快速部署到Discord平台上,实现自动化交互。这不仅提高了应用的可达性,还为开发者提供了一个与用户直接交互的新渠道。

机器学习 机器人
💻 编程
curiosity

curiosity

curiosity是一个基于ReAct框架的聊天机器人项目,旨在通过LangGraph和FastHTML技术栈探索和构建类似Perplexity的用户交互体验。项目核心是一个简单的ReAct代理,使用Tavily搜索增强文本生成。支持三种不同的LLMs(大型语言模型),包括OpenAI的gpt-4o-mini、Groq的llama3-groq-8b-8192-tool-use-preview以及Ollama的llama3.1。项目通过FastHTML构建前端,尽管在调试过程中可能遇到一些挑战,但整体上提供了快速的用户体验。

聊天机器人 LLMs
💻 编程
MemoryScope

MemoryScope

MemoryScope是一个为大型语言模型(LLM)聊天机器人提供长期记忆能力的框架。它通过记忆数据库和工作库,使得聊天机器人能够存储和检索记忆片段,从而实现个性化的用户交互体验。该产品通过记忆检索和记忆整合等操作,使得机器人能够理解并记住用户的习惯和偏好,为用户提供更加个性化和连贯的对话体验。MemoryScope支持多种模型API,包括openai和dashscope,并且可以与现有的代理框架如AutoGen和AgentScope结合使用,提供了丰富的定制化和扩展性。

聊天机器人 LLM
💻 编程
ChatCat

ChatCat

ChatCat是一个Web应用程序,旨在使用户能够无缝地创建、部署和管理AI驱动的聊天机器人。这些聊天机器人经过训练,能够从用户提供的URL中提取内容,并能够提供实时、上下文感知的响应。该应用程序利用Together API提供高级AI功能,确保高质量的交互体验。

AI 聊天机器人
💻 编程
LLaMA Assistant for Mac

LLaMA Assistant for Mac

LLaMA Assistant for Mac是一个基于llama-cpp-python库开发的桌面客户端,旨在通过预定义需求为用户提供帮助。它采用了大量来自其他项目的代码,但用llama-cpp-python替代了ollama部分,以实现更符合Python编程风格的解决方案。

自动化 助手
💻 编程
Meta-Llama-3.1-405B-Instruct

Meta-Llama-3.1-405B-Instruct

Meta Llama 3.1是一系列多语言的大型预训练和指令调整的生成模型,包含8B、70B和405B大小的版本。这些模型专为多语言对话用例而优化,并在常见行业基准测试中表现优于许多开源和闭源聊天模型。模型使用优化的transformer架构,并通过监督式微调(SFT)和强化学习与人类反馈(RLHF)进行调整,以符合人类对有用性和安全性的偏好。

多语言支持 大型语言模型
💻 编程
Meta-Llama-3.1-8B-Instruct

Meta-Llama-3.1-8B-Instruct

Meta Llama 3.1是一系列预训练和指令调整的多语言大型语言模型(LLMs),支持8种语言,专为对话使用案例优化,并通过监督式微调(SFT)和人类反馈的强化学习(RLHF)来提高安全性和有用性。

多语言支持 语言模型
💻 编程
Typebot.io

Typebot.io

Typebot是一个开源的聊天机器人构建器,允许用户通过可视化方式创建高级聊天机器人,嵌入到任何web/mobile应用中,并实时收集结果。它提供了34多种构建块,如文本、图片、视频、音频、条件分支、逻辑脚本等,支持多种集成方式,如Webhook、OpenAI、Google Sheets等。Typebot支持自定义主题,以匹配品牌身份,并提供深度分析功能,帮助用户洞察聊天机器人的表现。

聊天机器人 自托管
💻 编程
Enchanted

Enchanted

Enchanted是一个开源的、兼容Ollama的macOS/iOS/visionOS应用,它允许用户与私有自托管的语言模型如Llama 2、Mistral、Vicuna等进行对话。它基本上是一个连接到私有模型的ChatGPT应用界面。Enchanted的目标是提供一个产品,允许在iOS生态系统(macOS、iOS、Watch、Vision Pro)的所有设备上提供无过滤、安全、私密和多模态的体验。

语言模型 多模态
💻 编程
TalkWithGemini

TalkWithGemini

TalkWithGemini 是一款支持一键免费部署的跨平台应用,用户可以通过这个应用与 Gemini 模型进行交互,支持图片识别、语音对话等多模态交互方式,提高工作效率。

多模态 跨平台
💻 编程
GLM-4V-9B

GLM-4V-9B

GLM-4V-9B是智谱AI推出的新一代预训练模型,支持1120*1120高分辨率下的中英双语多轮对话,以及视觉理解能力。在多模态评测中,GLM-4V-9B展现出超越GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max和Claude 3 Opus的卓越性能。

多模态 预训练模型
💻 编程
GPT Computer Assistant

GPT Computer Assistant

gpt-computer-assistant是一个为Windows、macOS和Ubuntu操作系统设计的应用程序,旨在提供一个替代的ChatGPT应用。它允许用户通过Python库轻松安装,并计划提供原生安装脚本(.exe)。该产品由Upsonic Tiger支持,是一个为大型语言模型(LLM)代理提供功能中心的平台。产品的主要优点包括跨平台兼容性、易于安装和使用,以及未来将支持本地模型。

openai chatgpt
💻 编程
GLM-4-9B-Chat

GLM-4-9B-Chat

GLM-4-9B-Chat是智谱AI推出的新一代预训练模型GLM-4系列中的开源版本,具备多轮对话、网页浏览、代码执行、自定义工具调用和长文本推理等高级功能。支持包括日语、韩语、德语在内的26种语言,并且推出了支持1M上下文长度的模型。

多语言支持 预训练模型
💻 编程
CogVLM2

CogVLM2

CogVLM2是由清华大学团队开发的第二代多模态预训练对话模型,它在多个基准测试中取得了显著的改进,支持8K内容长度和1344*1344的图像分辨率。CogVLM2系列模型提供了支持中文和英文的开源版本,能够与一些非开源模型相媲美的性能。

多模态 预训练模型
💻 编程