-->
共找到 47 个AI工具
点击任意工具查看详细信息
Swarm是由OpenAI Solutions团队管理的实验性框架,旨在构建、编排和部署多智能体系统。它通过定义智能体(Agent)和交接(handoffs)的抽象概念,实现了智能体之间的协调和执行。Swarm框架强调轻量级、高可控性和易于测试,适用于需要大量独立功能和指令的场景,允许开发者拥有完全的透明度和对上下文、步骤和工具调用的细粒度控制。Swarm框架目前处于实验阶段,不推荐在生产环境中使用。
LiveKit Agents 是一个端到端框架,它使开发者能够构建能够通过语音、视频和数据通道与用户互动的智能多模态语音助手(AI代理)。它通过集成OpenAI的实时API和LiveKit的WebRTC基础设施,提供了创建语音助手的快速入门指南,包括语音识别(STT)、语言模型(LLM)和文本转语音(TTS)的流水线。此外,它还支持创建语音到语音代理、接听和响应来电、以及代表用户拨打电话的功能。
curiosity是一个基于ReAct框架的聊天机器人项目,旨在通过LangGraph和FastHTML技术栈探索和构建类似Perplexity的用户交互体验。项目核心是一个简单的ReAct代理,使用Tavily搜索增强文本生成。支持三种不同的LLMs(大型语言模型),包括OpenAI的gpt-4o-mini、Groq的llama3-groq-8b-8192-tool-use-preview以及Ollama的llama3.1。项目通过FastHTML构建前端,尽管在调试过程中可能遇到一些挑战,但整体上提供了快速的用户体验。
RD-Agent是微软亚洲研究院推出的一款自动化研究与开发工具,依托大语言模型的强大能力,开创了以人工智能驱动R&D流程自动化的新模式。它通过整合数据驱动的R&D系统,可以借助人工智能能力驱动创新与开发的自动化,不仅提高了研发效率,还利用智能化的决策和反馈机制,为未来的跨领域创新与知识迁移提供了无限可能。
Sentient 是一个框架/SDK,允许开发者在3行代码内构建能够控制浏览器的智能代理。它利用最新的人工智能技术,通过简单的代码即可实现复杂的网络交互和自动化任务。Sentient 支持多种AI模型,包括OpenAI、Together AI等,能够根据用户的具体需求提供定制化的解决方案。
muAgent是一个创新的Agent框架,由知识图谱引擎驱动,支持多Agent编排和协同技术。它利用LLM+EKG(Eventic Knowledge Graph 行业知识承载)技术,结合FunctionCall、CodeInterpreter等,通过画布式拖拽和轻文字编写,实现复杂SOP流程的自动化。muAgent兼容市面上各类Agent框架,具备复杂推理、在线协同、人工交互、知识即用等核心功能。该框架已在蚂蚁集团多个复杂DevOps场景中得到验证。
GenAgent是一个框架,它通过创建工作流来构建协作AI系统,并将这些工作流转换为代码,以便大型语言模型(LLM)代理更好地理解。GenAgent能够从人类设计的工作中学习并创造新的工作流,生成的工作流可以被解释为协作系统,以完成复杂任务。
Open-LLM-VTuber 是一个开源项目,旨在通过语音与大型语言模型(LLM)进行交互,具有实时的Live2D面部捕捉和跨平台的长期记忆功能。该项目支持macOS、Windows和Linux平台,允许用户选择不同的语音识别和语音合成后端,以及自定义的长期记忆解决方案。它特别适合希望在不同平台上实现与AI进行自然语言对话的开发者和爱好者。
multi-agent-concierge是一个多代理礼宾系统,它通过多个专门的代理来完成复杂的任务,并通过一个“礼宾”代理来引导用户到正确的代理。这种系统设计用于处理具有相互依赖关系的多个任务,使用数百种工具。该系统展示了如何通过自然语言指令创建代理之间的隐式“链”,并通过“延续”代理来管理这些链,同时使用全局状态来跟踪用户及其当前状态。
agent-service-toolkit是一个用于运行基于LangGraph的AI代理服务的完整工具包,包括LangGraph代理、FastAPI服务、客户端以及Streamlit应用程序,提供了从代理定义到用户界面的完整设置。它利用了LangGraph框架的高度控制能力和丰富的生态系统,支持并发执行、图循环、流式结果等高级功能。
AgentK是一个自进化的模块化自代理通用人工智能(AGI)模型,由多个合作的代理组成,能够根据用户的需求构建新的代理来完成任务。它基于LangGraph和LangChain框架构建,具有自我测试和修复的能力,旨在成为最小化的代理和工具集合,以便自我引导并发展自身的智能。
这是一个开源项目,用于实现人形机器人Unitree H1_2的遥控操作。它利用了Apple Vision Pro技术,允许用户通过虚拟现实环境来控制机器人。该项目在Ubuntu 20.04和Ubuntu 22.04上进行了测试,并且提供了详细的安装和配置指南。该技术的主要优点包括能够提供沉浸式的遥控体验,并且支持在模拟环境中进行测试,为机器人遥控领域提供了新的解决方案。
RedCache-AI是一个为大型语言模型和代理设计的动态记忆框架,它允许开发者构建从AI驱动的约会应用到医疗诊断平台等广泛的应用。它解决了现有解决方案昂贵、封闭源代码或缺乏对外部依赖的广泛支持的问题。
Memary是一个开源的记忆层,专为自主智能体设计,通过模仿人类记忆的方式,提升智能体的推理和学习能力。它使用Neo4j图数据库存储知识,并结合了Llama Index和Perplexity模型来增强知识图谱的查询能力。Memary的主要优点包括自动生成记忆、记忆模块、系统改进和回溯记忆等功能,旨在以最小的开发者实现与现有智能体集成,并通过仪表盘提供记忆分析和系统改进的可视化数据。
Agent Zero是一个高度透明、可读、可理解、可定制和交互式的个人AI框架。它不是为特定任务预编程的,而是设计为通用的个人助手,能够执行命令和代码,与其他代理实例合作,并尽其所能完成任务。它具备持久记忆,能够记住以前的解决方案、代码、事实、指令等,以便在未来更快、更可靠地解决任务。Agent Zero使用操作系统作为工具来完成任务,没有预编程的单一用途工具。相反,它可以编写自己的代码,并使用终端根据需要创建和使用自己的工具。
aiwaves-cn/agents 是一个开源框架,专注于数据驱动的自适应语言代理。它提供了一种系统化框架,通过符号学习训练语言代理,灵感来源于用于训练神经网络的连接主义学习过程。该框架实现了反向传播和基于梯度的权重更新,使用基于语言的损失、梯度和权重,支持多代理系统的优化。
Llama-agentic-system是一个基于Llama 3.1模型的系统级代理组件,它能够执行多步骤推理和使用内置工具,如搜索引擎或代码解释器。该系统还强调了安全性评估,通过Llama Guard进行输入和输出过滤,以确保在不同使用场景下的安全需求得到满足。
Composio是一个为AI代理提供高质量工具和集成的平台,它简化了代理的认证、准确性和可靠性问题,使得开发者能够通过一行代码集成多种工具和框架。它支持100多种工具,覆盖了GitHub、Notion、Linear等90多个平台,提供了包括软件操作、操作系统交互、浏览器功能、搜索、软件开发环境(SWE)以及即席代理数据(RAG)等多种功能。Composio还支持六种不同的认证协议,能够显著提高代理调用工具的准确性。此外,Composio可以作为后端服务嵌入到应用程序中,为所有用户和代理管理认证和集成,保持一致的体验。
AgentScope是一个创新的多智能体平台,旨在赋能开发者使用大规模模型构建多智能体应用。它具有易于使用、高鲁棒性和基于Actor的分布式特性,支持自定义容错控制和重试机制,以增强应用稳定性。
IoAI (Internet of Agents)是一个智能代理互联框架,旨在通过高度模块化的设计,实现不同智能代理之间的自动化协作。它允许开发者快速集成第三方智能代理,并通过统一的接口进行任务分配和执行。IoA的核心优势在于其灵活性和可扩展性,支持多种应用场景,包括但不限于协作论文写作、基准测试和开放指令数据集。
AutoGPT是一个强大的工具,它允许用户创建和运行智能代理,这些代理可以自动执行各种任务,使生活更轻松。AutoGPT的目标是提供工具,让用户专注于重要的事情。它通过构建和使用AI代理,推动了AI创新的前沿。
Enchanted是一个开源的、兼容Ollama的macOS/iOS/visionOS应用,它允许用户与私有自托管的语言模型如Llama 2、Mistral、Vicuna等进行对话。它基本上是一个连接到私有模型的ChatGPT应用界面。Enchanted的目标是提供一个产品,允许在iOS生态系统(macOS、iOS、Watch、Vision Pro)的所有设备上提供无过滤、安全、私密和多模态的体验。
OmAgent是一个复杂的多模态智能代理系统,致力于利用多模态大型语言模型和其他多模态算法来完成引人入胜的任务。该项目包括一个轻量级的智能代理框架omagent_core,精心设计以应对多模态挑战。OmAgent由三个核心组件构成:Video2RAG、DnCLoop和Rewinder Tool,分别负责长视频理解、复杂问题分解和信息回溯。
xLAM是一个由Salesforce AI Research团队开发的基于大型语言模型(Large Language Models, LLMs)的智能代理研究项目。它通过聚合来自不同环境的智能代理轨迹,标准化并统一这些轨迹到一致的格式,以创建一个优化的通用数据加载器,专门用于智能代理的训练。xLAM-v0.1-r是此模型系列的0.1版本,专为研究目的设计,与VLLM和FastChat平台兼容。
llama-agents 是一个异步优先的框架,用于构建、迭代和生产化多智能体系统,包括多智能体通信、分布式工具执行、人工在环等。每个智能体被视为一个服务,不断处理传入的任务。智能体从消息队列中拉取和发布消息。系统顶部是控制平面,它跟踪正在进行的任务,网络中的服务,并决定哪个服务应该处理任务的下一步。
Agent-E 是一个基于 AutoGen 代理框架的系统,旨在自动化用户计算机上的操作,目前专注于浏览器内的自动化。它通过自然语言与网页浏览器交互,执行填写表单、搜索和排序电商产品、定位网站内容、管理播放设置、执行网络搜索、管理项目管理平台任务等操作。Agent-E 正在成长中,已经能够处理多样化的任务,但最佳任务是用户自行发掘的。
OpenAgents是一个开放平台,旨在使用户和开发者能够在日常生活中使用和托管语言代理。该平台已经实现了三种代理:数据分析的Data Agent、集成200+日常工具的Plugins Agent和自动网页浏览的Web Agent。OpenAgents通过优化的Web UI使普通用户能够与代理功能进行交互,同时为开发者和研究人员提供在本地设置上的无缝部署体验,为创新语言代理的构建和现实世界评估提供了基础。
Nerve是一个可以创建具有状态的代理的LLM工具,用户无需编写代码即可定义和执行复杂任务。它通过动态更新系统提示和在多个推理过程中保持状态,使代理能够规划和逐步执行完成任务所需的操作。Nerve支持任何通过ollama、groq或OpenAI API可访问的模型,具有高度的灵活性和效率,同时注重内存安全。
Agent Mode是Warp AI的一个特性,它允许用户使用自然语言在终端中完成多步骤工作流程。它能够识别和解释自然语言指令,提供环境特定的指导,并引导用户完成多步骤任务。Agent Mode利用OpenAI的API,但不会存储或保留用户的输入或输出数据。
agentUniverse 是一个基于大型语言模型的多智能体应用开发框架,提供了构建单一智能体和多智能体协作机制的所有必需组件。通过模式工厂,允许开发者构建和自定义多智能体协作模式,轻松构建多智能体应用,并分享不同技术与业务领域的模式实践。
TalkWithGemini 是一款支持一键免费部署的跨平台应用,用户可以通过这个应用与 Gemini 模型进行交互,支持图片识别、语音对话等多模态交互方式,提高工作效率。
Mentals AI是一个工具,旨在通过简单的Markdown语法创建和操作具有循环、记忆和各种工具的代理。它允许用户专注于代理的逻辑,而无需编写Python或其他语言的底层代码,从而重新定义了未来AI应用的基础框架。
gpt-computer-assistant是一个为Windows、macOS和Ubuntu操作系统设计的应用程序,旨在提供一个替代的ChatGPT应用。它允许用户通过Python库轻松安装,并计划提供原生安装脚本(.exe)。该产品由Upsonic Tiger支持,是一个为大型语言模型(LLM)代理提供功能中心的平台。产品的主要优点包括跨平台兼容性、易于安装和使用,以及未来将支持本地模型。
ModelScope-Agent是一个可定制且可扩展的代理框架,具备角色扮演、大型语言模型调用、工具使用、规划和记忆等能力。它简化了代理应用的实现过程,提供了丰富的模型和工具接口,统一的接口和高可扩展性,低耦合性,使得开发者可以轻松使用内置工具、LLM、记忆等组件,而无需绑定更高层次的代理。
AutoGroq是一个AI驱动的对话助手,旨在通过自动生成专家代理来彻底改变用户与AI工具的互动方式。它克服了现有解决方案的局限性,提供了一个用户友好、强大且无需配置的体验。该平台专注于通过自动生成专门针对任何问题的专家代理,无论问题的复杂性如何,提供即时和相关的帮助。
WebLlama是一个基于Meta Llama 3构建的代理,专门为网页导航和对话进行了微调。它旨在构建有效的以人为中心的代理,帮助用户浏览网页,而不是取代用户。该模型在WebLINX基准测试中超越了GPT-4V(零样本)18%,展示了其在网页导航任务中的卓越性能。
AgentStudio是一个开源工具套件,覆盖了构建通用虚拟助手的整个生命周期。它提供了环境实现、基准测试套件、数据收集管道和图形界面,促进通用虚拟助手未来研究的发展。AgentStudio提供了与人类与计算机交互一致的统一观测和行动空间,允许在任何人类执行的任务上评估智能体和收集数据。这一特性极大扩展了潜在任务空间。因此,AgentStudio可以促进开发和评测能够跨越各种真实世界用例的智能体。
Skyvern是一个自动化工具,它结合了大型语言模型(LLMs)和计算机视觉技术,用于自动化基于浏览器的工作流程。它提供了一个简单的API端点,可以完全自动化手动工作流程,替代易碎或不可靠的自动化解决方案。
Cradle框架旨在使基础模型能够通过与人类相同的通用接口(屏幕作为输入,键盘和鼠标操作作为输出)执行复杂的计算机任务。该框架在Red Dead Redemption II游戏中进行了案例研究,展示了其在复杂环境中的泛化和适应能力。
NavAIGuide是一个可扩展的多模态智能框架,通过访问移动和桌面生态系统中的应用程序,实现计划和用户查询。具有视觉任务检测、高级代码选择器、面向动作的执行和鲁棒的错误处理等功能。定位于为用户提供高效的自动化解决方案。
AIlice是一个轻量级的AI代理,旨在创建一个类似于JARVIS的自包含人工智能助手。它通过构建一个以大型语言模型(LLM)为核心的“文本计算机”来实现这一目标。AIlice在主题研究、编码、系统管理、文献综述以及超越这些基本能力的复杂混合任务方面表现出色。AIlice利用GPT-4在日常生活中的任务中达到了近乎完美的性能,并正在利用最新的开源模型迈向实际应用。
coze-discord-proxy是一个代理discord机器人的插件,它可以通过API接口调用被coze托管的discord机器人,实现与chatGPT等AI对话。该插件支持流式对话返回、对话文生图和图生文功能,还支持创建频道/子频道/线程、指定对话频道实现隔离,并兼容openai的对话接口、GPT识图接口等,非常适合集成到NextChat、OneChat等面板中,提供强大的AI聊天能力。
AGI-Samantha是一个模拟电影《她》中Samantha的自主智能体。它具备动态语音能力,能根据上下文自主发言,与一般LLMs相比,不仅仅局限于回答和反应。它还具备实时视觉能力、外部分类记忆,能够动态地进行读写,选择最相关的信息。AGI-Samantha在每一刻都在进化,存储在记忆中的经验可以影响其后续行为,如个性、说话频率和风格等。AGI-Samantha通过一系列的LLM调用进行协调,每个调用具有不同的目的,这些模块一起工作,模拟基本的人脑工作流程。
CrewAI是一个面向开发者的开源库,可以帮助你打造和协调AI代理团队,用以解决复杂任务。它基于LangChain构建,可以无缝集成各类AI工具来赋能你的代理,让它们完成特定的工作目标。你可以像搭积木一样组合不同的代理、任务和工具,打造出适合自己需求的AI代理系统。
InsActor是一个基于物理模拟的角色控制系统。它可以通过自然语言指令驱动角色在复杂环境中完成各种交互任务。该系统利用条件与对抗扩散模型进行多级规划,并与低级控制器相结合,实现稳定、鲁棒的控制。具有控制流畅、交互自然的优势,适用于创意内容生成、互动娱乐、人机交互等应用场景。
AppAgent是一个基于LLM(大型语言模型)的多模态代理框架,设计用于操作智能手机应用。通过简化的动作空间(如点击和滑动),模仿人类般的互动方式,实现应用操作,无需系统后端访问。代理通过自主探索或观察人类演示学习新应用的使用方法,创建知识库用于执行不同应用中的复杂任务。
Suspicion-Agent是一个使用具备心智理论意识的GPT-4来玩不完美信息游戏的实现。它可以训练和评估代理程序,并提供样本输出。
探索 编程 分类下的其他子分类
768 个工具
465 个工具
368 个工具
294 个工具
140 个工具
85 个工具
66 个工具
61 个工具
AI Agents 是 编程 分类下的热门子分类,包含 47 个优质AI工具