-->
共找到 5 个AI工具
点击任意工具查看详细信息
本产品是一种自奖励语言模型,通过 LLM 作为裁判,使用模型自身提供的奖励信号进行训练。通过迭代的 DPO 训练,模型不仅可以提高遵循指令的能力,还能提供高质量的自我奖励。经过三次迭代的 Fine-tuning,本产品在 AlpacaEval 2.0 排行榜上超过了许多现有系统,包括 Claude 2、Gemini Pro 和 GPT-4 0613。这项工作虽然只是初步研究,但为模型在两个方面持续改进的可能性打开了大门。
Beagle14-7B 是一个强大的中文语言模型,可以用于各种自然语言处理任务。它基于多个预训练模型进行了合并,包含丰富的语言知识和表达能力。Beagle14-7B 具有高效的文本生成能力和准确的语义理解能力,可以广泛应用于聊天机器人、文本生成、摘要提取等任务。Beagle14-7B 的定价信息请访问官方网址了解详情。
Lemur是一个开放的语言模型,旨在为语言代理提供优化的自然语言和编码能力。它平衡了自然语言和编码技能,使代理能够遵循指令、推理任务并采取实际行动。Lemur结合了自然语言和编码的优势,通过两阶段训练产生了在不同语言和编码基准上的最先进性能,超过了其他可用的开源模型,并缩小了开源模型和商业模型在代理能力上的差距。
StreamingLLM是一种高效的语言模型,能够处理无限长度的输入,而不会牺牲效率和性能。它通过保留最近的令牌和注意力池,丢弃中间令牌,从而使模型能够从最近的令牌生成连贯的文本,而无需缓存重置。StreamingLLM的优势在于能够在不需要刷新缓存的情况下,从最近的对话中生成响应,而不需要依赖过去的数据。
LongLLaMA 是一个大型语言模型,能够处理长篇文本。它基于 OpenLLaMA,并使用 Focused Transformer (FoT) 方法进行了微调。它能够处理长达 256k 标记甚至更多的文本。我们提供了一个较小的 3B 基础模型(未经过指令调整),并在 Hugging Face 上提供了支持更长上下文的推断代码。我们的模型权重可以作为现有实现中 LLaMA 的替代品(适用于最多 2048 个标记的短上下文)。此外,我们还提供了评估结果和与原始 OpenLLaMA 模型的比较。
探索 自然语言处理 分类下的其他子分类
12 个工具
2 个工具
1 个工具
AI语言模型 是 自然语言处理 分类下的热门子分类,包含 5 个优质AI工具