-->
共找到 5 个AI工具
点击任意工具查看详细信息
MouSi是一种多模态视觉语言模型,旨在解决当前大型视觉语言模型(VLMs)面临的挑战。它采用集成专家技术,将个体视觉编码器的能力进行协同,包括图像文本匹配、OCR、图像分割等。该模型引入融合网络来统一处理来自不同视觉专家的输出,并在图像编码器和预训练LLMs之间弥合差距。此外,MouSi还探索了不同的位置编码方案,以有效解决位置编码浪费和长度限制的问题。实验结果表明,具有多个专家的VLMs表现出比孤立的视觉编码器更出色的性能,并随着整合更多专家而获得显著的性能提升。
智谱AI在首届技术开放日上发布了GLM-4和CogView3。GLM-4性能全面提升近60%,支持更长的上下文、更强的多模态支持和更快速的推理。CogView3逼近DALL·E 3的多模态生成能力。产品定位为下一代基座大模型和图像生成AI。
Diffusion Bee 是在 Intel/M1 Mac 上本地运行稳定的 Diffusion 模型的最简单方式,提供一键安装程序,无需依赖或技术知识。 Diffusion Bee 在您的计算机上本地运行,不会将任何数据发送到云端(除非您选择上传图像)。 主要功能: - 图像转换 - 图像修复 - 图像生成历史记录 - 图像放大 - 多种图像尺寸 - 针对 M1/M2 芯片进行优化 - 支持负向提示和高级提示选项 - 控制网络 Diffusion Bee 是基于 Stable Diffusion 的 GUI 封装,所以所有 Stable Diffusion 的条款适用于输出结果。 欲了解更多信息,请访问文档。 系统要求: - 配有 Intel 或 M1/M2 芯片的 Mac - 对于 Intel 芯片:MacOS 12.3.1 或更高版本 - 对于 M1/M2 芯片:MacOS 11.0.0 或更高版本 许可证:Stable Diffusion 发布在 CreativeML OpenRAIL M 许可下。
FABRIC 是一个通过迭代反馈来个性化定制扩散模型的工具。它提供了一种简单的方法来根据用户的反馈来改进模型的性能。用户可以通过迭代的方式与模型进行交互,并通过反馈来调整模型的预测结果。FABRIC 还提供了丰富的功能,包括模型训练、参数调整和性能评估。它的定价根据用户的使用情况而定,可满足不同用户的需求。
伪灵活基础模型(ptx0/pseudo-flex-base)是基于 Diffusion 技术的文本到图像生成模型。它通过将文本描述转换为逼真的图像,提供了灵活的图像生成能力。该模型可以根据给定的文本提示生成与文本描述相符合的图像,具有高度的灵活性和生成效果。该模型还具有稳定的性能和可靠的训练基础,可以广泛应用于人工智能领域的图像生成任务。
探索 人工智能 分类下的其他子分类
36 个工具
17 个工具
12 个工具
10 个工具
8 个工具
7 个工具
AI图像生成 是 人工智能 分类下的热门子分类,包含 5 个优质AI工具