🖼️

图像分类

多模态模型

共找到 4 个AI工具

个工具

主分类: 图像

子分类: 多模态模型

找到 4 个匹配工具

相关AI工具

点击任意工具查看详细信息

InternVL2_5-1B-MPO

InternVL2_5-1B-MPO是一个多模态大型语言模型（MLLM），它基于InternVL2.5和混合偏好优化（MPO）构建，展示了优越的整体性能。该模型集成了新增量预训练的InternViT与各种预训练的大型语言模型（LLMs），包括InternLM 2.5和Qwen 2.5，使用随机初始化的MLP投影器。InternVL2.5-MPO在模型架构上保留了与InternVL 2.5及其前身相同的“ViT-MLP-LLM”范式，并引入了对多图像和视频数据的支持。该模型在多模态任务中表现出色，能够处理包括图像描述、视觉问答等多种视觉语言任务。

自然语言处理多模态大型语言模型 +2

图像访问

InternVL2_5-2B

InternVL 2.5 是一个先进的多模态大型语言模型系列，它在InternVL 2.0的基础上，通过引入显著的训练和测试策略增强以及数据质量提升，维持了其核心模型架构。该模型整合了新增量预训练的InternViT与各种预训练的大型语言模型，例如InternLM 2.5和Qwen 2.5，使用随机初始化的MLP投影器。InternVL 2.5 支持多图像和视频数据，具备动态高分辨率训练方法，能够在处理多模态数据时提供更好的性能。

多模态大型语言模型图像-文本-文本 +2

图像访问

InternVL2_5-26B

InternVL2_5-26B是一个先进的多模态大型语言模型（MLLM），在InternVL 2.0的基础上，通过引入显著的训练和测试策略增强以及数据质量提升，进一步发展而来。该模型保持了其前身的“ViT-MLP-LLM”核心模型架构，并集成了新增量预训练的InternViT与各种预训练的大型语言模型（LLMs），例如InternLM 2.5和Qwen 2.5，使用随机初始化的MLP投影器。InternVL 2.5系列模型在多模态任务中展现出卓越的性能，尤其在视觉感知和多模态能力方面。

多模态大型语言模型预训练模型 +2

图像访问

InternVL2_5-78B

InternVL 2.5是一系列先进的多模态大型语言模型（MLLM），在InternVL 2.0的基础上，通过引入显著的训练和测试策略增强以及数据质量提升，进一步发展而来。该模型系列在视觉感知和多模态能力方面进行了优化，支持包括图像、文本到文本的转换在内的多种功能，适用于需要处理视觉和语言信息的复杂任务。

机器学习多模态大型语言模型 +2

图像访问

探索更多图像工具

多模态模型是图像分类下的热门子分类，包含 4 个优质AI工具

浏览图像分类分类

多模态模型

相关AI工具

InternVL2_5-1B-MPO

InternVL2_5-2B

InternVL2_5-26B

InternVL2_5-78B

相关子分类

AI设计工具

图片生成

AI图像生成

图片编辑

AI模型

AI图像编辑

开发与工具

平面设计

探索更多图像工具

多模态模型

相关AI工具

InternVL2_5-1B-MPO

InternVL2_5-2B

InternVL2_5-26B

InternVL2_5-78B

相关子分类

AI设计工具

图片生成

AI图像生成

图片编辑

AI模型

AI图像编辑

开发与工具

平面设计

探索更多 图像 工具

探索更多图像工具