-->
共找到 1 个AI工具
点击任意工具查看详细信息
SpatialVLM是一个由谷歌DeepMind开发的视觉语言模型,能够对空间关系进行理解和推理。它通过大规模合成数据的训练,获得了像人类一样直观地进行定量空间推理的能力。这不仅提高了其在空间VQA任务上的表现,还为链式空间推理和机器人控制等下游任务打开了新的可能。
探索 AI 分类下的其他子分类
3 个工具
1 个工具
AI图像检测识别 是 AI 分类下的热门子分类,包含 1 个优质AI工具