-->
共找到 4 个AI工具
点击任意工具查看详细信息
SpatialLM 是一个专为处理 3D 点云数据设计的大型语言模型,能够生成结构化的 3D 场景理解输出,包括建筑元素和对象的语义类别。它能够从单目视频序列、RGBD 图像和 LiDAR 传感器等多种来源处理点云数据,无需专用设备。SpatialLM 在自主导航和复杂 3D 场景分析任务中具有重要应用价值,显著提升空间推理能力。
这是一个由斯坦福大学研究团队开发的多模态语言模型框架,旨在统一3D人体动作中的言语和非言语语言。该模型能够理解并生成包含文本、语音和动作的多模态数据,对于创建能够自然交流的虚拟角色至关重要,广泛应用于游戏、电影和虚拟现实等领域。该模型的主要优点包括灵活性高、训练数据需求少,并且能够解锁如可编辑手势生成和从动作中预测情感等新任务。
Genie 2是由Google DeepMind开发的一款大规模基础世界模型,能够基于单一提示图像生成无尽的、可操作的、可玩的3D环境,用于训练和评估具身智能体。Genie 2代表了深度学习和人工智能领域的一大进步,它通过模拟虚拟世界及其行动后果,展示了在大规模生成模型中的多种紧急能力,如物体交互、复杂角色动画、物理模拟等。Genie 2的研究推动了新的创意工作流程,用于原型化交互体验,并为未来更通用的AI系统和智能体的研究提供了新的可能性。
WonderJourney 是一个模块化的场景生成框架,通过用户提供的位置信息,可以生成一系列多样且相互连贯的 3D 场景,形成想象中的 “奇妙之旅”。通过利用语言模型生成场景的文本描述,使用文本驱动的点云生成流程生成连贯的 3D 场景,通过大规模验证模型对生成的场景进行验证。WonderJourney 展示了多样的视觉效果,包括各种类型和风格的场景。
探索 其他 分类下的其他子分类
195 个工具
178 个工具
113 个工具
102 个工具
62 个工具
61 个工具
49 个工具
45 个工具
3D建模 是 其他 分类下的热门子分类,包含 4 个优质AI工具