-->
Gemini是谷歌DeepMind推出的新一代人工智能系统。它能够进行多模态推理,支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域都超越了之前的状态,成为迄今为止最强大的AI系统之一。它有三个不同规模的版本,可满足从边缘计算到云计算的各种需求。Gemini可以广泛应用于创意设计、写作辅助、问题解答、代码生成等领域。
谷歌多模态AI模型Gemini,支持文本和图像的组合推理
通过文本和图像提示Gemini玩石头剪刀布游戏
让Gemini根据绘画描述生成音乐搜索查询
用图像序列提示Gemini猜电影名称
发现更多类似的优质AI工具
SpatialVLM是一个由谷歌DeepMind开发的视觉语言模型,能够对空间关系进行理解和推理。它通过大规模合成数据的训练,获得了像人类一样直观地进行定量空间推理的能力。这不仅提高了其在空间VQA任务上的表现,还为链式空间推理和机器人控制等下游任务打开了新的可能。
商汤日日新是一款大模型综合能力平台,提供对话生成、模型微调、知识库构建等功能。商汤日日新具备高质量、多规格、超实时、强扩展、高安全、速融合等特点,适用于办公、教育、文娱、汽车、金融、医疗等多个领域。其模型体系赋能产业升级,多模态能力组合引领产业实现全新突破。