-->
共找到 9 个AI工具
点击任意工具查看详细信息
Magnifier Lens Effect 是一个JavaScript库,允许用户为任何图片添加放大镜效果,并通过滚动鼠标滚轮来调整放大倍数。该库易于集成和自定义,适用于需要图像细节展示的网页。
Scenic 是一个专注于基于注意力模型的计算机视觉研究的代码库,提供优化训练和评估循环、基线模型等功能,适用于图像、视频、音频等多模态数据。提供 SOTA 模型和基线,支持快速原型设计,价格免费。
Blenny是一款基于GPT-4V的AI视觉辅助插件。它可以在浏览器中添加AI视觉功能,帮助用户从网页的任何部分分析信息。通过截图屏幕区域,可以进行快速操作,如即时摘要、翻译、访问网页等。用户可以自定义和构建自己的AI代理,根据需求进行多种用例的操作。
Stable Diffusion WebUI Forge基于Stable Diffusion WebUI和Gradio开发,旨在优化资源管理、加速推理。相比原版WebUI在1024px分辨率下的SDXL推理,Forge可提升30-75%的速度,最大分辨率提升2-3倍,最大batch size提升4-6倍。Forge保持了原版WebUI的所有功能,同时新增了DDPM、DPM++、LCM等采样器,实现了Free U、SVD、Zero123等算法。使用Forge的UNet Patcher,开发者可以用极少的代码实现算法。Forge还优化了控制网络的使用,实现真正的零内存占用调用。
En3D是一个提供先进自然语言处理模型的平台。他们提供了各种各样的模型和数据集,以帮助开发者构建和部署自然语言处理应用。En3D平台的优势在于提供了大量预训练模型和方便的部署工具,使得开发者能够快速、高效地构建自然语言处理应用。
OneLLM是一个旨在统一所有语言模态的框架。它提供了预览模型,并允许本地演示。该框架的功能包括模型安装、模型预览和本地演示。OneLLM的优势在于能够统一不同的模态,如图像和文本,以及语音和文本。该框架的定位是为了简化多模态任务的处理。
RT-Trajectory 是一种基于粗糙轨迹草图的机器人控制策略,通过轨迹草图实现对新任务的有效泛化能力。它既可以通过人工绘制、视频演示等方式生成轨迹草图,也可以通过图像生成模型等方式生成轨迹草图。RT-Trajectory 在各种真实世界机器人任务中得到了广泛评估,相比于基于语言和目标的策略,具有更广泛的任务执行能力。
Video Language Planning(VLP)是一种算法,通过训练视觉语言模型和文本到视频模型,实现了对复杂长期任务的视觉规划。VLP接受长期任务指令和当前图像观察作为输入,并输出一个详细的多模态(视频和语言)规划,描述如何完成最终任务。VLP能够在不同的机器人领域中合成长期视频规划,从多物体重新排列到多摄像头双臂灵巧操作。生成的视频规划可以通过目标条件策略转化为真实机器人动作。实验证明,与之前的方法相比,VLP显著提高了长期任务的成功率。
Adobe Sensei是一款基于人工智能和机器学习的产品,帮助用户设计和交付完美的客户体验,提供数据分析、个性化营销、创意设计、广告优化和文档处理等功能,以实现更好的业务结果。Adobe Sensei可以帮助用户轻松创建、做出明智决策和针对性营销,提高生产力和效率。"
探索 图像 分类下的其他子分类
832 个工具
771 个工具
543 个工具
522 个工具
352 个工具
196 个工具
95 个工具
68 个工具
AI开发助手 是 图像 分类下的热门子分类,包含 9 个优质AI工具