搜索结果

找到 1,000 条结果
·
用时 0.225 秒
·
关键词: "图片生成"
Sana_1600M_1024px
匹配度 4

Sana_1600M_1024px

Sana是一个由NVIDIA开发的文本到图像生成框架,能够高效生成高达4096×4096分辨率的高清晰度、高文本-图像一致性的图像,并且速度极快,可以在笔记本电脑GPU上部署。Sana模型基于线性扩散变换器,使用预训练的文本编码器和空间压缩的潜在特征编码器。该技术的重要性在于其能够快速生成高质量的图像,对于艺术创作、设计和其他创意领域具有革命性的影响。Sana模型遵循CC BY-NC-SA 4.0许可协议,源代码可在GitHub上找到。

开源文本到图像高分辨率 +3
🖼️ 图像
Sana_1600M_512px
匹配度 4

Sana_1600M_512px

Sana是一个由NVIDIA开发的文本到图像的生成框架,能够高效生成高达4096×4096分辨率的图像。Sana以其快速的速度、强大的文本图像对齐能力以及可在笔记本电脑GPU上部署的特性而著称。该模型基于线性扩散变换器,使用预训练的文本编码器和空间压缩的潜在特征编码器,代表了文本到图像生成技术的最新进展。Sana的主要优点包括高分辨率图像生成、快速合成、笔记本电脑GPU上的可部署性,以及开源的代码,使其在研究和实际应用中具有重要价值。

开源文本到图像高分辨率 +2
🖼️ 图像
Pileometer
匹配度 4

Pileometer

Pileometer是一个应用程序,旨在帮助用户将他们阁楼中的砖堆转化为美丽的设计作品。它通过提供设计灵感和指导,让用户能够将普通的砖块变成具有艺术感的装饰品或实用物品。这个应用的重要性在于它能够激发用户的创造力,同时为旧物利用提供了新的途径。Pileometer的背景信息显示,它是一个跨平台的应用,可以在App Store和Google Play上下载,这意味着它具有广泛的用户基础和市场潜力。目前,关于价格的具体信息在提供的页面中没有提及,因此无法确定是免费还是付费。

艺术创作家居装饰DIY +1
🎨 设计 pileometer.app
AI Share Card
匹配度 4

AI Share Card

AI Share Card是一款利用人工智能技术帮助用户将网页内容一键转换为精美分享卡片的插件工具。它全面适配主流图文、视频平台和电商详情页、产品官网等场景,通过AI自动生成推荐文案,简化分享流程,提升内容的传播效率。产品依托GLM提供的免费AI API,基础功能完全免费,适合需要快速分享网页内容的用户。

AI内容创作插件 +2
💼 生产力
Hailuo I2V-01-Live
匹配度 4

Hailuo I2V-01-Live

Hailuo I2V-01-Live是I2V系列的最新成员,旨在彻底改变2D插图的呈现方式。该模型支持广泛的艺术风格,通过增强的平滑度和生动的动作,让您的角色以前所未有的方式移动、说话和发光。它针对稳定性和微妙表达进行了优化,使您能够扩展创意表达,并以无与伦比的流畅性和精细度将您的艺术带入生活。

艺术创作动画创意表达 +2
🖼️ 图像
Luma Photon
匹配度 4

Luma Photon

Luma Photon 是一个创新的图像生成模型,以其高度创造性、智能化和个性化而著称。它建立在一个新的突破性架构之上,能够提供超高画质的图像,并且成本效率提高了10倍。Luma Photon 在大规模双盲评估中超越了市场上的所有模型,无论是在质量、创造力还是理解力方面都表现出色,同时在效率上也有了革命性的提升。

AI图像生成创意工具 +2
🖼️ 图像
MV-Adapter
匹配度 4

MV-Adapter

MV-Adapter是一种基于适配器的多视图图像生成解决方案,它能够在不改变原有网络结构或特征空间的前提下,增强预训练的文本到图像(T2I)模型及其衍生模型。通过更新更少的参数,MV-Adapter实现了高效的训练并保留了预训练模型中嵌入的先验知识,降低了过拟合风险。该技术通过创新的设计,如复制的自注意力层和并行注意力架构,使得适配器能够继承预训练模型的强大先验,以建模新的3D知识。此外,MV-Adapter还提供了统一的条件编码器,无缝整合相机参数和几何信息,支持基于文本和图像的3D生成以及纹理映射等应用。MV-Adapter在Stable Diffusion XL(SDXL)上实现了768分辨率的多视图生成,并展示了其适应性和多功能性,能够扩展到任意视图生成,开启更广泛的应用可能性。

图像生成文本到图像适配器 +3
🖼️ 图像
BooW-VTON
匹配度 4

BooW-VTON

BooW-VTON是一个专注于提升户外虚拟试穿效果的研究项目,通过无需掩码的伪数据训练来增强虚拟试穿技术。该技术的重要性在于它能够改善在自然环境下服装试穿的真实感和准确性,对于时尚电商和虚拟现实领域具有重要意义。产品背景信息显示,该项目是基于深度学习技术的图像生成模型,旨在解决传统虚拟试穿中服装与人体融合不自然的问题。目前该项目是免费开源的,定位于研究和开发阶段。

图像生成深度学习开源项目 +2
🖼️ 图像 github.com
text-to-pose
匹配度 4

text-to-pose

text-to-pose是一个研究项目,旨在通过文本描述生成人物姿态,并利用这些姿态生成图像。该技术结合了自然语言处理和计算机视觉,通过改进扩散模型的控制和质量,实现了从文本到图像的生成。项目背景基于NeurIPS 2024 Workshop上发表的论文,具有创新性和前沿性。该技术的主要优点包括提高图像生成的准确性和可控性,以及在艺术创作和虚拟现实等领域的应用潜力。

自然语言处理计算机视觉文本到图像 +2
🖼️ 图像 github.com
MyTimeMachine
匹配度 4

MyTimeMachine

MyTimeMachine是一个基于人工智能技术的面部年龄变换模型,它能够通过约50张个人自拍照片个性化地进行年龄回退(减龄)和年龄前进(增龄),在保持高保真度和身份特征的同时,生成与目标年龄相似的面部图像。这项技术在电影和电视特效等虚拟年龄应用领域具有重要价值,能够提供高质量的、身份保持一致的、时间上连贯的年龄效果。

人工智能个性化VFX +2
🖼️ 图像 mytimemachine.github.io
Sana-1.6B
匹配度 4

Sana-1.6B

Sana-1.6B是一个高效的高分辨率图像合成模型,它基于线性扩散变换器技术,能够生成高质量的图像。该模型由NVIDIA实验室开发,使用DC-AE技术,具有32倍的潜在空间,能够在多个GPU上运行,提供强大的图像生成能力。Sana-1.6B以其高效的图像合成能力和高质量的输出结果而闻名,是图像合成领域的重要技术。

AI深度学习高分辨率 +2
🖼️ 图像
Sana
匹配度 4

Sana

Sana是一个文本到图像的框架,能够高效生成高达4096×4096分辨率的图像。它以极快的速度合成高分辨率、高质量的图像,并保持强大的文本-图像对齐,可以部署在笔记本电脑GPU上。Sana的核心设计包括深度压缩自编码器、线性扩散变换器(DiT)、仅解码器的小型语言模型作为文本编码器,以及高效的训练和采样策略。Sana-0.6B与现代大型扩散模型相比,体积小20倍,测量吞吐量快100倍以上。此外,Sana-0.6B可以部署在16GB笔记本电脑GPU上,生成1024×1024分辨率图像的时间少于1秒。Sana使得低成本的内容创作成为可能。

开源深度学习AI技术 +3
🖼️ 图像
TryOffDiff
匹配度 4

TryOffDiff

TryOffDiff是一种基于扩散模型的高保真服装重建技术,用于从穿着个体的单张照片中生成标准化的服装图像。这项技术与传统的虚拟试穿不同,它旨在提取规范的服装图像,这在捕捉服装形状、纹理和复杂图案方面提出了独特的挑战。TryOffDiff通过使用Stable Diffusion和基于SigLIP的视觉条件来确保高保真度和细节保留。该技术在VITON-HD数据集上的实验表明,其方法优于基于姿态转移和虚拟试穿的基线方法,并且需要较少的预处理和后处理步骤。TryOffDiff不仅能够提升电子商务产品图像的质量,还能推进生成模型的评估,并激发未来在高保真重建方面的工作。

图像处理电子商务扩散模型 +4
🖼️ 图像 rizavelioglu.github.io
Diffusion Self-Distillatio
匹配度 4

Diffusion Self-Distillatio

Diffusion Self-Distillation是一种基于扩散模型的自蒸馏技术,用于零样本定制图像生成。该技术允许艺术家和用户在没有大量配对数据的情况下,通过预训练的文本到图像的模型生成自己的数据集,进而微调模型以实现文本和图像条件的图像到图像任务。这种方法在保持身份生成任务的性能上超越了现有的零样本方法,并能与每个实例的调优技术相媲美,无需测试时优化。

图像生成扩散模型零样本学习 +2
🖼️ 图像
千绘AI
匹配度 4

千绘AI

千绘AI是一个利用人工智能技术,帮助用户创作个性化漫画的平台。它通过AI技术,使得用户即使没有专业的绘画技能,也能创作出高质量的漫画作品。产品背景信息显示,千绘AI旨在降低漫画创作的门槛,让每个人都能享受到创作漫画的乐趣。产品的主要优点包括角色形象的一致性、惊艳的绘图效果、快速生成分镜内容以及多样化的排版布局,这些都是其技术实力的体现。目前,千绘AI提供免费试用,具体的定价策略尚未明确。

个性化设计AI创作 +2
🎨 设计
OneDiffusion
匹配度 4

OneDiffusion

OneDiffusion是一个多功能、大规模的扩散模型,它能够无缝支持双向图像合成和理解,覆盖多种任务。该模型预计将在12月初发布代码和检查点。OneDiffusion的重要性在于其能够处理图像合成和理解任务,这在人工智能领域是一个重要的进步,尤其是在图像生成和识别方面。产品背景信息显示,这是一个由多位研究人员共同开发的项目,其研究成果已在arXiv上发表。

人工智能扩散模型图像合成 +1
🖼️ 图像 github.com
Stable Diffusion 3.5 ControlNets
匹配度 4

Stable Diffusion 3.5 ControlNets

Stable Diffusion 3.5 ControlNets是由Stability AI提供的文本到图像的AI模型,支持多种控制网络(ControlNets),如Canny边缘检测、深度图和高保真上采样等。该模型能够根据文本提示生成高质量的图像,特别适用于插画、建筑渲染和3D资产纹理等场景。它的重要性在于能够提供更精细的图像控制能力,提升生成图像的质量和细节。产品背景信息包括其在学术界的引用(arxiv:2302.05543),以及遵循的Stability Community License。价格方面,对于非商业用途、年收入不超过100万美元的商业用途免费,超过则需联系企业许可。

文本到图像AI图像生成控制网络 +3
🖼️ 图像
DrawL.ink
匹配度 4

DrawL.ink

DrawL.ink是一个在线服务,可以将任何链接转换成吸引人的图像,从而提高点击率和分享效率。它支持多种设计风格,如现代、经典、创意等,并允许用户自定义生成的图像。这种服务对于需要在社交媒体、博客或任何在线平台上分享链接的用户来说非常有用,因为它可以帮助他们的内容在信息泛滥的网络中脱颖而出。产品背景信息显示,DrawL.ink由YGeeker提供,旨在通过视觉化的方式增强链接的吸引力。关于价格,网站未提供具体信息,可能需要用户直接访问网站查询。

社交媒体内容分享链接图像 +2
🎨 设计 drawl.ink
Image Maker Ai
匹配度 4

Image Maker Ai

Image Maker Ai 是一个基于人工智能的图像生成平台,利用先进的变换器模型和BlackForestLabs的最新AI研究,提供从高端专业项目到快速个人使用的多种需求。该技术拥有12亿参数和多个模型变体,包括FLUX.1 [Pro]、[Dev]和[Schnell],优化了提示遵循、细节和输出多样性。Image Maker Ai 允许用户输入文本提示,选择风格,并由AI生成高分辨率、细节丰富、逼真的图像,适合各种应用,从个人项目到专业用途。所有由Flux生成的图像都是免版税的,可以用于个人或商业目的,无需担心版权问题。

AI图像生成高分辨率用户友好 +2
🖼️ 图像 www.imagemakerai.co
Edify Image
匹配度 4

Edify Image

Edify Image是NVIDIA推出的一款图像生成模型,它能够生成具有像素级精确度的逼真图像内容。该模型采用级联像素空间扩散模型,并通过新颖的拉普拉斯扩散过程进行训练,该过程能够在不同频率带以不同的速率衰减图像信号。Edify Image支持多种应用,包括文本到图像合成、4K上采样、ControlNets、360° HDR全景图生成和图像定制微调。它代表了图像生成技术的最新进展,具有广泛的应用前景和重要的商业价值。

文本到图像AI图像生成像素空间扩散模型 +2
🖼️ 图像
Chromakopia Font Profile Picture Generator
匹配度 4

Chromakopia Font Profile Picture Generator

Chromakopia Font Profile Picture Generator 是一个在线工具,允许用户通过自定义字体生成器来创建独特的个人资料图片。这个工具的重要性在于它提供了一个简单易用的界面,让用户可以快速生成个性化的图片,用于社交媒体等平台。产品背景信息显示,Chromakopia旨在通过其定制字体生成器帮助用户创造独一无二的个人资料图片,其主要优点包括用户友好的界面和个性化的选项。目前,该产品是免费的,定位于希望在社交媒体上展示个性的用户群体。

社交媒体个性化设计工具 +2
🎨 设计 chromakopiafont-generator.com
LucidFusion
匹配度 4

LucidFusion

LucidFusion是一个灵活的端到端前馈框架,用于从未摆姿势、稀疏和任意数量的多视图图像中生成高分辨率3D高斯。该技术利用相对坐标图(RCM)来对齐不同视图间的几何特征,使其在3D生成方面具有高度适应性。LucidFusion能够与原始单图像到3D的流程无缝集成,生成512x512分辨率的详细3D高斯,适合广泛的应用场景。

3D重建多视图图像高斯生成 +2
🖼️ 图像
DimensionX
匹配度 4

DimensionX

DimensionX是一个基于视频扩散模型的3D和4D场景生成技术,它能够从单张图片中创建出具有可控视角和动态变化的三维和四维场景。这项技术的主要优点包括高度的灵活性和逼真度,能够根据用户提供的提示词生成各种风格和主题的场景。DimensionX的背景信息显示,它是由一群研究人员共同开发的,旨在推动图像生成技术的发展。目前,该技术是免费提供给研究和开发社区使用的。

人工智能图像生成3D场景 +2
🖼️ 图像 chenshuo20.github.io
AI Tattoo Generator.net
匹配度 4

AI Tattoo Generator.net

AI Tattoo Generator是一个利用人工智能技术帮助用户快速创建个性化纹身设计的在线平台。该平台使用先进的机器学习算法,根据用户输入生成具有各种风格的现实感纹身概念图,确保用户的想法以视觉上引人入胜的方式呈现。它不仅能够提供即时的设计结果,还能让用户根据自己的偏好进一步定制和细化设计,满足个性化需求。

个性化机器学习AI设计 +2
🎨 设计 aitattoosgenerator.net