包含"DiT"标签的文章
-
详解Latte 应用于文生视频的DiT模型
随着Sora的成功发布,视频DiT模型得到了大量的关注和讨论,设计稳定的超大规模神经网络一直是视觉生成领域的研究重点,DiT[1]的成功为图像生成的规模化提供了可能性,然而,由于视频数据的高度结构化与复杂性,如何将DiT扩展到视频生成领域却是一个挑战,来自上海人工智能实验室的研究团队联合其他机构通过...
-
Lumina
近年来,随着扩散模型在生成任务中的广泛应用,它们已经成为了生成式人工智能领域的重要组成部分,从StableDiffusion到Sora,这些模型在生成真实图像和视频方面取得了显著成功,标志着从经典U,Net架构向基于Transformer的扩散主干架构的转变,最新的进展是Lumina,T2X系列模型...
-
同架构 可免费商用 Sora 重磅!腾讯宣布混元文生图大模型开源 中英文原生DiT
5月14日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在HuggingFace平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用,这是业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿,升级后的混元文生图大...
共1页 3条