包含"生成"标签的文章
-
编辑 着色 条件生成和理解 统一多模态大模型!PUMA 修复 多粒度策略笑傲生成
文章链接,https,arxiv.org,pdf,2410.13861项目链接,https,github.com,rongyaofang,PUMA总结速览解决的问题,现有的多模态大模型,MLLMs,在视觉内容生成方面没有充分解决不同图像生成任务对粒度的需求差异,尤其是从文本到图像生成的多样性需求以及...
-
ShareGPT4V作者团队又一力作!百万高质量视频
继Sora官宣之后,多模态大模型在视频生成方面的应用简直就像井喷一样涌现出来,LUMA、Gen,3Alpha等视频生成模型展现了极佳质量的艺术风格和视频场景的细节雕刻能力,文生视频、图生视频的新前沿不断被扩展令大家惊喜不已,抱有期待,最近,来自中国科学技术大学、北京大学、上海AILab等团队的研究人...
-
Luma同时开放API 文生视频模型Runway
著名文生视频模型Runway宣布开放最新文生视频模型Gen,3AlphaTurbo的API,帮助开发者将该功能集成在应用中,Runway的API提供了两个套餐,Build,主要面向希望将文生视频集成在应用的个人和团队;Enterprise则面向更大型的组织和企业,目前,Runway的API需要申请候...
-
4090单卡可跑 智谱版Sora正式开源! 6秒直出电影级画质
7月26日,智谱发布AI生视频产品,清影,,30秒将任意文图生成视频,并上线在他们的AI助手,智谱清言,上,被誉为是国内首个人人可用的Sora,就在发布6天后,,清影,生成到视频数便已突破了百万量级,今天,智谱AI宣布将与,清影,同源的视频生成模型——CogVideoX正式开源,团队表示,希望每一位...
-
通用3D 生成任意3D和4D场景!GenXD
文章链接,https,arxiv.org,pdf,2411.02319项目链接,https,gen,x,d.github.io,亮点直击总结速览解决的问题现有的2D视觉生成已取得显著进展,但3D和4D生成在实际应用中仍然面临挑战,主要由于缺乏大规模4D数据和有效的模型设计,提出的方案应用的技术达到的...
-
仅仅将AI视作一种技术是错误的 诺奖得主哈萨比斯最新访谈
新晋诺贝尔化学奖得主、DeepMind创始人哈萨比斯的最新访谈来了~聊了DeepMind的初衷以及正在做的事,聊了AGI,还聊了AI的未来,对于AGI,此前奥特曼曾表示可能5年内到来,马斯克也曾预测很快将实现,而哈萨比斯则认为没那么快,他认为要达到AGI,还需要约10年的时间,而且还需要实现两三个重...
-
去哪儿国际酒店AI生成视频实践
嘉宾,郑吉敏编辑,李美涵出品,技术栈,微信号,blog51cto,本文整理自去哪儿旅行技术总监郑吉敏在WOT2024大会上的主题分享,更多精彩内容及现场PPT,请关注技术栈公众号,发送,WOT,即可直接领取,日前,在主办的WOT全球技术创新大会上,去哪儿旅行技术总监郑吉敏带来了主题演讲,国际酒店AI...