包含"生成"标签的文章
-
音乐生成更高质量 更有乐感 科大讯飞重磅开源OpenMusic 人人都是音乐家!中科大&
文章链接,https,arxiv.org,pdf,2405.15863代码链接,https,github.com,ivcylc,qa,mdtHuggingface链接,https,huggingface.co,spaces,jadechoghari,OpenMusicDemo链接,https,qa,...
-
从此远离海报设计烦恼 超实用!手把手教你十分钟制作一个海报生成图像流
最近喜欢上了Coze的图像流,非常方便就可以帮我们设计出各种海报、日签、素描照等各种玩法,特别是海报,应该算是我们工作生活中经常遇到或者用到的一个东西,在AI时代到来前基本都得找专业设计师设计才行,AI的到来,大幅降低了制作海报的难度,接下来就手把手带大家完成一个海报设计的图像流,后续就可以轻松出海...
-
耳朵没错 是声音太真了 字节豆包语音合成成果Seed
Seed,TTS是字节跳动豆包大模型团队近期发布的语音生成大模型成果,它生成的语音几乎与真人完全一样,连发音瑕疵也能生成出来,尤其在学习模仿人类说话方面,相似性和自然度均有很好表现,举例来说,将一段语音提供给Seed,TTS,它就能按文本生成全新语音,且带上原素材的声音特征,英文语音也可生成,且依然...
-
视频生成和具身智能强强联合!谷歌& 卡内基梅隆& 斯坦福发布Gen2Act 泛化超棒!
文章链接,https,arxiv.org,pdf,2409.16283项目链接,https,homangab.github.io,gen2act,亮点直击总结速览解决的问题机器人操作策略在面对新任务时,往往难以处理未见过的物体类型和新动作,由于机器人数据采集成本高,如何实现操作策略的泛化是一个关键挑...
-
效果超越Gen 10倍速度突破质量瓶颈
论文链接,https,arxiv.org,pdf,2405.18750项目链接,https,t2v,turbo.github.io,基于扩散的文本到视频,T2V,模型取得了显著的成功,但仍然受到迭代采样过程速度缓慢的影响,为了解决这一挑战,一些一致性模型被提出来促进快速推理,尽管以牺牲样本质量为代价...
-
视觉效果超赞!随意画个草图就能生成3D交互游戏场景!腾讯XR出品
文章链接,https,arxiv.org,pdf,2408.04567项目地址,https,xrvisionlabs.github.io,Sketch2Scene,亮点直击3D内容生成是许多计算机图形应用的核心,包括视频游戏、电影制作、虚拟现实和增强现实等,本文提出了一种基于深度学习的创新方法,用于...
-
上交港中文新框架超越Instant3D 5秒完成3D生成 真香合成数据集已开源
使用大模型合成的数据,就能显著提升3D生成能力,来自上海交大、香港中文大学等团队还真做到了,他们推出Bootstrap3D框架,结合微调的具备3D感知能力的多模态大模型,这个框架能够自动生成任意数量的高质量的多视角图片数据,助力多视图扩散模型的训练,结果表明,新的合成数据能够显著提高现有3D生成模型...
-
一文详解3D内容生成算法 朴素
文章链接,https,arxiv.org,pdf,2402.01166近年来,人工智能生成内容,AIGC,方面取得了显著进展,涉及多种输入形式,如文本、图像、视频、音频和3D内容,其中,3D内容是最接近真实世界3D环境的视觉形式,并蕴含着巨大的知识量,3D内容生成展示了学术和实践价值,同时也面临着巨...
-
媲美Sora 文生超1分钟 1080P视频 谷歌发布Veo
5月15日,谷歌召开,I,O2024,大会,并宣布了100多种产品和大模型,其中,有两款产品令人印象深刻,一个是支持跨文本、视频、音频的多模态AIAgent—ProjectAstra;另外一个便是视频模型Veo,据悉,Veo支持文本生成超过1分钟的1080P超高清视频,在文本语义还原、视频动作一致性...
-
再进化!视频续写可达3分钟让全球网友炸锅 可灵 快手
最近,可灵AI直接让一位网友的家人群里炸锅了……事情是这样的,这位网友的父亲需要做搭桥手术,为了给父亲鼓舞,他便试着用可灵AI把爷爷的两张老照片还原成了视频,在下面这个视频中,爷爷正在朝鲜战场,担任营指导员,穿越时光隧道,1950年代风华正茂的爷爷,对着他挥了挥手,这位网友把视频发到家人群后,群里直...
-
摄影级画面秒生成 V6.1再进化!人像逼真细节拉满 Midjourney
Midjourney几个月前画的饼终于端上来了!他们今天刚刚发布了最新版本v6.1!此次更新总结四个大字,细节狂魔,网友纷纷发推测试最新版本的Midjourney,摄影级画面先睹为快!这张图被取名为,天窗,,构图、色彩、光影、明暗,各方面都极度舒适,湖面波光粼粼细节生动,简直可以直接用来做屏保,继续...
-
上科大 影眸联合提出DressCode 从文本生成3D服装板片
3D生成是生成式人工智能和计算机图形学领域最引人注目的话题之一,符合影视、游戏标准的3D生成尤其受产业界关注,在生产流程中,一般品类的3D资产往往通过手工建模或者扫描的方式制作,但作为3D资产的一个重要类别,服装资产的往往来源于平面板片与物理模拟等流程,而不是直接在3D上建模,上海科技大学、影眸科技...
-
CVPR`24
文章链接,https,arxiv.org,pdf,2406.09402项目地址,https,immortalco.github.io,Instruct,4D,to,4D,今天和大家一起学习的是Instruct4D,to,4D,可以通过2D扩散模型实现4D感知和时空一致性,以生成高质量的指令引导的动态...
-
Law 新一代轻量级ControlNeXt火了 贾佳亚团队正挑战Scaling 视频生成控制提升几十倍
最近,又一款国产AI神器吸引了众网友和圈内研究人员的关注!它就是全新的图像和视频生成控制工具——ControlNeXt,由思谋科技创始人、港科大讲座教授贾佳亚团队开发,X平台上知名AI博主,AK,推荐从命名来看,ControlNeXt,致敬,了斯坦福大学研究团队在2023年2月提出的ControlN...
-
中国文生视频模型超高质量! 免费试用!国外惊讶 比肩Sora
中国知名大模型平台MiniMax旗下的海螺AI,最新上线的文生视频产品,受到了国外的盛赞,多数人表示一点也不比Sora、Runway、luma等国际顶级产品差,根据,AIGC开放社区,实际使用体验来看,其生成视频的质量、推理效率、动作一致性,多样性、文本语义还原、色彩搭配、景深、光影效果等非常优秀,...