生成_坚曼百货商行

音乐生成更高质量更有乐感科大讯飞重磅开源OpenMusic 人人都是音乐家！中科大&amp

文章链接，https，arxiv.org，pdf，2405.15863代码链接，https，github.com，ivcylc，qa，mdtHuggingface链接，https，huggingface.co，spaces，jadechoghari，OpenMusicDemo链接，https，qa，...

2024-11-15 278

包包服装

从此远离海报设计烦恼超实用！手把手教你十分钟制作一个海报生成图像流

最近喜欢上了Coze的图像流，非常方便就可以帮我们设计出各种海报、日签、素描照等各种玩法，特别是海报，应该算是我们工作生活中经常遇到或者用到的一个东西，在AI时代到来前基本都得找专业设计师设计才行，AI的到来，大幅降低了制作海报的难度，接下来就手把手带大家完成一个海报设计的图像流，后续就可以轻松出海...

2024-11-15 253

行业热门

耳朵没错是声音太真了字节豆包语音合成成果Seed

Seed，TTS是字节跳动豆包大模型团队近期发布的语音生成大模型成果，它生成的语音几乎与真人完全一样，连发音瑕疵也能生成出来，尤其在学习模仿人类说话方面，相似性和自然度均有很好表现，举例来说，将一段语音提供给Seed，TTS，它就能按文本生成全新语音，且带上原素材的声音特征，英文语音也可生成，且依然...

2024-11-15 220

生活科普

视频生成和具身智能强强联合！谷歌&amp 卡内基梅隆&amp 斯坦福发布Gen2Act 泛化超棒！

文章链接，https，arxiv.org，pdf，2409.16283项目链接，https，homangab.github.io，gen2act，亮点直击总结速览解决的问题机器人操作策略在面对新任务时，往往难以处理未见过的物体类型和新动作，由于机器人数据采集成本高，如何实现操作策略的泛化是一个关键挑...

2024-11-15 167

新闻资讯

效果超越Gen 10倍速度突破质量瓶颈

论文链接，https，arxiv.org，pdf，2405.18750项目链接，https，t2v，turbo.github.io，基于扩散的文本到视频，T2V，模型取得了显著的成功，但仍然受到迭代采样过程速度缓慢的影响，为了解决这一挑战，一些一致性模型被提出来促进快速推理，尽管以牺牲样本质量为代价...

2024-11-15 154

百货快讯

视觉效果超赞！随意画个草图就能生成3D交互游戏场景！腾讯XR出品

文章链接，https，arxiv.org，pdf，2408.04567项目地址，https，xrvisionlabs.github.io，Sketch2Scene，亮点直击3D内容生成是许多计算机图形应用的核心，包括视频游戏、电影制作、虚拟现实和增强现实等，本文提出了一种基于深度学习的创新方法，用于...

2024-11-15 256

头条

上交港中文新框架超越Instant3D 5秒完成3D生成真香合成数据集已开源

使用大模型合成的数据，就能显著提升3D生成能力，来自上海交大、香港中文大学等团队还真做到了，他们推出Bootstrap3D框架，结合微调的具备3D感知能力的多模态大模型，这个框架能够自动生成任意数量的高质量的多视角图片数据，助力多视图扩散模型的训练，结果表明，新的合成数据能够显著提高现有3D生成模型...

2024-11-15 511

家电数码

一文详解3D内容生成算法朴素

文章链接，https，arxiv.org，pdf，2402.01166近年来，人工智能生成内容，AIGC，方面取得了显著进展，涉及多种输入形式，如文本、图像、视频、音频和3D内容，其中，3D内容是最接近真实世界3D环境的视觉形式，并蕴含着巨大的知识量，3D内容生成展示了学术和实践价值，同时也面临着巨...

2024-11-15 329

头条

媲美Sora 文生超1分钟 1080P视频谷歌发布Veo

5月15日，谷歌召开，I，O2024，大会，并宣布了100多种产品和大模型，其中，有两款产品令人印象深刻，一个是支持跨文本、视频、音频的多模态AIAgent—ProjectAstra；另外一个便是视频模型Veo，据悉，Veo支持文本生成超过1分钟的1080P超高清视频，在文本语义还原、视频动作一致性...

2024-11-15 207

资讯

再进化！视频续写可达3分钟让全球网友炸锅可灵快手

最近，可灵AI直接让一位网友的家人群里炸锅了……事情是这样的，这位网友的父亲需要做搭桥手术，为了给父亲鼓舞，他便试着用可灵AI把爷爷的两张老照片还原成了视频，在下面这个视频中，爷爷正在朝鲜战场，担任营指导员，穿越时光隧道，1950年代风华正茂的爷爷，对着他挥了挥手，这位网友把视频发到家人群后，群里直...

2024-11-15 432

家电数码

摄影级画面秒生成 V6.1再进化！人像逼真细节拉满 Midjourney

Midjourney几个月前画的饼终于端上来了！他们今天刚刚发布了最新版本v6.1！此次更新总结四个大字，细节狂魔，网友纷纷发推测试最新版本的Midjourney，摄影级画面先睹为快！这张图被取名为，天窗，，构图、色彩、光影、明暗，各方面都极度舒适，湖面波光粼粼细节生动，简直可以直接用来做屏保，继续...

2024-11-15 518

科技

上科大影眸联合提出DressCode 从文本生成3D服装板片

3D生成是生成式人工智能和计算机图形学领域最引人注目的话题之一，符合影视、游戏标准的3D生成尤其受产业界关注，在生产流程中，一般品类的3D资产往往通过手工建模或者扫描的方式制作，但作为3D资产的一个重要类别，服装资产的往往来源于平面板片与物理模拟等流程，而不是直接在3D上建模，上海科技大学、影眸科技...

2024-11-15 998

新闻资讯

CVPR`24

文章链接，https，arxiv.org，pdf，2406.09402项目地址，https，immortalco.github.io，Instruct，4D，to，4D，今天和大家一起学习的是Instruct4D，to，4D，可以通过2D扩散模型实现4D感知和时空一致性，以生成高质量的指令引导的动态...

2024-11-15 848

头条

Law 新一代轻量级ControlNeXt火了贾佳亚团队正挑战Scaling 视频生成控制提升几十倍

最近，又一款国产AI神器吸引了众网友和圈内研究人员的关注！它就是全新的图像和视频生成控制工具——ControlNeXt，由思谋科技创始人、港科大讲座教授贾佳亚团队开发，X平台上知名AI博主，AK，推荐从命名来看，ControlNeXt，致敬，了斯坦福大学研究团队在2023年2月提出的ControlN...

2024-11-15 506