包含"AIGC"标签的文章
-
科学数据子刊 EEG 自然 Nature 用于对话情境中情绪识别的
情感识别技术在现代人机交互中扮演着越来越重要的角色,随着人工智能和机器学习技术的快速发展,理解和识别人类情感已成为实现更自然、更人性化互动的关键,情感识别不仅能够提升用户体验,还能在心理健康监测、智能客服、教育和娱乐等多个领域发挥重要作用,在对话情境中,准确识别情感尤为重要,因为情感状态直接影响交流...
-
分享大型语言模型在自动驾驶方面的应用案例 ChatGPT可以开车吗
人工智能技术如今正在快速发展和应用,人工智能模型也是如此,拥有100亿个参数的通用模型的性能正在碾压拥有5000万个参数的任务特定模型,在从单一模型解决许多任务方面表现出了卓越的性能,人工智能模型也正在变得多模态,微软公司的Florence2和OpenAI公司的GPT,4V等新的视觉模型正在扩展这些...
-
AI大语言模型在高阶心智理论任务上展现惊人表现 超越人类
探索大型语言模型中的高阶心智理论在人类的社会互动中,理解他人的心理状态是一项至关重要的能力,这种能力被称为心智理论,TheoryofMind,ToM,心智理论使得人们能够推断和理解他人的信念、愿望、知识和情感,从而预测和影响他人的行为,随着人工智能领域的迅速发展,特别是大型语言模型,LargeLan...
-
智能体协作进化论 从心智理论到逆向注意力
让智能体在不断变化的环境中动态适应、并有效合作是一个巨大的挑战,特别是当智能体需要与陌生的智能体互动时,传统训练方法往往表现不佳,这种情况下,引入逆向注意力智能体,InverseAttentionAgents,成为了一种创新且有效的解决方案,逆向注意力智能体的核心在于借鉴,心智理论,Theoryof...
-
上科大 影眸联合提出DressCode 从文本生成3D服装板片
3D生成是生成式人工智能和计算机图形学领域最引人注目的话题之一,符合影视、游戏标准的3D生成尤其受产业界关注,在生产流程中,一般品类的3D资产往往通过手工建模或者扫描的方式制作,但作为3D资产的一个重要类别,服装资产的往往来源于平面板片与物理模拟等流程,而不是直接在3D上建模,上海科技大学、影眸科技...
-
谷歌新作让人难绷 2D头像生成3D虚拟人开视频会
开视频远程会议的时候,很多人都不喜欢打开摄像头,即使开了,在界面上大家也都被框在不同的窗口里,虽然这种形式操作起来很方便,但总是缺乏点临场感,最近,谷歌提出了一项研究旨在解决这个问题,这个名叫ChatDirector的技术可以使用静态的2D头像生成3D虚拟人,让大家一同,坐在会议室里,开会,只是看起...
-
LiDAR仿真新思路
原标题,LidarDM,GenerativeLiDARSimulationinaGeneratedWorld论文链接,https,arxiv.org,pdf,2404.02903.pdf代码链接,https,github.com,vzyrianov,lidardm作者单位,伊利诺伊大学麻省理工学院论...
-
2024 ECCV
论文一作兰宇时为南洋理工大学,NTU,博士生,导师为ChenChangeLoy,本科毕业于北京邮电大学,目前主要研究兴趣为基于神经渲染的3D生成模型、3D重建与编辑,在ECCV2024中,来自南洋理工大学S,Lab、上海AILab以及北京大学的研究者提出了一种原生3DLDM生成框架,具体来讲,他们针...
-
自定义3D编辑和资产生成 上海AI 3D版裁缝开源来袭!Tailor3D 港大&
文章链接,https,arxiv.org,pdf,2407.06191github链接,https,tailor3d,2024.github.io,Huggingface,https,huggingface.co,spaces,alexzyqi,Tailor3D亮点直击,3DAIGC,人工智能生成内...
-
仅需1分钟 文本生成高质量3D模型
全球社交、科技巨头Meta发布了全新文生3D模型——Meta3D,Gen,用户通过Meta3D,Gen仅需1分钟就能生成人物、动物、道具、服饰、工业设计等不同类型的高质量3D模型,Meta3D,Gen不仅生成的内容是高分辨率的纹理和材质贴图,还支持物理渲染光影效果非常好,适用于游戏开发、电影制作、虚...
-
开源视频模型SV4D 一键创建8角度动态3D视频
Stability.ai开源了创新视频模型StableVideo4D,简称,SV4D,,可将一个视频轻松创建8个角度的动态3D视频,使用方法也非常简单,用户只需要上传视频然后选择3D相机姿势,经过大约40秒左右的推理就能完成视频创建,相比SV3D、STAG4D等同类模型,SV4D的推理效率和生成质量...
-
DreamTech联合南大和牛津发布最强3D内容生成大模型
文章链接,https,arxiv.org,pdf,2405.14832github链接,https,nju,3dv.github.io,projects,Direct3D,从文本和图像生成高质量的3D资产一直是一项挑战,主要是由于缺乏能够捕捉复杂几何分布的可扩展3D表示,在这项工作中,介绍了Dire...
-
CVPR`24
文章链接,https,arxiv.org,pdf,2406.09402项目地址,https,immortalco.github.io,Instruct,4D,to,4D,今天和大家一起学习的是Instruct4D,to,4D,可以通过2D扩散模型实现4D感知和时空一致性,以生成高质量的指令引导的动态...
-
视频 麻省理工创新模型 生成 3D 用2D视频扩散
传统的3D视频生成主要有两种方法,一种是通过2D视频模型和静态3D场景模型的分类器指导来优化动态3D视频场景表示,不过这种对算力的需求极大,生成一个3D视频需要数小时;另一种是通过变形初始3D场景表示来实现,但需要严格的时间结构并且需调整复杂的参数,为了解决这些难题,麻省理工、Databricks马...
-
o1蒙特卡洛树的风又吹到了Agentic工作流!
AFlow是一个用于自动生成和优化Agentic工作流的框架,它使用蒙特卡洛树搜索,MonteCarlotreesearch,在代码表示的工作流空间中查找有效的工作流,用机器工作取代手动开发,在各种任务上都显示出超越手工工作流的潜力,由MetaGPT开源,AFLOW,以黄色突出显示,在所有六个基准...