AIGC_第36页_坚曼百货商行

科学数据子刊 EEG 自然 Nature 用于对话情境中情绪识别的

情感识别技术在现代人机交互中扮演着越来越重要的角色，随着人工智能和机器学习技术的快速发展，理解和识别人类情感已成为实现更自然、更人性化互动的关键，情感识别不仅能够提升用户体验，还能在心理健康监测、智能客服、教育和娱乐等多个领域发挥重要作用，在对话情境中，准确识别情感尤为重要，因为情感状态直接影响交流...

2024-11-15 777

娱乐八卦

分享大型语言模型在自动驾驶方面的应用案例 ChatGPT可以开车吗

人工智能技术如今正在快速发展和应用，人工智能模型也是如此，拥有100亿个参数的通用模型的性能正在碾压拥有5000万个参数的任务特定模型，在从单一模型解决许多任务方面表现出了卓越的性能，人工智能模型也正在变得多模态，微软公司的Florence2和OpenAI公司的GPT，4V等新的视觉模型正在扩展这些...

2024-11-15 652

百货

AI大语言模型在高阶心智理论任务上展现惊人表现超越人类

探索大型语言模型中的高阶心智理论在人类的社会互动中，理解他人的心理状态是一项至关重要的能力，这种能力被称为心智理论，TheoryofMind，ToM，心智理论使得人们能够推断和理解他人的信念、愿望、知识和情感，从而预测和影响他人的行为，随着人工智能领域的迅速发展，特别是大型语言模型，LargeLan...

2024-11-15 347

数码资讯

智能体协作进化论从心智理论到逆向注意力

让智能体在不断变化的环境中动态适应、并有效合作是一个巨大的挑战，特别是当智能体需要与陌生的智能体互动时，传统训练方法往往表现不佳，这种情况下，引入逆向注意力智能体，InverseAttentionAgents，成为了一种创新且有效的解决方案，逆向注意力智能体的核心在于借鉴，心智理论，Theoryof...

2024-11-15 998

科技

上科大影眸联合提出DressCode 从文本生成3D服装板片

3D生成是生成式人工智能和计算机图形学领域最引人注目的话题之一，符合影视、游戏标准的3D生成尤其受产业界关注，在生产流程中，一般品类的3D资产往往通过手工建模或者扫描的方式制作，但作为3D资产的一个重要类别，服装资产的往往来源于平面板片与物理模拟等流程，而不是直接在3D上建模，上海科技大学、影眸科技...

2024-11-15 998

家电数码

谷歌新作让人难绷 2D头像生成3D虚拟人开视频会

开视频远程会议的时候，很多人都不喜欢打开摄像头，即使开了，在界面上大家也都被框在不同的窗口里，虽然这种形式操作起来很方便，但总是缺乏点临场感，最近，谷歌提出了一项研究旨在解决这个问题，这个名叫ChatDirector的技术可以使用静态的2D头像生成3D虚拟人，让大家一同，坐在会议室里，开会，只是看起...

2024-11-15 400

生活科普

LiDAR仿真新思路

原标题，LidarDM，GenerativeLiDARSimulationinaGeneratedWorld论文链接，https，arxiv.org，pdf，2404.02903.pdf代码链接，https，github.com，vzyrianov，lidardm作者单位，伊利诺伊大学麻省理工学院论...

2024-11-15 870

玩具模型

2024 ECCV

论文一作兰宇时为南洋理工大学，NTU，博士生，导师为ChenChangeLoy，本科毕业于北京邮电大学，目前主要研究兴趣为基于神经渲染的3D生成模型、3D重建与编辑，在ECCV2024中，来自南洋理工大学S，Lab、上海AILab以及北京大学的研究者提出了一种原生3DLDM生成框架，具体来讲，他们针...

2024-11-15 236

饰品装饰

自定义3D编辑和资产生成上海AI 3D版裁缝开源来袭！Tailor3D 港大&amp

文章链接，https，arxiv.org，pdf，2407.06191github链接，https，tailor3d，2024.github.io，Huggingface，https，huggingface.co，spaces，alexzyqi，Tailor3D亮点直击，3DAIGC，人工智能生成内...

2024-11-15 877

数码资讯

仅需1分钟文本生成高质量3D模型

全球社交、科技巨头Meta发布了全新文生3D模型——Meta3D，Gen，用户通过Meta3D，Gen仅需1分钟就能生成人物、动物、道具、服饰、工业设计等不同类型的高质量3D模型，Meta3D，Gen不仅生成的内容是高分辨率的纹理和材质贴图，还支持物理渲染光影效果非常好，适用于游戏开发、电影制作、虚...

2024-11-15 481

行业热门

开源视频模型SV4D 一键创建8角度动态3D视频

Stability.ai开源了创新视频模型StableVideo4D，简称，SV4D，，可将一个视频轻松创建8个角度的动态3D视频，使用方法也非常简单，用户只需要上传视频然后选择3D相机姿势，经过大约40秒左右的推理就能完成视频创建，相比SV3D、STAG4D等同类模型，SV4D的推理效率和生成质量...

2024-11-15 201

娱乐八卦

DreamTech联合南大和牛津发布最强3D内容生成大模型

文章链接，https，arxiv.org，pdf，2405.14832github链接，https，nju，3dv.github.io，projects，Direct3D，从文本和图像生成高质量的3D资产一直是一项挑战，主要是由于缺乏能够捕捉复杂几何分布的可扩展3D表示，在这项工作中，介绍了Dire...

2024-11-15 286

新闻资讯

CVPR`24

文章链接，https，arxiv.org，pdf，2406.09402项目地址，https，immortalco.github.io，Instruct，4D，to，4D，今天和大家一起学习的是Instruct4D，to，4D，可以通过2D扩散模型实现4D感知和时空一致性，以生成高质量的指令引导的动态...

2024-11-15 848

资讯

视频麻省理工创新模型生成 3D 用2D视频扩散

传统的3D视频生成主要有两种方法，一种是通过2D视频模型和静态3D场景模型的分类器指导来优化动态3D视频场景表示，不过这种对算力的需求极大，生成一个3D视频需要数小时；另一种是通过变形初始3D场景表示来实现，但需要严格的时间结构并且需调整复杂的参数，为了解决这些难题，麻省理工、Databricks马...

2024-11-15 743

包包服装

o1蒙特卡洛树的风又吹到了Agentic工作流！

AFlow是一个用于自动生成和优化Agentic工作流的框架，它使用蒙特卡洛树搜索，MonteCarlotreesearch，在代码表示的工作流空间中查找有效的工作流，用机器工作取代手动开发，在各种任务上都显示出超越手工工作流的潜力，由MetaGPT开源，AFLOW，以黄色突出显示，在所有六个基准...

2024-11-15 948

包含"AIGC"标签的文章