头条
-
视觉效果超赞!随意画个草图就能生成3D交互游戏场景!腾讯XR出品
文章链接,https,arxiv.org,pdf,2408.04567项目地址,https,xrvisionlabs.github.io,Sketch2Scene,亮点直击3D内容生成是许多计算机图形应用的核心,包括视频游戏、电影制作、虚拟现实和增强现实等,本文提出了一种基于深度学习的创新方法,用于...
-
上交港中文新框架超越Instant3D 5秒完成3D生成 真香合成数据集已开源
使用大模型合成的数据,就能显著提升3D生成能力,来自上海交大、香港中文大学等团队还真做到了,他们推出Bootstrap3D框架,结合微调的具备3D感知能力的多模态大模型,这个框架能够自动生成任意数量的高质量的多视角图片数据,助力多视图扩散模型的训练,结果表明,新的合成数据能够显著提高现有3D生成模型...
-
是如何估计与分析模型计算量的 OpenAI
今天看到OpenAI前些年发布的一个模型计算量的分析,感觉很有价值,有需求的人童鞋可以看一下,内容如下,自2012年以来,最大规模AI训练运行中使用的计算量呈指数级增长,翻倍时间为3.4个月,相比之下,摩尔定律的翻倍期为2年,自2012年以来,这一指标增长了300,000多倍,2年的翻倍期只能产生7...
-
#AIGC创新先锋者征文大赛#去哪儿国际酒店AI生成视频实践
1.视频生成挑战与机遇我们首先来看看,国际酒店视频生成所遇到的挑战,随着AIGC技术的发展,我们关注其在实际业务中的应用,我们认识到AIGC已具备生成视频的能力,且我们的业务对此有相应的需求,因此,我们首先确定了使用AIGC生成视频的场景,接下来,我们考虑如何将视频制作工程化,并确保视频质量,回到视...
-
认证申请指南 AI.x社区 技术团队
随着AI.x社区的不断发展,我们发现有越来越多的企业,技术团队参与到社区的内容建设中,在充分了解了各家企业,团队的诉求之后,社区推出了,技术团队,的社区账号认证服务,以满足企业,技术团队的品牌塑造、优质内容传播等需求,技术团队,定位为,AI.x社区官方认证的、由专业的技术团队运营的账号,是企业,团队...
-
#AIGC创新先锋者征文大赛#AI Agent要如何修炼 才能真正落地
本文正在参与AI.x社区AIGC创新先锋者征文大赛,https,www.,aigc,2223.html,在AI技术日新月异的当下,智能体,Agent,技术正迅速崛起,成为AI领域的一大热点,Agent技术在各行业应用场景中表现出巨大潜力,然而伴随着机遇的同时,Agent技术的发展以及应用落地也面临着...
-
语言模型知识编辑的鲁棒性研究
一、引言随着大型语言模型的兴起,自然语言处理,NLP,社区面临的主要挑战之一是如何高效地对模型进行微调,如果需要短期内改变模型的某些行为,重新进行参数微调可能会过于耗时和昂贵,在这种情况下,模型知识编辑,KnowledgeEditing,技术就显得尤为重要,本文主要研究模型知识编辑的鲁棒性,并重点探...
-
Sora 一文带你了解OpenAI
最近AI圈最火的无疑是OpenAI在2月15日发布的Sora,Sora可以根据文本生成一分钟的高清视频,生成的视频画质、连续性、光影等都令人叹为观止,Sora无疑将视觉生成推到新的高度,本文将重点回答三个问题,一、背景在国内外大多数AI厂商还在卷大语言模型之际,OpenAI悄无声息地发布了文生视频,...
-
什么是LLMOps?
1.概念自2018年GPT,2的问世以来,大语言模型,LLM,如GPT系列逐渐发展壮大,尤其是GPT,3及其后续版本的推出,性能方面显著提升,这些模型的强大能力催生了众多应用,如客户服务的聊天机器人、多语言翻译服务和辅助写作编程的工具等,面对LLM在实际应用中的独特挑战,业界发展出了新的工具和最佳实...
-
什么是AI Agent
1概念在计算机、人工智能专业技术领域,一般将Agent译为,智能体,,其定义是在一定的环境中体现出自治性、反应性、社会性、预动性、思辨性,慎思性,、认知性等一种或多种智能特征的软件或硬件实体,AIAgent则是指由LLM驱动的智能体,目前它还没有一个被广泛接受的定义,但我们可以把它描述成这样一个系统...
-
一文详解多模态智能体 最新进展 核心组件 LMAs
文章链接,https,arxiv.org,pdf,2402.15116github地址,https,github.com,jun0wanan,awesome,large,multimodal,agents大语言模型,LLMs,在为基于文本的AI智能体提供动力方面取得了卓越的表现,赋予它们类似于人类的...
-
大模型落地应用指北
一、大模型概述1.什么是大模型本文的大模型特指的是大规模数据训练得到的预训练模型,对于大模型,2021年8月李飞飞联合100多名专家发布了一份研究报告,OntheOpportunitiesandRiskofFoundationModels,,他们将大模型统一命名为fundationmodel,也可以...
-
突然火了的AI 终结落地焦虑 Agent 会成为破局的关键吗
嘉宾丨缪旭采访,撰稿丨张洁编辑丨诺亚出品,技术栈,微信号,blog51cto,有人说,现在大模型卷不动了,要卷就卷AIAgent,那么,事实真的如此吗,AIAgent,顾名思义即智能代理,是一种能够感知环境、进行决策和执行动作的智能体,而它作为一个概念真正走红,要从去年3月发布的AutoGPT说起,...
-
RAG 企业级应用落地框架细节差异对比
1、什么是RAG,RAG检索增强生成本质上来讲,就三件事情,第一、Indexing索引,即如何更有效地存储知识,第二、Retrieval检索,即在庞大的知识库中,如何筛选出少量的有益知识,供大模型参考,第三、Generation生成,即如何将用户的提问与检索到的知识相结合,使得大模型能够生成有价值的...
-
的最佳实践 Unstructured专家分享RAG应用中文档分块 Chunking
近日,MariaKhalusova在Unstructured官方博客分享了有关分块的最佳实践,Unstructured成立于2022年9月,致力于解决自然语言处理,NLP,和大型语言模型,LLM,应用中的数据预处理问题,公司总部位于美国,专注于将非结构化数据转化为LLM可以处理的格式,当下流行的pd...