包含"人工智能"标签的文章
-
LLM超长上下文查询
在大型语言模型,LLM,的应用中,有几个场景需要以结构化的方式呈现数据,其中信息提取和查询分析是两个典型的例子,我们最近通过更新的文档和一个专门的代码仓库强调了信息提取的重要性,对于查询分析,我们同样更新了相关文档,在这些场景中,数据字段可能包括字符串、布尔值、整数等多种类型,而在这些类型中,处理高...
-
Cohere 只卖模型的利润有多少 CEO 零
整理,言征出品,技术栈,微信号,blog51cto,利润是多少,Cohere创始人称,人工智能的商业模式正在快速变化OpenAI和Anthropic每年花费数十亿美元训练GPT,4和Claude等模型,但竞相打起的价格倾销将使这些平台周围的业务变得相当不稳定,1.卖API太难了人工智能提供商Cohe...
-
解锁大模型的 白话EAGLE2 打草稿 技术
实时了解业内动态,论文是最好的桥梁,专栏精选论文重点解读热点论文,围绕着行业实践和工程量产,若在某个环节出现卡点,可以回到大模型必备腔调或者LLM背后的基础模型重新阅读,而最新科技,Mamba,xLSTM,KAN,则提供了大模型领域最新技术跟踪,1.总览EAGLE,2EAGLE,2是一种加速...
-
文本直接生成多视角3D图像 Meta推出创新模型
随着扩散模型的不断创新,文生图领域出现了Midjourney、StableDiffusion、DALL,E3等一系列知名产品,但在文本生成多视角3D图像方面一直存在诸多技术难点,Meta和德国慕尼黑工业大学的研究人员联合开发了创新模型——ViewDiff,用户通过文本、图像或二者结合使用,就能生成高...
-
基于指令的细粒度图像编辑数据集 万样本 数据才是AIGC的王道!UltraEdit
一、概述UltraEdit是一种大规模的、自动生成的数据集,专门用于基于指令的图像编辑,该数据集包含了约万个编辑样本,覆盖了750,000个独特的指令,涵盖了9种以上的编辑类型,UltraEdit的核心优势在于其利用大型语言模型,LLMs,的创造力和人类评估者提供的上下文编辑示例,提供了更广泛的编辑...
-
解锁虚拟现实中的幻觉问题 3D语言模型的新突破
随着人工智能技术的飞速发展,3D语言模型,3D,LLMs,已成为研究的热点,它们在理解和生成语言指令方面展现出了巨大的潜力,这些模型不仅能够处理文本信息,还能理解和操作三维空间中的物体,这对于发展能够与物理世界互动的智能系统至关重要,3D语言模型的核心在于其能够将语言与三维场景紧密结合,传统的大型语...
-
能解释图像和文本数据 300亿参数!苹果推出多模态大模型MM1
在过去的一年里,LLM因其先进的AI能力而备受关注,值得注意的是,苹果,Apple,公司却缺席了,目前,苹果公司正在谈判将谷歌的Gemini人工智能引擎植入iPhone,而苹果一直致力于开发下一代LLM,一种可以解释图像和文本数据的LLM,近日,苹果的计算机科学家和工程师团队开发了一种LLM模型,声...
-
文本生成超真实3D模型 浙大 蚂蚁集团推出MaPa
浙江大学、蚂蚁集团、深圳大学联合推出了创新模型MaPa,与传统纹理方法不同的是,MaPa通过文本能直接生成高分辨率、物理光照、超真实材质的3D模型,可以极大提升游戏、VR、AR、影视等行业的开发效率,研究人员在多个知名平台对MaPa进行了综合测试,结果显示,在无参考图像的情况下MaPa生成的模型材质...
-
打破数据壁垒 MetaGPT推出全新工作 数据科学家或将被取代 挑战机器学习建模流程
目前,由大型语言模型,LLM,驱动的智能体已经证明了它们在处理复杂任务方面的显著潜力,此外,通过赋予LLM代码执行能力来提升其问题解决能力正逐渐成为一种趋势,这一点已经通过Code,Interpreter[1]、OpenInterpreter[2]、TaskWeaver[3]等工作得到了实践验证,然...
-
Lumina
近年来,随着扩散模型在生成任务中的广泛应用,它们已经成为了生成式人工智能领域的重要组成部分,从StableDiffusion到Sora,这些模型在生成真实图像和视频方面取得了显著成功,标志着从经典U,Net架构向基于Transformer的扩散主干架构的转变,最新的进展是Lumina,T2X系列模型...
-
港中文联手华为推出3D自动驾驶场景生成模型 港科& 无需3D数据也能训练
无需采集3D数据,也能训练出高质量的3D自动驾驶场景生成模型,这是来自香港中文大学、香港科技大学和华为诺亚方舟实验室的最新研究成果——针对自动驾驶街景的可控3D场景生成方法,MagicDrive3D,此前,采用常见的2D自动驾驶数据集来生成3D街景的方法不是没有,但受采集角度所限,生成结果的可控性和...
-
技术 15种先进的检索增强生成 RAG
一、现状在AI领域,从原型到生产的过程极具挑战,构建大型语言模型,LLM,、小型语言模型,SLM,或多模态应用虽令人激动,但将其转化为可扩展、可靠的生产系统,需深入理解其复杂性,这不仅仅是硬件扩展或算法优化的问题,而是涉及数据、模型架构与应用需求之间关系的深入探究,二、15种RAG技术在本文中,我们...
-
阿里发布多模态大模型WINGS 解决基于LLM的多模态训练灾难遗忘问题 南大&
今天给大家介绍一篇南京大学、阿里巴巴联合发表的多模态模型建模方法WINGS,解决基于LLM的多模态模型在进行跨模态建模时的灾难遗忘问题,论文标题,WINGS,LearningMultimodalLLMswithoutText,onlyForgetting下载地址,https,arxiv.org,...
-
15种先进的检索增强生成 技术 RAG
01、概述在人工智能领域,从原型到生产的旅程充满挑战,虽然构建大型语言模型,LLM,、小型语言模型,SLM,或多模态应用的过程充满了兴奋,但要将这些原型转化为可扩展、可靠且生产就绪的解决方案,需要对其复杂性有深入理解,这个过程不仅仅涉及硬件扩展或算法优化,更是对数据、模型架构和实际应用需求之间关系的...
-
视频生成模型 新的 Meta Movie SOTA Gen
一、背景前段时间Meta发布了对标OpenAISORA和快手可灵的视频生成模型MovieGen,这里我们进行相关的技术解读,本文主要聚焦在其图像和视频生成模型部分,进行详细介绍;然后对视频个性化、编辑和音频生成进行简单概述,对应的论文,MovieGen,ACastofMediaFoundationM...