头条

大大优于GPT 让Siri不再智障！苹果定义新的端侧模型

撰稿丨诺亚出品，技术栈，微信号，blog51cto，总被用户吐槽，有点智障，的Siri有救了！Siri自诞生以来就是智能语音助手领域的代表之一，但很长一段时间里，其表现并不尽如人意，然而，苹果的人工智能团队最新发布的研究成果有望极大地改变现状，在相关的研究论文中，苹果的AI专家们描述了一个系统，其中...

2024-11-15 484

百货快讯

全面分析揭示大模型中RAG噪声的作用清华大学揭露RAG的双面性

引言，RAG技术与大型语言模型中的噪声问题在大型语言模型，LLMs，的研究与应用中，噪声问题一直是一个不容忽视的挑战，这些模型在处理复杂的语言理解和生成任务时，往往需要从海量的数据中提取有用信息，然而，互联网上充斥着各种非标准的噪声信息，如AI生成的虚假新闻、过时内容、拼写错误等，这些噪声可能会影响...

2024-11-15 164

行业热门

打破视觉

引言，探索视觉，语言对比预训练中的噪声和低质量标注问题在视觉，语言对比预训练中，噪声和标注质量被认为是影响训练效果的重要因素，本文通过深入研究和分析训练过程中的两个主要问题——错误的负样本对分配和低质量及多样性不足的标注——揭示了通过解决这些问题来提高训练质量的潜力尚未被完全实现，首先，我们研究了影...

2024-11-15 813

头条

浙江大学与字节跳动联手推出Molecule 破解AI多模态理解难题

引言，多模态统一表示空间的挑战与机会在人工智能领域，多模态统一表示空间是实现多模态理解和生成的基础，这种统一空间能够将音频、图像、文本等多种模态的数据融合在一个共享的表示空间中，从而使得机器能够更好地理解和处理来自不同源的信息，然而，构建这样的统一表示空间面临着巨大的挑战，例如需要处理的模型参数可能...

2024-11-15 477

头条

一文彻底理解大模型智能体原理和案例 Agent

1、什么是大模型Agent，大模型Agent，作为一种人工智能体，是具备环境感知能力、自主理解、决策制定及执行行动能力的智能实体，简而言之，它是构建于大模型之上的计算机程序，能够模拟独立思考过程，灵活调用各类工具，逐步达成预设目标的智能存在，Agent是AI大模型应用的主要新形态，在技术架构范式也发...

2024-11-15 415

百货快讯

RAG系统的四层天梯大模型RAG系统的成长之路

第一章，为什么要给大模型喂额外营养，想象一下，你有一个超级智能的AI助手，它几乎无所不知，但当你问它今天的股市行情如何，或者最新的新冠病毒变种有哪些症状，，它却一脸茫然，这就是大语言模型，LLM，的现状，知识广博但不够新鲜，这就是为什么我们需要给LLM喂点额外营养，也就是外部数据，这个过程，专业点说...

2024-11-15 229

行业热门

开源语言模型系列 AMD 完全开源的 AMD OLMo 1B

01、概述在人工智能和机器学习领域，我们正经历着一场技术革命，随着技术的飞速发展，对于强大、灵活且易于获取的解决方案的需求也在不断增长，开发者、研究人员和技术爱好者在利用尖端技术时，常常受限于封闭生态系统的束缚，许多现有的语言模型，包括一些最受欢迎的模型，往往伴随着专有限制和许可限制，或者托管在限制...

2024-11-15 245

百货快讯

用短输入模拟长样本北大联合MSRA提出PoSE 高效拓展LLM上下文窗口

论文题目，PoSE，EfficientContextWindowExtensionofLLMsviaPositionalSkip，wiseTraining论文链接，https，arxiv.org，abs，2309.10代码链接，https，github.com，dwzhu，pku，PoSE一、研究简...

2024-11-15 981

百货快讯

文本生成超真实3D模型浙大蚂蚁集团推出MaPa

浙江大学、蚂蚁集团、深圳大学联合推出了创新模型MaPa，与传统纹理方法不同的是，MaPa通过文本能直接生成高分辨率、物理光照、超真实材质的3D模型，可以极大提升游戏、VR、AR、影视等行业的开发效率，研究人员在多个知名平台对MaPa进行了综合测试，结果显示，在无参考图像的情况下MaPa生成的模型材质...

2024-11-15 225

行业热门

打破数据壁垒 MetaGPT推出全新工作数据科学家或将被取代挑战机器学习建模流程

目前，由大型语言模型，LLM，驱动的智能体已经证明了它们在处理复杂任务方面的显著潜力，此外，通过赋予LLM代码执行能力来提升其问题解决能力正逐渐成为一种趋势，这一点已经通过Code，Interpreter[1]、OpenInterpreter[2]、TaskWeaver[3]等工作得到了实践验证，然...

2024-11-15 974

百货快讯

15种先进的检索增强生成技术 RAG

01、概述在人工智能领域，从原型到生产的旅程充满挑战，虽然构建大型语言模型，LLM，、小型语言模型，SLM，或多模态应用的过程充满了兴奋，但要将这些原型转化为可扩展、可靠且生产就绪的解决方案，需要对其复杂性有深入理解，这个过程不仅仅涉及硬件扩展或算法优化，更是对数据、模型架构和实际应用需求之间关系的...

2024-11-15 409

行业热门

大模型技术基础学习路线想要学好大模型应该具备哪些能力

大模型技术的基础学习，是未来在大模型领域能否站稳脚跟的关键，随着大模型技术的发展，越来越多的人开始进入大模型领域，但大模型作为一门技术，因此它的本质上是一个工具，因此这也让学习大模型有了不同的学习方向，从工具的角度来看，学习一个工具主要有两个方向，一个是使用工具，一个是制造工具；而今天我们主要讲的是...

2024-11-15 850

行业热门

以及强化学习的应用场景从具身智能再谈强化学习为什么需要强化学习

学习的过程，是一个不断产生偏差和调整的过程，学习的过程是一个学习——验证——再学习——再验证的过程，在此之前也有写过关于强化学习的文章，但那时更多的是停留在概念描述和名称解释的阶段，简单来说就是知道有强化学习这个概念，但不知道它是用来解决什么问题，以及怎么来解决这些问题，之前的文章大模型的训练与...

2024-11-15 864

行业热门

MRAG 提升具有显著不同内容的多个文档复杂查询的检索准确性一种多头RAG

现有的RAG方案没有专注于需要检索多个具有显著不同内容的文档的查询，这类查询经常出现，但挑战在于这些文档的嵌入可能在嵌入空间中距离很远，难以全部检索，因此，提出一种多头检索增强生成方法，MRAG，Multi，HeadRAG，，它的关键思想是利用Transformer解码器的多头注意力层的激活，而不仅...

2024-11-15 224

百货快讯

大语言模型在不同自然语言处理任务中的提示工程方法综述

一、结论写在前面论文标题，ASurveyofPromptEngineeringMethodsinLargeLanguageModelsforDifferentNLPTasks论文链接，https，arxiv.org，pdf，2407.12994大型语言模型，LLMs，在众多不同的自然语言处...

2024-11-15 301

头条

联系我们