头条

  • 大大优于GPT 让Siri不再智障!苹果定义新的端侧模型

      撰稿丨诺亚出品,技术栈,微信号,blog51cto,总被用户吐槽,有点智障,的Siri有救了!Siri自诞生以来就是智能语音助手领域的代表之一,但很长一段时间里,其表现并不尽如人意,然而,苹果的人工智能团队最新发布的研究成果有望极大地改变现状,在相关的研究论文中,苹果的AI专家们描述了一个系统,其中...

    2024-11-15 484
  • 全面分析揭示大模型中RAG噪声的作用 清华大学揭露RAG的双面性

      引言,RAG技术与大型语言模型中的噪声问题在大型语言模型,LLMs,的研究与应用中,噪声问题一直是一个不容忽视的挑战,这些模型在处理复杂的语言理解和生成任务时,往往需要从海量的数据中提取有用信息,然而,互联网上充斥着各种非标准的噪声信息,如AI生成的虚假新闻、过时内容、拼写错误等,这些噪声可能会影响...

    2024-11-15 164
  • 打破视觉

      引言,探索视觉,语言对比预训练中的噪声和低质量标注问题在视觉,语言对比预训练中,噪声和标注质量被认为是影响训练效果的重要因素,本文通过深入研究和分析训练过程中的两个主要问题——错误的负样本对分配和低质量及多样性不足的标注——揭示了通过解决这些问题来提高训练质量的潜力尚未被完全实现,首先,我们研究了影...

    2024-11-15 813
  • 浙江大学与字节跳动联手推出Molecule 破解AI多模态理解难题

      引言,多模态统一表示空间的挑战与机会在人工智能领域,多模态统一表示空间是实现多模态理解和生成的基础,这种统一空间能够将音频、图像、文本等多种模态的数据融合在一个共享的表示空间中,从而使得机器能够更好地理解和处理来自不同源的信息,然而,构建这样的统一表示空间面临着巨大的挑战,例如需要处理的模型参数可能...

    2024-11-15 477
  • 一文彻底理解大模型 智能体原理和案例 Agent

      1、什么是大模型Agent,大模型Agent,作为一种人工智能体,是具备环境感知能力、自主理解、决策制定及执行行动能力的智能实体,简而言之,它是构建于大模型之上的计算机程序,能够模拟独立思考过程,灵活调用各类工具,逐步达成预设目标的智能存在,Agent是AI大模型应用的主要新形态,在技术架构范式也发...

    2024-11-15 415
  • RAG系统的四层天梯 大模型RAG系统的成长之路

      第一章,为什么要给大模型喂额外营养,想象一下,你有一个超级智能的AI助手,它几乎无所不知,但当你问它今天的股市行情如何,或者最新的新冠病毒变种有哪些症状,,它却一脸茫然,这就是大语言模型,LLM,的现状,知识广博但不够新鲜,这就是为什么我们需要给LLM喂点额外营养,也就是外部数据,这个过程,专业点说...

    2024-11-15 229
  • 开源 语言模型系列 AMD 完全开源的 AMD OLMo 1B

      01、概述在人工智能和机器学习领域,我们正经历着一场技术革命,随着技术的飞速发展,对于强大、灵活且易于获取的解决方案的需求也在不断增长,开发者、研究人员和技术爱好者在利用尖端技术时,常常受限于封闭生态系统的束缚,许多现有的语言模型,包括一些最受欢迎的模型,往往伴随着专有限制和许可限制,或者托管在限制...

    2024-11-15 245
  • 用短输入模拟长样本 北大联合MSRA提出PoSE 高效拓展LLM上下文窗口

      论文题目,PoSE,EfficientContextWindowExtensionofLLMsviaPositionalSkip,wiseTraining论文链接,https,arxiv.org,abs,2309.10代码链接,https,github.com,dwzhu,pku,PoSE一、研究简...

    2024-11-15 981
  • 文本生成超真实3D模型 浙大 蚂蚁集团推出MaPa

      浙江大学、蚂蚁集团、深圳大学联合推出了创新模型MaPa,与传统纹理方法不同的是,MaPa通过文本能直接生成高分辨率、物理光照、超真实材质的3D模型,可以极大提升游戏、VR、AR、影视等行业的开发效率,研究人员在多个知名平台对MaPa进行了综合测试,结果显示,在无参考图像的情况下MaPa生成的模型材质...

    2024-11-15 225
  • 打破数据壁垒 MetaGPT推出全新工作 数据科学家或将被取代 挑战机器学习建模流程

      目前,由大型语言模型,LLM,驱动的智能体已经证明了它们在处理复杂任务方面的显著潜力,此外,通过赋予LLM代码执行能力来提升其问题解决能力正逐渐成为一种趋势,这一点已经通过Code,Interpreter[1]、OpenInterpreter[2]、TaskWeaver[3]等工作得到了实践验证,然...

    2024-11-15 974
  • 15种先进的检索增强生成 技术 RAG

      01、概述在人工智能领域,从原型到生产的旅程充满挑战,虽然构建大型语言模型,LLM,、小型语言模型,SLM,或多模态应用的过程充满了兴奋,但要将这些原型转化为可扩展、可靠且生产就绪的解决方案,需要对其复杂性有深入理解,这个过程不仅仅涉及硬件扩展或算法优化,更是对数据、模型架构和实际应用需求之间关系的...

    2024-11-15 409
  • 大模型技术基础学习路线 想要学好大模型应该具备哪些能力

      大模型技术的基础学习,是未来在大模型领域能否站稳脚跟的关键,随着大模型技术的发展,越来越多的人开始进入大模型领域,但大模型作为一门技术,因此它的本质上是一个工具,因此这也让学习大模型有了不同的学习方向,从工具的角度来看,学习一个工具主要有两个方向,一个是使用工具,一个是制造工具;而今天我们主要讲的是...

    2024-11-15 850
  • 以及强化学习的应用场景 从具身智能再谈强化学习 为什么需要强化学习

      学习的过程,是一个不断产生偏差和调整的过程,学习的过程是一个学习——验证——再学习——再验证的过程,在此之前也有写过关于强化学习的文章,但那时更多的是停留在概念描述和名称解释的阶段,简单来说就是知道有强化学习这个概念,但不知道它是用来解决什么问题,以及怎么来解决这些问题,之前的文章​​大模型的训练与...

    2024-11-15 864
  • MRAG 提升具有显著不同内容的多个文档复杂查询的检索准确性 一种多头RAG

      现有的RAG方案没有专注于需要检索多个具有显著不同内容的文档的查询,这类查询经常出现,但挑战在于这些文档的嵌入可能在嵌入空间中距离很远,难以全部检索,因此,提出一种多头检索增强生成方法,MRAG,Multi,HeadRAG,,它的关键思想是利用Transformer解码器的多头注意力层的激活,而不仅...

    2024-11-15 224
  • 大语言模型在不同自然语言处理任务中的提示工程方法综述

      一、结论写在前面​论文标题,ASurveyofPromptEngineeringMethodsinLargeLanguageModelsforDifferentNLPTasks论文链接,​​https,arxiv.org,pdf,2407.12994​​大型语言模型,LLMs,在众多不同的自然语言处...

    2024-11-15 301

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息