家电数码
-
改进RAG管道检索文档质量的五种方法
RAG可以利用外部信息提升大型语言模型的性能,其性能依赖于检索文档的质量,除了标准检索方法之外,还有4种方法可以提高所检索文档的质量,检索增强生成,RAG,是利用外部信息定制大型语言模型的重要技术之一,但是,RAG的性能取决于检索到的文档的质量,除了在RAG管道中使用的标准检索方法之外,还有这4种技...
-
文档概要索引 简单提升检索性能的新选择
今天介绍了一种全新的LlamaIndex数据结构,文档摘要索引,将描述它如何比传统语义搜索提供更好的检索性能,并通过一个示例进行了演示,背景大型语言模型,LLM,的核心用例之一是针对自己的数据进行问答,为此,我们将LLM与,检索,模型配对,该模型可以对知识语料库执行信息检索,并使用LLM对检索到的文...
-
评估RAG系统组件的终极指南
RAG系统包含两个核心组件,检索器和生成器,本文将介绍如何评估这两个组件,检索增强型生成,RAG,系统被设计用来提升大型语言模型,LLM,的响应质量,当用户提交查询时,RAG系统从向量数据库中提取相关信息,并将其作为场景传递给LLM,然后,LLM使用这个场景为用户生成响应,这一过程显著提高了LLM反...
-
大模型检索增强 技术之 RAG
RAG技术的重难点,是怎么更高效和更准确的检索数据,知识库技术作为大模型技术的一个重要应用方向,也是对大模型技术的一个重要补充;特别是在问答系统,如智能客服等领域,知识库有着非同一般的作用,从技术的角度来说,一个智能客服的好坏,除了大模型本身的质量之外,更多的是由知识库决定的,因此,知识库的作用不言...
-
如何使用HippoRAG增强LLM的记忆
译者,李睿审校,重楼大型语言模型,LLM,已经证明是一种非常宝贵的思考工具,经过大量文本、代码和其他媒体数据集的训练,它们能够创作出接近人类水平的文章、翻译语言、生成图像,还能以信息丰富的方式回答人们提出的问题,甚至可以编写不同类型的创意内容,但是,尽管它们功能强大,即使是最先进的LLM也有一个基本...
-
TSLANet 时间序列模型的新构思
时间序列数据具有内在的长程和短程依赖性,对分析应用提出了独特的挑战,虽然基于Transformer的模型擅长捕获长程依赖关系,但它们在噪声灵敏度、计算效率和与较小数据集的过度拟合方面存在局限性,本次的研究人员引入了一种新颖的时间序列轻量级自适应网络,TSLANet,,作为各种时间序列任务的通用卷积模...
-
1.5开源来袭 Jamba前生今世
Jamba算是世界上第一款基于Mamba的生产级别的模型,近日AI21Labs发布Jamba1.5系列开放模型,包括Jamba1.5Mini和Jamba1.5Large,这些模型建立在新颖的SSM,Transformer架构之上,某种意义上也算是AI技术的突破,Jamba1.5创新的核心是其令人印象...
-
白话ZeRO 优雅谈大模型 上
并行策略正如和分布式一样,如何利用多设备和多硬件也是很重要的一个环节,大模型训练也是如此,如今训练大模型离不开各种分布式并行策略,常用的并行策略包括,下图为其中一种算法,将所有的梯度分为五份,然后按照圆圈的方式传播,而不是广播数据,累加,直到每个GPU都完成一个部分的累加,然后再批量同步数据,经过五...
-
评估角色agent与LLMs PersonaGym
一、结论写在前面论文来自卡内基梅隆大学,伊利诺伊大学芝加哥分校,佐治亚理工学院,普林斯顿大学等等论文标题,PersonaGym,EvaluatingPersonaAgentsandLLMs论文链接,https,arxiv.org,pdf,2407.18416角色agent,即根据指定角色行事...
-
阿里巴巴达摩院 新加坡科技设计大学和南洋理工大学联合团队提升AI多步推理能力的新方法
大模型在处理更复杂的问题时,仍然容易在推理过程中出现错误,导致推理路径偏离,最终影响模型的整体性能,现有的大语言模型在多步推理任务中,通常会由于推理路径中某一步骤的错误而影响整个推理过程,这些错误不仅降低了模型的准确性,还增加了计算成本和执行延迟,传统的方法如强化学习需要复杂的奖励模型,而其他偏好优...
-
最强图像大模型Phi
微软推出的Phi,3.5,vision,把人工智能带到了成长的新阶段,这款AI模型擅长处理文本和图像,为图像识别和自动文字识别等任务带来创新的解决思路,本文介绍Phi,3.5,vision的技术亮点及其在实际场景中的应用,一、Phi,3.5,vision核心特性和功能Phi,3.5,vision处理...
-
含代码 RAG高级优化 检索策略探讨Fusion HyDE安排上
传统的检索方法通常依赖于对query进行语义理解,基于向量,或关键字匹配,BM25,,这两种方法都有其优点和缺点,融合检索、HyDE和RAG,Fusion可以创建一个更健壮和准确的检索系统,本文将介绍三种优化方法,高级RAG技术介绍FusionRetrieval融合检索是一种强大的文档搜索方法,它结...
-
LangGraph实战 从零分阶打造人工智能航空客服助手
客服助手机器人能够帮助团队更高效地处理日常咨询,但要打造一个能够稳定应对各种任务且不会让用户感到烦恼的机器人并非易事,完成本教程后,你不仅会拥有一个功能完备的机器人,还将深入理解LangGraph的核心理念和架构设计,这些知识将帮助你在其他人工智能项目中运用相似的设计模式,由于内容较多,本文将由浅入...
-
更强 更快 更经济!超越GraphRAG的大模型RAG系统LightRAG开源啦!
LightRAG增强了分段检索系统将文档转换为更小、更易于管理的片段,此策略允许快速识别和访问相关信息,而无需分析整个文档,接下来,我们利用LLMs来识别和提取各种实体,例如名称、日期、位置和事件,以及它们之间的关系,这通过此收集的信息进程将用于创建一个全面的知识图谱,该图谱突出显示跨整个文档集合,...
-
通用3D 生成任意3D和4D场景!GenXD
文章链接,https,arxiv.org,pdf,2411.02319项目链接,https,gen,x,d.github.io,亮点直击总结速览解决的问题现有的2D视觉生成已取得显著进展,但3D和4D生成在实际应用中仍然面临挑战,主要由于缺乏大规模4D数据和有效的模型设计,提出的方案应用的技术达到的...