娱乐
-
LangChain应用开发指南
在AI的发展中,大规模语言模型已经取得了令人瞩目的成果,然而,随之而来的是模型质量和不确定性的问题,如何衡量和改进模型的质量,一直是我们面临的一个挑战,为了解决这些问题,我们将在这篇文章中,介绍LangChain框架和TruLens工具,它们将帮助我们评估模型的质量,提高模型质量,并能够用量化的方法...
-
基于开源AI数据框架LlamaIndex构建上下文增强型LLA应用
译者,朱先忠审校,重楼引言,将你的企业数据转化为可用于实际生产环境的LLM应用程序,,LlamaIndex主页用60号字体这样高亮显示,其副标题是,LlamaIndex是构建LLM应用程序的领先数据框架,我不太确定它是否是业内领先的数据框架,但我认为它是一个与LangChain和...
-
Amazon 为消除幻觉 连接器! Bedrock开大招! RAG 推出上下文基础和
本周三,亚马逊网络服务,AWS,宣布更新其生成式AI开发服务AmazonBedrock,增加了新的上下文基础功能、检索增强生成,RAG,的连接器以及其他大型语言模型,LLM,据亚马逊生成式人工智能副总裁瓦西·菲洛明,VasiPhilomin,称,这些更新有望简化企业基于生成式人工智能的应用程序的开发...
-
解锁大模型的 白话EAGLE2 打草稿 技术
实时了解业内动态,论文是最好的桥梁,专栏精选论文重点解读热点论文,围绕着行业实践和工程量产,若在某个环节出现卡点,可以回到大模型必备腔调或者LLM背后的基础模型重新阅读,而最新科技,Mamba,xLSTM,KAN,则提供了大模型领域最新技术跟踪,1.总览EAGLE,2EAGLE,2是一种加速...
-
文本直接生成多视角3D图像 Meta推出创新模型
随着扩散模型的不断创新,文生图领域出现了Midjourney、StableDiffusion、DALL,E3等一系列知名产品,但在文本生成多视角3D图像方面一直存在诸多技术难点,Meta和德国慕尼黑工业大学的研究人员联合开发了创新模型——ViewDiff,用户通过文本、图像或二者结合使用,就能生成高...
-
港中文联手华为推出3D自动驾驶场景生成模型 港科& 无需3D数据也能训练
无需采集3D数据,也能训练出高质量的3D自动驾驶场景生成模型,这是来自香港中文大学、香港科技大学和华为诺亚方舟实验室的最新研究成果——针对自动驾驶街景的可控3D场景生成方法,MagicDrive3D,此前,采用常见的2D自动驾驶数据集来生成3D街景的方法不是没有,但受采集角度所限,生成结果的可控性和...
-
基础架构 多模态大模型
大模型技术论文不断,每个月总会新增上千篇,本专栏精选论文重点解读,主题还是围绕着行业实践和工程量产,若在某个环节出现卡点,可以回到大模型必备腔调或者LLM背后的基础模型重新阅读,而最新科技,Mamba,xLSTM,KAN,则提供了大模型领域最新技术跟踪,若对于具身智能感兴趣的请移步具身智能专栏,技术...
-
学习挑战赛 任务进阶 完成就有奖品拿
邀请关注大模型、AIGC的开发者朋友们在此集结,参与社群打卡、直播周、技术沙龙、征文等多个活动,设置任务进阶奖励,完成任务就有奖品拿,此外还可参加抽奖、红包领取等各类活动,活动时间10.15,10.26活动介绍基础任务,参与即获奖在社区帖子,点击直达,下点赞并评论区回复任何内容,即可获得一份...
-
Llama提速500%!谷歌美女程序员手搓矩阵乘法内核
谷歌的美女程序员,将Llama的推理速度提高了500%!近日,天才程序员JustineTunney发推表示自己更新了Llamafile的代码,她重写了84个新的矩阵乘法内核,使得Llamafile可以更快地读取提示和图像,与llama.cpp相比,新的Llamafile在CPU上的推理速度提升了30...
-
自我一致性提升大模型中的思维链推理能力
摘要,结合预训练大型语言模型的链式思考提示在复杂推理任务上已取得令人鼓舞的成果,本文提出了一种新的解码策略——自我一致性,以替代链式思考提示中使用的朴素贪婪解码,该策略首先采样一套多样化的推理路径,而非单一的贪心路径,并通过边缘化采样的推理路径来选择最一致的答案,自我一致性利用了这样一种直觉,一个复...
-
系统的回答质量 Prompt RAG 提升 构建高效的
1、Prompt的重要性在RAG,增强检索生成,系统中,打造有效的提示词,Prompt,对于保障大模型输出精准且相关的答案至关重要,提示词不仅负责指导大模型正确解读用户提问,还需整合检索所得的信息,以实现回答的精确性和针对性,接下来,本文将探讨如何在RAG系统中打造高效的提示词,进而提高RAG系统的...
-
增强检索器 阿里RAG新框架R4
大型语言模型,LLMs,在生成文本时可能会产生错误信息,即,幻觉,问题,尽管检索增强的LLMs通过检索外部数据来减少这种幻觉,但现有的方法通常不考虑检索文档与LLMs之间的细粒度结构语义交互,这在处理长文档时尤其影响回答的准确性,不同的检索增强方法范式,包括传统的检索器,响应器方法和增强检索器,重排...
-
RAG Golden Agentic
企业落地RAG系统痛点,Golden,Retriever系统,在文档检索前增加了一个基于反思的问题增强步骤,用于识别术语、根据上下文澄清其含义,并相应地增强问题,一个比较Golden,Retriever与相关工作的示意图,两种类型的方法,离线和在线,在左上角,现有的离线方法使用大型语言模型,LLMs...
-
比LangChain轻量! 5大组件 FlashRAG 12种RAG技术 32个数据集的开源框架
FlashRAG是一个用于复制和开发检索增强生成,RAG,研究的Python工具包,它包括32个预处理的基准RAG数据集、13种最先进的RAG算法,5大RAG组件,包括检索器、重排器、生成器、精炼器、评测器,借助FlashRAG和提供的资源,可以轻松地复制RAG领域的现有SOTA,最先进,工作,或者...
-
09 技术综述 Advanced RAG 提示词压缩
作者,FlorianJune编译,岳扬RAG方法可能会面临两大挑战,为了解决上述问题,LLM的提示词压缩技术,Promptcompression,应运而生,从本质上讲,其目的是精炼提示词中的关键信息,使得每个输入的词元,inputtokens,都承载更多价值,从而提升模型效率并还能控制成本,这一理念...