混元_第19页_坚曼百货商行

比LangChain轻量！ 5大组件 FlashRAG 12种RAG技术 32个数据集的开源框架

FlashRAG是一个用于复制和开发检索增强生成，RAG，研究的Python工具包，它包括32个预处理的基准RAG数据集、13种最先进的RAG算法，5大RAG组件，包括检索器、重排器、生成器、精炼器、评测器，借助FlashRAG和提供的资源，可以轻松地复制RAG领域的现有SOTA，最先进，工作，或者...

2024-11-15 179

玩具模型

如何高效定制视频扩散模型卡内基梅隆提出VADER 通过奖励梯度进行视频扩散对齐

论文链接，https，arxiv.org，pdf，2407.08737git链接，https，vader，vid.github.io，目前已经在建立基础视频扩散模型方面取得了显著进展，由于这些模型是使用大规模无监督数据进行训练的，因此将这些模型调整到特定的下游任务变得至关重要，通过监督微调来适应这些...

2024-11-15 794

家电数码

DR

1.DR，RAG有多厉害，上面两个表分别展示了DR，RAG与其他几个当前流行的RAG框架对比的效果，特别是AdaptiveRAG，可以看到，在多个测试数据集上，DR，RAG要比其他框架，比如，AdaptiveRAG和SelfRAG，准确率都要更高，而且在相同TopK参数的前提下，DR，RAG的召回率...

2024-11-15 934

数码资讯

苏黎世联邦实现虚拟人超灵活抓取 Meta&amp 具身智能又进一步！卡内基梅隆&amp

论文链接，https，arxiv.org，pdf，2407.11385github链接，https，www.zhengyiluo.com，Omnigrasp，Site，亮点直击本文提出了一种控制虚拟人形抓取物体并沿着物体轨迹移动的方法，由于控制具有灵巧手的人形存在挑战，先前的方法通常使用无身体的手，...

2024-11-15 926

生活科普

视频生成和具身智能强强联合！谷歌&amp 卡内基梅隆&amp 斯坦福发布Gen2Act 泛化超棒！

文章链接，https，arxiv.org，pdf，2409.16283项目链接，https，homangab.github.io，gen2act，亮点直击总结速览解决的问题机器人操作策略在面对新任务时，往往难以处理未见过的物体类型和新动作，由于机器人数据采集成本高，如何实现操作策略的泛化是一个关键挑...

2024-11-15 167

资讯

基于LLM的多Agent框架在金融市场数据的应用

架构上图展示了本文的整体架构，结合了传统的统计技术和大型语言模型驱动的多智能体系统，首先利用从简单的规则、无监督学习和深度学习技术等现有手段，对金融表格数据中的异常进行识别，异常识别后，将数据传到LLM多智能体系统中，整个系统包括，数据转换Agent、数据专家Agent、报告整合Agent、管理层讨...

2024-11-15 550

数码资讯

卡内基梅隆&amp 北大&amp FGM 刷新流匹配模型单步文本到图像生成纪录！浙大&amp 西湖大学

文章链接，https，arxiv.org，pdf，2410.19310亮点直击总结速览解决的问题在AIGC领域中，流匹配模型因其坚实的理论基础和强大的大规模生成能力而取得了显著成功，然而，这些模型的采样过程对计算资源要求极高，因为它们需要多步数值常微分方程，ODEs，的计算，提出的方案本文提出了一种...

2024-11-15 744

其他百货

清华大学最新深度时序模型综述 star开源代码！ 5k

今天给大家介绍一篇清华大学关于深度时序模型的最新综述性工作，这篇文章的着眼点是深度时间序列模型的模型结构方面，提供了各类时间序列问题的深度学习模型结构发展过程和效果对比，并提供了一套复现各类深度时序模型的开源代码，目前git上已经5k，个star，下面整体介绍一下本文的核心内容，包括任务类型、基础模...

2024-11-15 416

科技

一篇大模型RAG最新综述

好久没分享过综述了，今天分享一个最新的RAG综述，来自卡内基梅隆大学，标题，AComprehensiveSurveyofRetrieval，AugmentedGeneration，RAG，Evolution，CurrentLandscapeandFutureDirections1.引言1.1RAG技...

2024-11-15 586

头条

一种模块化大模型Agent框架全栈技术综述

现有基于LLM的智能体虽然在功能上取得了进展，但缺乏模块化，导致在研究和开发中存在术语和架构上的混淆，在软件架构上缺乏统一，AsurveyonLLMbasedautonomousagents，提出的框架，它并没有明确指出大型语言模型，LLM，、工具、数据源和记忆是否是Agent的一部分，这种对每个模...

2024-11-15 637

娱乐

效果提升明显清华大学&amp 面壁智能提出了一种新的RAG思路 VisRAG

1.为啥要提出VisRAG，检索增强生成，Retrieval，augmentedgeneration，RAG，已经成为解决LLM幻觉和知识更新的经典方案，典型的RAG流程是基于文本的，以下简称TextRAG，，以分割后的文本作为检索单元，但是在真实场景中，知识往往以多模态的形式出现，比如教科书、手册...

2024-11-15 696

新闻资讯

效果超越Gen 10倍速度突破质量瓶颈

论文链接，https，arxiv.org，pdf，2405.18750项目链接，https，t2v，turbo.github.io，基于扩散的文本到视频，T2V，模型取得了显著的成功，但仍然受到迭代采样过程速度缓慢的影响，为了解决这一挑战，一些一致性模型被提出来促进快速推理，尽管以牺牲样本质量为代价...

2024-11-15 154

行业热门

微软 RAG并不是你唯一的解决方案！

将外部数据整合到LLMs中的技术，如检索增强生成，RAG，和微调，得到广泛应用，但在不同专业领域有效部署数据增强LLMs面临着重大挑战，数据增强LLM应用中不同查询层次的主要技术总结微软亚洲研究院，MSRA，提出了一种RAG任务分类方法，根据所需的外部数据类型和任务的主要焦点，将用户查询分为四个层...

2024-11-15 252

饰品装饰

YOLOv9 深度解析新一代实时目标检测王者

随着人工智能技术的飞速发展，计算机视觉领域迎来了一个又一个里程碑式的突破，其中，实时目标检测作为计算机视觉的重要分支，更是取得了举世瞩目的成就，在众多实时目标检测模型中，YOLO系列凭借其卓越的性能和广泛的应用场景，一直是业界的佼佼者，而今天，我们将要探讨的，正是YOLO系列中的最新成员——YOLO...

2024-11-15 866

娱乐八卦

LLM落地淘宝电商搜索场景显著提升长尾query改写效果

LLM是目前学术界研究的热点，同时工业界也在快速探索LLM在业务中的落地，本篇文章给大家介绍来自WWW24的一篇文章，介绍了淘宝电商将LLM用在了搜索场景中的query改写上，精心构建的领域特定数据集对LLM进行finetue，定义三种不同的优化目标并使用PreferenceRankOptimiza...

2024-11-15 647

包含"混元"标签的文章