包含"大模型"标签的文章
-
FoundTS 时间序列预测基础模型的全面统一测评基准
今天给大家介绍一篇华东师范大学联合丹麦奥尔堡大学和松鼠AI发布的时间序列模型统一评测基准FoundTS,这是一个针对时间序列预测基础模型的基准测评框架,旨在利用不同领域和特征的数据集对不同的时间序列预测基础模型进行全面、公平的测评,该论文在统一评测结果的基础上,分析了现有时序预测基础模型的优缺点,并...
-
适用各类数据集 上下文长度首次扩展至千级别 统一时序预测模型 清华大学最新发布
今天给大家介绍一篇清华大学的时间序列预测最新工作,提出了统一的Transformer时序预测模型,能同时处理单变量和多变量时序预测,并将时序预测的上下文长度首次扩充到千级别,论文标题,TIMER,XL,LONG,CONTEXTTRANSFORMERSFORUNIFIEDTIMESERIESFOREC...
-
推荐系统中多任务学习的优化思路 一文汇总
多任务学习是推荐系统中非常常见的一个问题,推荐系统中,经常要对多个目标进行预测,比如点击率、转化率、观看时长等等,将这些任务联合学习,希望通过不同的监督信息,互相增强各自目标的拟合能力,但是同时,不同目标之间又不一定是正向关系,可能存在负向迁移问题,存在跷跷板现象,因此,如何最好的发挥多任务学习的...
-
纯Transformer架构 多个数据集取得SOTA效果 上交最新时空预测模型PredFormer
今天给大家介绍一篇时空预测最新模型PredFormer,由上海交大等多所高校发表,采用纯Transformer模型结构,在多个数据集中取得SOTA效果,背景时空预测学习是一个拥有广泛应用场景的领域,比如天气预测,交通流预测,降水预测,自动驾驶,人体运动预测等,提起时空预测,不得不提到经典模型Conv...
-
个性化在CTR预估中的经典方法和效果对比 一文总结特征增强&
在CTR预估中,主流都采用特征embedding,MLP的方式,其中特征非常关键,然而对于相同的特征,在不同的样本中,表征是相同的,这种方式输入到下游模型,会限制模型的表达能力,为了解决这个问题,CTR预估领域提出了一系列相关工作,被称为特征增强模块,特征增强模块根据不同的样本,对embedding...
-
KDD24大厂推荐系统优化工作总结
今天这篇文章给大家介绍几篇KDD2024中,大厂在推荐系统领域的优化工作,论文来自爱彼迎、腾讯、快手、美团等公司,设计多目标建模、多样性、搜索意图建模、rankingloss等问题,爱彼迎,多目标建模和模型蒸馏论文标题,Multi,objectiveLearningtoRankbyModelDist...
-
一文汇总 长周期时序预测有哪些优化点
长周期时序预测核心问题长周期时间序列预测,指的是预测窗口较长一类时间序列预测问题,一般来说,预测长度在50个点以上,就可以认为是长周期时间序列预测问题,同时,预测长度的增加,会使得模型需要引入更长的历史序列,才能实现更好的预测,相比短周期时序预测,长周期时序预测主要面临的挑战有以下几个方面,长周期历...
-
多专家CLIP实现细粒度多模态表征学习 多阶段对比学习
今天给大家介绍一篇港中文、上海AILab等机构联合发表的CLIP优化工作,构建了基于多专家网络的MoE模型,实现更细粒度的视觉表征器训练,提升下游多模态大模型论文标题,CLIP,MOE,TOWARDSBUILDINGMIXTUREOFEXPERTSFORCLIPWITHDIVERSIFIEDMULT...
-
检索后处理模块成竹在胸 RAG高级优化
通过上文的方法RAG高级优化,一文看尽query的转换之路,我们召回了一些相关片段,本文我们将介绍在将召回片段送入大模型之前的一些优化手段,它们能帮助大模型更好的理解上下文知识,给出最佳的回答,Long,textReorder根据论文LostintheMiddle,HowLanguageMo...
-
颠覆传统OCR轻松搞定复杂PDF的工具
LLM辅助OCR项目是一个先进的系统,旨在显著提高光学字符识别,OCR,输出的质量,通过利用尖端的自然语言处理技术和大型语言模型,LLM,,将原始OCR文本转换为高度准确、格式良好且可读的文档成为可能,本篇文章将介绍一款在github上拥有1.7kstar的开源实现工具LLM,AidedOCR,本项...
-
RAG文本切分LV3 轻松定制Markdown切分
分块通常旨在将具有共同上下文的文本放在一起,考虑到这一点,我们可能希望特别尊重文档本身的结构,例如,markdown文件按标题组织,在特定标题组中创建块是一种直观的想法,为了解决这一挑战,我们可以使用MarkdownHeaderTextSplitter,这将按指定的一组标题拆分markdown文件,...
-
含代码 RAG高级优化 检索策略探讨Fusion HyDE安排上
传统的检索方法通常依赖于对query进行语义理解,基于向量,或关键字匹配,BM25,,这两种方法都有其优点和缺点,融合检索、HyDE和RAG,Fusion可以创建一个更健壮和准确的检索系统,本文将介绍三种优化方法,高级RAG技术介绍FusionRetrieval融合检索是一种强大的文档搜索方法,它结...
-
支持大模型流式输出的JSON提取工具
在我们日常处理大模型的输出时,经常希望输出的结果为结构化的,例如输出json格式,,这样有助于我们进行结果的后处理,但是在模型输出超过限制和流式输出时就会遇到问题了,由于答案没完全输出,转json就存在问题,...。...
-
简单策略解决CTR模型训练一轮过拟合问题
今天这篇文章给大家介绍一下推荐系统中预估模型的one,epoch问题,以及相应的解法,主要来源于两项工作,一个是由阿里发表的论文TowardsUnderstandingtheOverfittingPhenomenonofDeepClick,ThroughRatePredictionModels,20...
-
彻底改变交互的九大基于语音的生成式AI助手
译者,布加迪审校,重楼基于语音的生成式AI助手正在悄然改变我们与技术交互的方式,取得了微妙而又重大的进步,这些AI助手不再只是响应命令,而是变得更直观简单、更有同理心,还能够理解复杂的人类情感和环境,虽然进展似乎是渐进式的,但AI助手的功能在迅速增强,本文深入介绍了几款领先的基于语音的生成式AI助手...