大模型_第54页_坚曼百货商行

FoundTS 时间序列预测基础模型的全面统一测评基准

今天给大家介绍一篇华东师范大学联合丹麦奥尔堡大学和松鼠AI发布的时间序列模型统一评测基准FoundTS，这是一个针对时间序列预测基础模型的基准测评框架，旨在利用不同领域和特征的数据集对不同的时间序列预测基础模型进行全面、公平的测评，该论文在统一评测结果的基础上，分析了现有时序预测基础模型的优缺点，并...

2024-11-14 606

母婴用品

适用各类数据集上下文长度首次扩展至千级别统一时序预测模型清华大学最新发布

今天给大家介绍一篇清华大学的时间序列预测最新工作，提出了统一的Transformer时序预测模型，能同时处理单变量和多变量时序预测，并将时序预测的上下文长度首次扩充到千级别，论文标题，TIMER，XL，LONG，CONTEXTTRANSFORMERSFORUNIFIEDTIMESERIESFOREC...

2024-11-14 550

行业热门

纯Transformer架构多个数据集取得SOTA效果上交最新时空预测模型PredFormer

今天给大家介绍一篇时空预测最新模型PredFormer，由上海交大等多所高校发表，采用纯Transformer模型结构，在多个数据集中取得SOTA效果，背景时空预测学习是一个拥有广泛应用场景的领域，比如天气预测，交通流预测，降水预测，自动驾驶，人体运动预测等，提起时空预测，不得不提到经典模型Conv...

2024-11-14 420

科技

个性化在CTR预估中的经典方法和效果对比一文总结特征增强&amp

在CTR预估中，主流都采用特征embedding，MLP的方式，其中特征非常关键，然而对于相同的特征，在不同的样本中，表征是相同的，这种方式输入到下游模型，会限制模型的表达能力，为了解决这个问题，CTR预估领域提出了一系列相关工作，被称为特征增强模块，特征增强模块根据不同的样本，对embedding...

2024-11-14 707

娱乐

KDD24大厂推荐系统优化工作总结

今天这篇文章给大家介绍几篇KDD2024中，大厂在推荐系统领域的优化工作，论文来自爱彼迎、腾讯、快手、美团等公司，设计多目标建模、多样性、搜索意图建模、rankingloss等问题，爱彼迎，多目标建模和模型蒸馏论文标题，Multi，objectiveLearningtoRankbyModelDist...

2024-11-14 928

数码资讯

一文汇总长周期时序预测有哪些优化点

长周期时序预测核心问题长周期时间序列预测，指的是预测窗口较长一类时间序列预测问题，一般来说，预测长度在50个点以上，就可以认为是长周期时间序列预测问题，同时，预测长度的增加，会使得模型需要引入更长的历史序列，才能实现更好的预测，相比短周期时序预测，长周期时序预测主要面临的挑战有以下几个方面，长周期历...

2024-11-14 612

头条

多专家CLIP实现细粒度多模态表征学习多阶段对比学习

今天给大家介绍一篇港中文、上海AILab等机构联合发表的CLIP优化工作，构建了基于多专家网络的MoE模型，实现更细粒度的视觉表征器训练，提升下游多模态大模型论文标题，CLIP，MOE，TOWARDSBUILDINGMIXTUREOFEXPERTSFORCLIPWITHDIVERSIFIEDMULT...

2024-11-14 786

百货

检索后处理模块成竹在胸 RAG高级优化

通过上文的方法RAG高级优化，一文看尽query的转换之路，我们召回了一些相关片段，本文我们将介绍在将召回片段送入大模型之前的一些优化手段，它们能帮助大模型更好的理解上下文知识，给出最佳的回答，Long，textReorder根据论文LostintheMiddle，HowLanguageMo...

2024-11-14 888

其他百货

颠覆传统OCR轻松搞定复杂PDF的工具

LLM辅助OCR项目是一个先进的系统，旨在显著提高光学字符识别，OCR，输出的质量，通过利用尖端的自然语言处理技术和大型语言模型，LLM，，将原始OCR文本转换为高度准确、格式良好且可读的文档成为可能，本篇文章将介绍一款在github上拥有1.7kstar的开源实现工具LLM，AidedOCR，本项...

2024-11-14 903

百货快讯

RAG文本切分LV3 轻松定制Markdown切分

分块通常旨在将具有共同上下文的文本放在一起，考虑到这一点，我们可能希望特别尊重文档本身的结构，例如，markdown文件按标题组织，在特定标题组中创建块是一种直观的想法，为了解决这一挑战，我们可以使用MarkdownHeaderTextSplitter，这将按指定的一组标题拆分markdown文件，...

2024-11-14 235

家电数码

含代码 RAG高级优化检索策略探讨Fusion HyDE安排上

传统的检索方法通常依赖于对query进行语义理解，基于向量，或关键字匹配，BM25，，这两种方法都有其优点和缺点，融合检索、HyDE和RAG，Fusion可以创建一个更健壮和准确的检索系统，本文将介绍三种优化方法，高级RAG技术介绍FusionRetrieval融合检索是一种强大的文档搜索方法，它结...

2024-11-14 493

娱乐八卦

支持大模型流式输出的JSON提取工具

在我们日常处理大模型的输出时，经常希望输出的结果为结构化的，例如输出json格式，，这样有助于我们进行结果的后处理，但是在模型输出超过限制和流式输出时就会遇到问题了，由于答案没完全输出，转json就存在问题，...。...

2024-11-14 965

包包服装

简单策略解决CTR模型训练一轮过拟合问题

今天这篇文章给大家介绍一下推荐系统中预估模型的one，epoch问题，以及相应的解法，主要来源于两项工作，一个是由阿里发表的论文TowardsUnderstandingtheOverfittingPhenomenonofDeepClick，ThroughRatePredictionModels，20...

2024-11-14 1006