<img src="/uploads/allimg/20241024/1-241024162505117.png" alt="坚曼百货商行">

Liquid 液态智能的新篇章 AI发布液态基础模型

01概述在人工智能的世界里，每一轮技术革新都可能颠覆我们对未来的认知，今天，我们要探讨的正是液态智能，LiquidAI，公司带来的全新系列——液态基础模型，LiquidFoundationModels，简称LFMs，这不仅是一次简单的产品迭代，更是一场关于AI模型性能与效率的革命，液态基础模型，性能...

2024-11-14 629

Berkeley 对不相关的RAG检索结果进行建模 RAFT UC

大家好，我是HxShine，今天推荐一篇UCBerkeley的一篇RAG效果优化的文章～大模型引入新的知识一般有两个途径，一种是RAG检索增强，一种是SFT，哪种方式效果比较好呢，或者说有没有一些其他的更为有效的方式呢，这篇论文介绍了一种新的训练方法——检索增强型微调，RAFT，RetrievalA...

2024-11-14 991

EMNLP 2023

一、概述PromptMix，AClassBoundaryAugmentationMethodforLargeLanguageModelDistillationhttps，arxiv.org，abs，2310.14192代码，https，github.com，servicenow，prom...

2024-11-14 761

一文总结扩散模型 Diffusion 在时间序列中的应用 Model

扩散模型是目前生成式AI中的最核心模块，在Sora、DALL，E、Imagen等生成式AI大模型中都取得了广泛的应用，与此同时，扩散模型也被越来越多的应用到了时间序列中，这篇文章给大家介绍了扩散模型的基本思路，以及几篇扩散模型用于时间序列的典型工作，带你理解扩散模型在时间序列中的应用原理，扩散模型建...

2024-11-14 389

KDD24大厂推荐系统优化工作总结

今天这篇文章给大家介绍几篇KDD2024中，大厂在推荐系统领域的优化工作，论文来自爱彼迎、腾讯、快手、美团等公司，设计多目标建模、多样性、搜索意图建模、rankingloss等问题，爱彼迎，多目标建模和模型蒸馏论文标题，Multi，objectiveLearningtoRankbyModelDist...

2024-11-14 928

支持大模型流式输出的JSON提取工具

在我们日常处理大模型的输出时，经常希望输出的结果为结构化的，例如输出json格式，，这样有助于我们进行结果的后处理，但是在模型输出超过限制和流式输出时就会遇到问题了，由于答案没完全输出，转json就存在问题，...。...

2024-11-14 965

智能推理新路径组合优化在生成式AI中的前沿探索

尽管LLMs在生成自然语言文本方面表现出色，但在推理任务中的表现却不尽如人意，推理任务需要模型具备更高层次的认知能力，包括逻辑推理、因果关系分析和战略规划等，然而现有的LLMs在这些方面的能力有限，主要表现在缺乏深度推理能力，LLMs在处理复杂推理任务时，往往依赖于简单的模式匹配和统计规律，缺乏真正...

2024-11-14 636

效果预训练&amp OLMoE 开源的MoE语言模型

论文标题，OLMoE，OpenMixture，of，ExpertsLanguageModels论文链接，https，arxiv.org，pdf，2409.02060Weights，https，hf.co，allenai，OLMoE，1B，7B，0924Data，https，hf....

2024-11-14 533

o1复制之旅有点燃 327个样本打破常规这个OpenAI

1、327个样本打破常规，这个OpenAIo1复制之旅有点燃人工智能领域最近又掀起一阵波澜——OpenAI发布了令人瞩目的O1模型，然而，这个模型的具体细节却如同蒙着面纱一般神秘，面对这种情况，一群研究者决定开启了一场别开生面的O1复制之旅，试图揭开这层面纱，最引人注目的是，研究团队提出了一个创新的...

2024-11-14 643

大模型的分类

明白模型的类型，才能明白模型的应用，在学习机器学习的过程中，生成式模型和判别式模型是两个经典类型的模型，弄明白两者之间的联系与区别是一个非常重要的事情，也会加深对大模型的理解，那么什么是生成模型和判别模型呢，生成式模型和判别式模型的区别与联系生成式模型和判别式模型是两种不同的机器学习类型，它们之间具...

2024-11-14 803

新能源产业链看过来！碳视野欧盟关键原材料法案生效！

一、政策背景3月18日，欧盟理事会批准了，关键原材料法案，CRMA，，以确保对绿色转型、数字工业和国防部门至关重要的原材料的可持续供应，该法案旨在，增加欧盟当地关键原材料供应量和多样性；加强包括可回收材料在内的循环材料的使用；支持资源增效和替代品开发方面的研究和创新，此外还将加强欧洲的战略自主权，图...

2024-11-14 616

15大结构梳理CNN网络的发展

CNN基本部件介绍1.局部感受野在图像中局部像素之间的联系较为紧密，而距离较远的像素联系相对较弱，因此，其实每个神经元没必要对图像全局进行感知，只需要感知局部信息，然后在更高层局部信息综合起来即可得到全局信息，卷积操作即是局部感受野的实现，并且卷积操作因为能够权值共享，所以也减少了参数量，2.池化池...

2024-11-14 383

Google开源大模型新成员CodeGemma RecurrentGemma 继Transformer后新架构Griffin诞生

2024年2月，Google推出了Gemma，一系列轻量级、先进的开源大模型，这些模型是使用创建Gemini模型时所使用的相同研究和技术构建的，近日，Google宣布了Gemma家族的首批新增成员，为机器学习开发者扩展了创新责任的可能性，用于代码补全和生成任务以及指令跟随，以及RecurrentGe...

2024-11-14 440