娱乐

Berkeley 对不相关的RAG检索结果进行建模 RAFT UC

大家好，我是HxShine，今天推荐一篇UCBerkeley的一篇RAG效果优化的文章～大模型引入新的知识一般有两个途径，一种是RAG检索增强，一种是SFT，哪种方式效果比较好呢，或者说有没有一些其他的更为有效的方式呢，这篇论文介绍了一种新的训练方法——检索增强型微调，RAFT，RetrievalA...

2024-11-14 985

生活科普

EMNLP 2023

一、概述PromptMix，AClassBoundaryAugmentationMethodforLargeLanguageModelDistillationhttps，arxiv.org，abs，2310.14192代码，https，github.com，servicenow，prom...

2024-11-14 758

娱乐

一文总结扩散模型 Diffusion 在时间序列中的应用 Model

扩散模型是目前生成式AI中的最核心模块，在Sora、DALL，E、Imagen等生成式AI大模型中都取得了广泛的应用，与此同时，扩散模型也被越来越多的应用到了时间序列中，这篇文章给大家介绍了扩散模型的基本思路，以及几篇扩散模型用于时间序列的典型工作，带你理解扩散模型在时间序列中的应用原理，扩散模型建...

2024-11-14 385

娱乐

KDD24大厂推荐系统优化工作总结

今天这篇文章给大家介绍几篇KDD2024中，大厂在推荐系统领域的优化工作，论文来自爱彼迎、腾讯、快手、美团等公司，设计多目标建模、多样性、搜索意图建模、rankingloss等问题，爱彼迎，多目标建模和模型蒸馏论文标题，Multi，objectiveLearningtoRankbyModelDist...

2024-11-14 922

娱乐八卦

支持大模型流式输出的JSON提取工具

在我们日常处理大模型的输出时，经常希望输出的结果为结构化的，例如输出json格式，，这样有助于我们进行结果的后处理，但是在模型输出超过限制和流式输出时就会遇到问题了，由于答案没完全输出，转json就存在问题，...。...

2024-11-14 957

生活科普

智能推理新路径组合优化在生成式AI中的前沿探索

尽管LLMs在生成自然语言文本方面表现出色，但在推理任务中的表现却不尽如人意，推理任务需要模型具备更高层次的认知能力，包括逻辑推理、因果关系分析和战略规划等，然而现有的LLMs在这些方面的能力有限，主要表现在缺乏深度推理能力，LLMs在处理复杂推理任务时，往往依赖于简单的模式匹配和统计规律，缺乏真正...

2024-11-14 632

娱乐八卦

效果预训练&amp OLMoE 开源的MoE语言模型

论文标题，OLMoE，OpenMixture，of，ExpertsLanguageModels论文链接，https，arxiv.org，pdf，2409.02060Weights，https，hf.co，allenai，OLMoE，1B，7B，0924Data，https，hf....

2024-11-14 529

娱乐

o1复制之旅有点燃 327个样本打破常规这个OpenAI

1、327个样本打破常规，这个OpenAIo1复制之旅有点燃人工智能领域最近又掀起一阵波澜——OpenAI发布了令人瞩目的O1模型，然而，这个模型的具体细节却如同蒙着面纱一般神秘，面对这种情况，一群研究者决定开启了一场别开生面的O1复制之旅，试图揭开这层面纱，最引人注目的是，研究团队提出了一个创新的...

2024-11-14 638

娱乐

大模型的分类

明白模型的类型，才能明白模型的应用，在学习机器学习的过程中，生成式模型和判别式模型是两个经典类型的模型，弄明白两者之间的联系与区别是一个非常重要的事情，也会加深对大模型的理解，那么什么是生成模型和判别模型呢，生成式模型和判别式模型的区别与联系生成式模型和判别式模型是两种不同的机器学习类型，它们之间具...

2024-11-14 798

娱乐八卦

新能源产业链看过来！碳视野欧盟关键原材料法案生效！

一、政策背景3月18日，欧盟理事会批准了，关键原材料法案，CRMA，，以确保对绿色转型、数字工业和国防部门至关重要的原材料的可持续供应，该法案旨在，增加欧盟当地关键原材料供应量和多样性；加强包括可回收材料在内的循环材料的使用；支持资源增效和替代品开发方面的研究和创新，此外还将加强欧洲的战略自主权，图...

2024-11-14 609

生活科普

15大结构梳理CNN网络的发展

CNN基本部件介绍1.局部感受野在图像中局部像素之间的联系较为紧密，而距离较远的像素联系相对较弱，因此，其实每个神经元没必要对图像全局进行感知，只需要感知局部信息，然后在更高层局部信息综合起来即可得到全局信息，卷积操作即是局部感受野的实现，并且卷积操作因为能够权值共享，所以也减少了参数量，2.池化池...

2024-11-14 378

娱乐

Google开源大模型新成员CodeGemma RecurrentGemma 继Transformer后新架构Griffin诞生

2024年2月，Google推出了Gemma，一系列轻量级、先进的开源大模型，这些模型是使用创建Gemini模型时所使用的相同研究和技术构建的，近日，Google宣布了Gemma家族的首批新增成员，为机器学习开发者扩展了创新责任的可能性，用于代码补全和生成任务以及指令跟随，以及RecurrentGe...

2024-11-14 436

生活科普

Agent LlamaIndex 的实现深度解析和提升智能代理工作流 Gemini REAcT 利用

01、概述在过去的两三年中，人工智能领域经历了令人瞩目的发展，尤其是在大语言模型、扩散模型和多模态技术等方面，其中，我对智能代理工作流产生了浓厚的兴趣，今年初，Coursera的创始人、深度学习先锋AndrewNg发了一条推特，智能工作流将推动今年的AI巨大发展，自那时起，智能代理领域的进展令人惊叹...

2024-11-14 588

娱乐

HuggingFace模型转一键llamafile包完整教程通义千问成功案例分享

随着通义千问开源版的发布，越来越多的用户希望能在本地部署这款优秀的中文大模型，然而，传统的部署方式往往需要复杂的环境配置，让很多非技术背景的用户望而却步，今天，我要向大家介绍一个革命性的方案，将通义千问转换为Llamafile格式，实现真正的一键运行！有关llamafile的特点，我在上周的文章中做...

2024-11-14 790

生活科普

实现了个ChatGPT趋动的游戏玩得乐此不疲

今天给大家带来一篇，简单实现一个ChatGPT驱动的游戏，文章，来自知乎@九号，已授权，今年四月份读了斯坦福GenerativeAgent的论文，觉得特别好玩，花几天时间实现了这个demo，后来拿着这个demo去参加hackathon，竟然拿了二等奖还帮我赢了1300多刀，最近提到这个demo，同事...

2024-11-14 119

娱乐

联系我们