娱乐八卦
-
聊聊Meta近期的推荐系统大模型
最近,Meta发表了两篇和推荐系统相关的大模型工作,这类工作不是讲NLP等领域的大模型应用到推荐系统,而是直接使用推荐系统的数据训练大模型,一直以来,阻碍CTR预估等模型朝大模型发展的一个阻碍是,这类模型并不存在像NLP、CV领域模型中的scalinglaw,即模型的效果随着模型尺寸增大、训练数据增...
-
Chatbot 更智能的 GraphRAG 构建更可靠 快速理解
作者,RendyDalimunthe编译,岳扬开发一个能够处理真实问题并给出精准回答的聊天机器人,实属不易,尽管大语言模型已取得重大进展,但如何将这些模型与知识库结合起来,提供可靠且上下文信息丰富的答案,仍是一个待解的难题,PhotobyGoogleDeepMind[1]onUnsplash[2]关...
-
浙大等提出MobileVLM 更快 端侧实时运行 V2 更强的端侧视觉语言模型 3B媲美7B!美团
美团、浙大等于近日推出了MobileVLMV2,其中包含参数量1.7B、3B、以及7B的一系列视觉,语言模型,代码与模型以及适配的端侧推理方案都已开源,论文地址,https,arxiv.org,abs,2402.03766模型地址,https,huggingface.co,mtgv代码地址,http...
-
操控AI代理 像Windos一样 开源大模型AI代理操作系统
去年,AutoGPT的出现让我们见识到了AI代理强大的自动化能力,并开创了一个全新的AI代理赛道,但在子任务调度、资源分配以及AI之间协作还有不少的难题,因此,罗格斯大学的研究人员开源了AIOS,这是一种以大模型为核心的AI代理操作系统,可有效解可决随着AI代理的增加,资源调用率低的难题,同时能促进...
-
对比调优 减少多模态模型幻觉 谷歌通过数据增强
随着Gemini、GPT,4o等模型的出现,具备看、听、说的多模态大模型成为了新的主流,由于训练数据复杂、模型架构过于复杂,在生成、识别内容时很容易出现错误描述也称为,幻觉,,例如,当看到一张包含刀、叉和勺子的餐具图片时,模型会错误地描述为牙签,为了解决这个难题,谷歌DeepMind、谷歌云AI研究...
-
LLM 长序列 训练的 Sample Packing 问题及优化 Attention
一、背景之前看过部分Megatron,LM的源码,也详细分析过对应的>,SamplePacking中有很多可以讨论的技术点,比如Attention的实现和优化,Sample的组合及负载均衡问题,有点类似调度问题,以及不同方案对效果的影响等,我们这里只是先简单介绍一下相关问题和实验,后续会...
-
在消费级GPU上奔跑的 瘦子 WordLlama
DavidMiller表示该模型的目标很明确,弥合尖端AI研究和实际应用之间的差距,他认识到,许多现有NLP模型需要大量的计算资源,并且通常局限于专有系统,从而限制了它们的可访问性,作为回应,WordLlama被设计为既轻量级又高效,使更广泛的用户能够在不牺牲质量的情况下将高性能NLP集成到他们的工...
-
ToT 深入理解思维树 策略提示词设计
Prompt的技巧策略应适应LLM大模型框架进行改进,主要框架包括链式思考、思维树和检索增强生成,本文将深入学习思维树,探讨如何建立解决通用问题的语言模型,并使LLM深思熟虑地解决问题,思维树是进化版的提示策略,引入复杂思维结构,以引导模型生成准确、连贯的输出,一、何为思维树,ToT,想象一下,你正...
-
LangGraph实战 可控的AI航空客服助手
当智能助手代表用户执行操作时,用户几乎总是应该对是否执行这些操作拥有最终决定权,否则,即使是智能助手的一点小失误,或是它未能抵御的任何指令注入,都可能对用户造成实际损害,在这部分,我们将利用LangGraph的interrupt,before功能,在执行任何工具之前,暂停流程并把控制权交还给用户,您...
-
Liquid 液态智能的新篇章 AI发布液态基础模型
01概述在人工智能的世界里,每一轮技术革新都可能颠覆我们对未来的认知,今天,我们要探讨的正是液态智能,LiquidAI,公司带来的全新系列——液态基础模型,LiquidFoundationModels,简称LFMs,这不仅是一次简单的产品迭代,更是一场关于AI模型性能与效率的革命,液态基础模型,性能...
-
支持大模型流式输出的JSON提取工具
在我们日常处理大模型的输出时,经常希望输出的结果为结构化的,例如输出json格式,,这样有助于我们进行结果的后处理,但是在模型输出超过限制和流式输出时就会遇到问题了,由于答案没完全输出,转json就存在问题,...。...
-
效果 预训练& OLMoE 开源的MoE语言模型
论文标题,OLMoE,OpenMixture,of,ExpertsLanguageModels论文链接,https,arxiv.org,pdf,2409.02060Weights,https,hf.co,allenai,OLMoE,1B,7B,0924Data,https,hf....
-
新能源产业链看过来! 碳视野 欧盟关键原材料法案生效!
一、政策背景3月18日,欧盟理事会批准了,关键原材料法案,CRMA,,以确保对绿色转型、数字工业和国防部门至关重要的原材料的可持续供应,该法案旨在,增加欧盟当地关键原材料供应量和多样性;加强包括可回收材料在内的循环材料的使用;支持资源增效和替代品开发方面的研究和创新,此外还将加强欧洲的战略自主权,图...
-
大奖征文 AIGC创新先锋者征文大赛悬赏召集
标题带前缀,正文首句,本文正在参与AI.x社区AIGC创新先锋者征文大赛,,并附上本活动链接,合格文章一经发布,即可添加活动小助手咨询获奖详情,...。...
-
手把手教你用LangGraph创建AI智能体 只需8步
AI领域正从基础的RAG系统向更智能的AI智能体进化,后者能处理更复杂的任务并适应新信息,LangGraph作为LangChain库的扩展,助力开发者构建具有状态管理和循环计算能力的先进AI系统,本文教大家如何使用LangGraph开发一个太阳能节能计算的智能体,1LangGraph概述LangGr...