行业热门

  • LLM 在线合并优化器以提升奖励并减轻对齐开销

      一、结论写在前面在强化学习人类反馈,RLHF,中,有效对齐大型语言模型,LLMs,与以人为中心的价值,同时防止通过预训练和监督微调,SFT,获得的能力退化,是一个核心挑战,插值RLIF和SFT模型参数可以调整人类偏好与基本能力之间的权衡,从而以牺牲对齐奖励为代价减少对齐开销,AlignmentTax...

    2024-11-14 318
  • 如何使用NotebookLM制作YouTube视频学习指南

      NotebookLM使用AI来总结和组织要点,可以轻松地用YouTube视频创建学习指南,只需上传视频链接,这个工具就可以帮助你将内容转换成结构化指南,用YouTube视频制作学习指南可能很花时间,但是NotebookLM简化了这项任务,NotebookLM是一个帮助你做笔记和总结的工具,它使用AI...

    2024-11-14 136
  • 两种高效的Rerank模型实践指南 再次提升RAG性能

      在高级RAG应用中,检索后处理环节至关重要,Rerank技术通过重新排序检索出的文档块,确保与用户问题更相关的信息排在前面,从而提高语言模型生成答案的质量,在这个环节中,可以做一些诸如相似度过滤、关键词过滤、chunk内容替换等处理,其中,Rerank,重排序,是一种常见的,也是在RAG应用优化中很...

    2024-11-14 822
  • 六款超火的AI绘图软件推荐!总有一款AI适合你!

      AI绘图软件有推荐吗,随着AI绘图技术的不断发展,AI绘图软件的出现不仅改变了我们传统绘图的方式,而且还为我们的图片创作提供更多的可能性,在艺术作品的创作上轻松愉悦,今天在本文中,我们将为大家介绍六款AI绘图软件,希望能够帮助大家选择到合适的AI绘图工具,AI绘图软件一,AI小聚AI小聚是一款功能多...

    2024-11-14 706
  • 与机器对话 揭示提示工程的十个秘密

      提示工程是说服机器做人类想做之事的最新艺术,本文是关于编写LLM提示必知的10件事,提示的力量十分神奇,我们只需抛出几个近似人类语言的单词,就能得到一个格式和结构都良好的答案,没有什么话题是晦涩难懂的,没有什么事实是触不可及的,至少只要它是训练语料库的一部分,并得到模型的影子控制器,ShadowyC...

    2024-11-14 324
  • AA 多智能体路径规划新突破

      多智能体路径规划,MAPF,是一个在机器人、交通控制和自动化仓库等领域具有广泛应用的重要问题,MAPF的核心目标是为一组智能体找到一组无冲突的路径,使它们能够从起点移动到目标位置,传统的MAPF问题通常限制智能体只能在预定义的图上移动,这种限制在实际应用中可能不够灵活,任意角度路径规划,Any,An...

    2024-11-14 696
  • 从初级到高级的综合指南 NLP 自然语言处理 掌握BERT

      1.什么是BERT,在不断发展的自然语言处理,NLP,领域,一项名为BERT的突破性创新已经出现,改变了游戏规则,BERT代表BidirectionalEncoderRepresentationsfromTransformers,不仅仅是机器学习术语海洋中的另一个首字母缩略词,它代表了机器理解语言方...

    2024-11-14 886
  • AI大模型的存储之道 直播首秀

      AIGC在2023年爆火,各类大模型层出不穷,参数动辄达到千亿数量级,这些背后,数据的类型和形式也走向复杂多样,例如大模型会采用到我们真实物理世界中的文字、视觉、音频、3D、雷达、多谱等复杂多样的不同模态信号和数据,数据则又存在结构化、半结构化、非结构化等多种形式,在大模型发展的初期,GPU很贵,相...

    2024-11-14 449
  • 一文彻底搞懂论文

      GPT,2是一个大规模无监督语言模型,它可以生成连贯的文本段落,在许多语言建模基准上实现最先进的性能,并执行基本的阅读理解、机器翻译、问答和总结——所有这些都不需要针对特定任务的训练,GPT,2是GPT,1的直接扩展,其参数是GPT,1的10倍以上,并且在超过10倍的数据量上进行训练,GPT,2的训...

    2024-11-14 501
  • by Step Verify Let OpenAI s Step详细解读

      一、概述title,Let,sVerifyStepbyStep论文地址,https,arxiv.org,abs,2305.20050代码,https,github.com,openai,prm800k1.1Motivation1.2Methods说明,左边是正确的slutions,右边有部分推理是错...

    2024-11-14 255
  • 3.5 使用 Claude 构建 Agent Python ReAct 和 AI

      Reason,Act,ReAct,Agent能够通过将思维链推理与外部工具访问和迭代求解能力相结合,来执行复杂的推理任务,ReActAgent的工作原理ReActAgent的核心组件是系统提示,它定义了Agent的整体行为,我们稍后将看到一个示例,处理从用户提示开始,用户提示请求解决某个问题,系统提...

    2024-11-14 559
  • 推荐系统中多任务学习的优化思路 一文汇总

      ​多任务学习是推荐系统中非常常见的一个问题,推荐系统中,经常要对多个目标进行预测,比如点击率、转化率、观看时长等等,将这些任务联合学习,希望通过不同的监督信息,互相增强各自目标的拟合能力,但是同时,不同目标之间又不一定是正向关系,可能存在负向迁移问题,存在跷跷板现象,因此,如何最好的发挥多任务学习的...

    2024-11-14 766
  • 生成式AI多代理系统 技术团队的秘密武器

      译者,布加迪审校,重楼如今,许多开发人员和产品团队使用生成式人工智能,GenAI,代理来帮助构建软件或应用程序——真正的创新出现在多代理系统上,就像管弦乐队可以演奏出丰富复杂的交响乐,独奏音乐家只能在一个维度发出声音,多代理系统不仅限于以任务为导向的角色,真正助力开发和战略团队,比如说,梅奥诊所、沃...

    2024-11-14 566
  • AI数学天才还是数字骗子 GSM

      1、AI模型升级有妙招!废物利用让大语言模型更强大想象一下,如果能把你的旧手机变成最新的智能设备,是不是很酷,在AI领域,研究人员就实现了类似的魔法!他们提出了一种叫做upcycling的方法,可以将现有的大语言模型,LLM,升级成更强大的专家混合模型,MoE,这项技术不仅能提高模型性能,还能大幅节...

    2024-11-14 204
  • GQA LLM 一文详解MHA MQA原理

      前言本文回顾一下MHA、GQA、MQA,详细解读下MHA、GQA、MQA这三种常见注意力机制的原理,图1MHA、GQA、MQA一览self,attentionself,attention在自注意力机制中,输入通常是一个统一的输入矩阵,而这个矩阵后续会通过乘以不同的权重矩阵来转换成三个不同的向量集合,...

    2024-11-14 845

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息