包含"LLM"标签的文章

  • 利用LLM合成数据训练模型有哪些坑 EMNLP 2023

      大家好,我是HxShine今天我们将介绍EMNLP2023的一篇大模型,LLMs,生成文本分类任务合成数据的文章,标题是,Synthetic&gt,实际落地中,高质量训练数据的收集和筛选既耗费时间又成本昂贵,研究人员探索使用LLMs生成合成数据作为替代方法,然而,LLMs生成的合成数据在支持...

    2024-11-14 121
  • EMNLP 2023

      一、概述PromptMix,AClassBoundaryAugmentationMethodforLargeLanguageModelDistillation​​https,arxiv.org,abs,2310.14192​​代码,​​https,github.com,servicenow,prom...

    2024-11-14 758
  • Llamaindex推出workflow应对复杂LLM应用构建 EDA 转向事件驱动 Graph 原因解析 以及技术实现从图

      同一天,LLM应用开发另一个代表产品Llamaindex也发布了其在此领域的新功能——workflow,进一步提升应用编排的能力,早在去年,Llamaindex在这方面已经有了动作,推出了QueryPipeline,详见,​​​应用编排的未来是Pipeline,LlamaIndex开发预览版推出Qu...

    2024-11-14 886
  • 如何让LLM学会试错

      大模型领域的发展日新月异,每天都有许多有趣的论文值得深入品读,下面是本期觉得比较有意思的论文,1、如何让LLM学会试错2、LLM竟然学会了自我反省,它真的有自我意识吗,1、如何让LLM学会试错你有没有想过,为什么人工智能经常会犯愚蠢的错误,原因可能让你意外,因为我们一直在教它做一个完美主义者!最新研...

    2024-11-14 164
  • LLM训练的隐秘危机 1%的合成数据或致模型崩溃

      1、LLM训练的隐秘危机,1%的合成数据或致模型崩溃在LLM快速发展的今天,一个令人担忧的现象正悄然出现——模型崩溃,研究发现,即便在训练数据中仅包含1%的合成数据,也可能导致LLM模型性能严重下降,无论如何增加训练数据量都无法提升效果,更令人意外的是,增加模型规模这一当前广泛采用的方法,非但不能缓...

    2024-11-14 633
  • 从零实现大模型

      传统RAGLLM预训练和微调一般都是基于公开的互联网数据,不可能包含公司内部私有数据,如果你问有关某公司的运营情况,直接基于模型参数生成的回答可能和胡说八道没什么两样,RAG,Retrieval,AugmentedGeneration,的思想就是将私有数据作为参考信息传递给LLM,这些私有数据除了作...

    2024-11-14 971
  • 探索LLM时代利用可解释性的10种策略 XAI有什么用

      你是否也好奇,在大模型时代,可解释性人工智能技术,XAI,有怎样的使用价值,近日,来自佐治亚大学、新泽西理工学院、弗吉尼亚大学、维克森林大学、和腾讯AILab的研究者联合发布了解释性技术在大语言模型,LLM,上的可用性综述,提出了,UsableXAI,的概念,并探讨了10种在大模型时代提高XAI实际...

    2024-11-14 946
  • Mixture

      嘿,大家好!这里是一个专注于AI智能体的频道!首先,让我们来聊聊LLM,这些模型通过在海量数据集上预训练,已经展现出了惊人的能力,无论是理解还是生成自然语言,它们都能做得很好,但问题来了,这些模型的规模和训练成本都很高,这让它们在实际应用中有点不切实际,这时候,MoA登场了!MoA通过利用多个LLM...

    2024-11-14 554
  • 更强 更快 更经济!超越GraphRAG的大模型RAG系统LightRAG开源啦!

      LightRAG增强了分段检索系统将文档转换为更小、更易于管理的片段,此策略允许快速识别和访问相关信息,而无需分析整个文档,接下来,我们利用LLMs来识别和提取各种实体,例如名称、日期、位置和事件,以及它们之间的关系,这通过此收集的信息进程将用于创建一个全面的知识图谱,该图谱突出显示跨整个文档集合,...

    2024-11-14 559
  • 科学报告 自然 大模型在社会情境判断方面可以胜过人类

      大模型在许多任务上表现优异,但是它们在社交情境中的判断能力仍是一个亟待解答的问题,社会情境判断不仅涉及对情境的理解,还包括适应和回应他人行为的能力,11月10日,自然,科学报告子刊发布文章,Largelanguagemodelscanoutperformhumansinsocialsituation...

    2024-11-14 453
  • 人工智能 10分钟解读

      一、前言2022年底,OpenAI推出的聊天机器人ChatGPT一经上线,便迅速引发了全球范围内的热议与追捧,仅在上线五天内,注册用户便突破了百万大关,ChatGPT的成功不仅展示了大语言模型,LLM,的强大能力,也标志着人类正式迈入了一个全新的人工智能时代,本文将以ChatGPT为切入点,回顾GP...

    2024-11-14 569
  • HunYuan 聊一聊 MFU 等 LLM 参数量 MoE 计算量和

      一、背景最近在看腾讯最新混元大模型的Paper时,[2411.02265]Hunyuan,Large,AnOpen,SourceMoEModelwith52BillionActivatedParametersbyTencent[1],,看到了如下关于计算Budget的公式由于我们的工作中也会经常根据...

    2024-11-14 510
  • 新一代解决方案Tool Text2SQL

      ​在互联网时代,数据爆发式增长,如果高效的分析数据成为一个亟待解决的问题,SQL是数据分析师的常用工具,编写高效的SQL需要用户具备一定的IT基础,对于普通人员来说存在一定门槛,Text,to,SQL技术可以实现自然语言转换成SQL,用户只需要用自然语言描述自己的目标,Text,to,SQL工具就可...

    2024-11-14 558
  • 词袋模型究竟是个啥 适用于TTS语音处理项目的召回模型 和语义召回相比有什么优劣

      在人工智能的众多应用中,对于文档的准确召回是一个广泛使用的需求,例如,在基于阅读理解的问答系统,RAG,中,我们常常通过嵌入模型生成向量来进行语义方面的召回,这种方法已经证明了其效果良好,然而,这并不意味着该方法适用于所有场景,让我们考虑一个涉及语音处理的项目,用户可能会说出需要查询的内容,系统需要...

    2024-11-14 235
  • 使用小型语言模型以预算部署AI

      SLM是一种更具成本效益的方法,它允许公司在安全的环境中将模型适应其专有数据,译自UseSmallLanguageModelsToDeployAIonaBudget,作者EmilyFreeman,AI正在颠覆科技行业,关于通用人工智能,AGI,及其取代人类的能力的讨论无处不在,无论未来是在十年后还是...

    2024-11-14 201

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息