包含"语言模型"标签的文章

  • 期刊 自然 上海交通大学与上海人工智能研究所联合推出医学多语言模型

      随着大型语言模型,LLMs,的快速发展,医学领域的应用也取得了显著进展,但是大多数现有的医学语言模型主要集中在英语语言环境中,限制了其在非英语国家和地区的应用潜力,为了填补这一空白,来自上海交大和上海人工智能实验室的研究团队研发了一个开源的、多语言的医学语言模型,旨在为全球多语言用户提供高质量的医学...

    2024-11-14 734
  • 综述 面向大语言模型的检索增强生成 技术 RAG

      同济大学王昊奋研究员团队联合复旦大学熊赟教授团队发布检索增强生成,RAG,综述,从核心范式,关键技术到未来发展趋势对RAG进行了全面梳理,这份工作为研究人员绘制了一幅清晰的RAG技术发展蓝图,指出了未来的研究探索方向,同时,为开发者提供了参考,帮助辨识不同技术的优缺点,并指导如何在多样化的应用场景中...

    2024-11-14 285
  • Mistral AI界的小而美 AI的最新力作如何重新定义边缘计算

      大模型领域的发展日新月异,每天都有许多有趣的论文值得深入品读,下面是本期觉得比较有意思的论文,1、AI界的小而美,MistralAI的最新力作如何重新定义边缘计算2、多智能体协作让大语言模型训练效率暴增1、AI界的小而美,MistralAI的最新力作如何重新定义边缘计算在人工智能飞速发展的今天,一个...

    2024-11-14 268
  • AI数学天才还是数字骗子 GSM

      1、AI模型升级有妙招!废物利用让大语言模型更强大想象一下,如果能把你的旧手机变成最新的智能设备,是不是很酷,在AI领域,研究人员就实现了类似的魔法!他们提出了一种叫做upcycling的方法,可以将现有的大语言模型,LLM,升级成更强大的专家混合模型,MoE,这项技术不仅能提高模型性能,还能大幅节...

    2024-11-14 201
  • 人工智能 10分钟解读

      一、前言2022年底,OpenAI推出的聊天机器人ChatGPT一经上线,便迅速引发了全球范围内的热议与追捧,仅在上线五天内,注册用户便突破了百万大关,ChatGPT的成功不仅展示了大语言模型,LLM,的强大能力,也标志着人类正式迈入了一个全新的人工智能时代,本文将以ChatGPT为切入点,回顾GP...

    2024-11-14 569
  • 实现更智能的AI 在语言模型中结合推理和行为 ReAct

      今天我们介绍一篇论文,REACT,SynergizingReasoningandActinginLanguageModels,,它是来自谷歌研究院和普林斯顿大学的一组研究人员在探索了在语言模型中结合推理和行为的潜力后发布的结果,虽然大型语言模型,LLM,推理,思维链提示,和行动,行动计划生成,的能力...

    2024-11-14 289
  • RoSA 一种新的大模型参数高效微调方法

      随着语言模型不断扩展到前所未有的规模,对下游任务的所有参数进行微调变得非常昂贵,PEFT方法已成为自然语言处理领域的研究热点,PEFT方法将微调限制在一小部分参数中,以很小的计算成本实现自然语言理解任务的最先进性能,RoSA是一种新的PEFT技术,在一组基准测试的实验中,RoSA在使用相同参数预算的...

    2024-11-14 657
  • 预计30000美元起!黄仁勋摊牌 无人能复刻英伟达B200!友商抄无可抄 通用计算过时了! 谁能懂

      撰稿丨云昭出品,技术栈,微信号,blog51cto,英伟达飘了,野心膨胀到让业界羡慕嫉妒恨,就在今天深夜,GTC全场高潮迭起,黄仁勋,轻咬着舌头、左手一个H100,右手一个B200,的照片,纷纷成为了业界媒体新闻的封面热图,无须多问,黄教主手里拿的是什么,什么就是全场最靓的核弹!一、没人抄得了B20...

    2024-11-14 584

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息