包含"大模型"标签的文章

  • 一文彻底搞懂论文

      GPT,2是一个大规模无监督语言模型,它可以生成连贯的文本段落,在许多语言建模基准上实现最先进的性能,并执行基本的阅读理解、机器翻译、问答和总结——所有这些都不需要针对特定任务的训练,GPT,2是GPT,1的直接扩展,其参数是GPT,1的10倍以上,并且在超过10倍的数据量上进行训练,GPT,2的训...

    2024-11-14 496
  • 一文彻底搞懂GPT

      GPT,3是一个具有1750亿个参数的自回归语言模型,比任何以前的非稀疏语言模型多10倍,对于所有任务,GPT,3均无需任何梯度更新或微调即可应用,任务和少样本演示完全通过与模型的文本交互来指定,可以生成新闻文章样本,而人类评估者很难将这些样本与人类撰写的文章区分开来,接下来分为四部分,摘要、引言、...

    2024-11-14 905
  • Transformer动画讲解

      一、GPT的核心是TransformerGPT,GenerativePre,trainedTransformer,是一种基于单向Transformer解码器的预训练语言模型,它通过在大规模语料库上的无监督学习来捕捉语言的统计规律,从而具备强大的文本生成能力,在GPT,GenerativePre,tr...

    2024-11-14 478
  • Liquid 液态智能的新篇章 AI发布液态基础模型

      01概述在人工智能的世界里,每一轮技术革新都可能颠覆我们对未来的认知,今天,我们要探讨的正是液态智能,LiquidAI,公司带来的全新系列——液态基础模型,LiquidFoundationModels,简称LFMs,这不仅是一次简单的产品迭代,更是一场关于AI模型性能与效率的革命,液态基础模型,性能...

    2024-11-14 626
  • Agents在日常工作的五个实际用例! AI

      在当今快节奏的工作环境中,人工智能,AI,正以前所未有的速度改变着我们的工作方式,AI助手作为新一代通用人工智能,GenAI,的代表,正在引领一场智能革命,它们不仅具备强大的思考和推理能力,还能自动化处理日常任务,从而提高工作效率,随着AutoGen、CrewAI、LangChain等框架的不断发展...

    2024-11-14 905
  • Arcee AI发布SuperNova 超级新星降临

      01引言在人工智能,AI,的世界里,大型语言模型已经成为解决复杂任务、提升决策过程的重要工具,但这些模型的扩展也带来了高计算成本、低可访问性和环境影响等挑战,ArceeAI直面这些挑战,推出了SuperNova,Medius——一款旨在保持大型模型高质量输出的同时,克服其局限性的小语言模型,02Su...

    2024-11-14 400
  • 探究Med 大型语言模型在医学领域的应用

      01、概述在医学领域,信息的精确性、可靠性和安全性至关重要,随着人工智能,AI,技术的发展,大型语言模型,LLM,如GPT,3和BERT为医学领域带来了新的机遇,这些模型在语言处理方面的能力,使其在医学应用中显示出巨大潜力,包括知识检索、临床决策支持和患者分流,多医学问答,医学问题回答基准为了评估L...

    2024-11-14 599
  • 利用agent自动生成论文idea 再也不用担心做科研没有思路了 ResearchAgent

      大家好,我是HxShine今天分享微软的一篇文章,ResearchAgent,IterativeResearchIdeaGenerationoverScientificLiteraturewithLargeLanguageModels,传统的科学研究过程包括新研究想法的提出和通过精心设计的实验来验证...

    2024-11-14 519
  • Berkeley 对不相关的RAG检索结果进行建模 RAFT UC

      大家好,我是HxShine,今天推荐一篇UCBerkeley的一篇RAG效果优化的文章~大模型引入新的知识一般有两个途径,一种是RAG检索增强,一种是SFT,哪种方式效果比较好呢,或者说有没有一些其他的更为有效的方式呢,这篇论文介绍了一种新的训练方法——检索增强型微调,RAFT,RetrievalA...

    2024-11-14 985
  • Thought TOT of Tree

      今天分享一篇普林斯顿大学的一篇文章,TreeofThoughts,DeliberateProblemSolvingwithLargeLanguageModels[1],思维之树,用大型语言模型解决复杂问题,这篇工作还是非常有借鉴意义的,OpenAI的AndrejKarpathy,前TeslaAI高级...

    2024-11-14 896
  • 小孩子才做选择 成年人当然是全都要 大模型微调哪家好

      一、概述title,UNIPELT,AUnifiedFrameworkforParameter,EfficientLanguageModelTuning论文地址,https,arxiv.org,abs,2110.07577代码,https,github.com,morningmoni,UniPELT...

    2024-11-14 933
  • 利用LLM本身训练SoTA Microsoft embedding模型

      大家好,我是HxShine今天分享一篇Microsoft公司的一篇文章,Title,ImprovingTextEmbeddingswithLargeLanguageModels,使用大型语言模型改善文本嵌入,这篇文章探索了直接利用LLM来做embedding模型,其只需要利用合成数据和少于1000次...

    2024-11-14 675
  • 利用LLM本身训练SoTA embedding模型

      大家好,我是HxShine今天分享一篇Microsoft公司的一篇文章,Title,ImprovingTextEmbeddingswithLargeLanguageModels,使用大型语言模型改善文本嵌入,这篇文章探索了直接利用LLM来做embedding模型,其只需要利用合成数据和少于1000次...

    2024-11-14 333
  • 利用LLM合成数据训练模型有哪些坑 EMNLP 2023

      大家好,我是HxShine今天我们将介绍EMNLP2023的一篇大模型,LLMs,生成文本分类任务合成数据的文章,标题是,Synthetic&gt,实际落地中,高质量训练数据的收集和筛选既耗费时间又成本昂贵,研究人员探索使用LLMs生成合成数据作为替代方法,然而,LLMs生成的合成数据在支持...

    2024-11-14 121
  • by Step Verify Let OpenAI s Step详细解读

      一、概述title,Let,sVerifyStepbyStep论文地址,https,arxiv.org,abs,2305.20050代码,https,github.com,openai,prm800k1.1Motivation1.2Methods说明,左边是正确的slutions,右边有部分推理是错...

    2024-11-14 252

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息