大模型_第52页_坚曼百货商行

一文彻底搞懂论文

GPT，2是一个大规模无监督语言模型，它可以生成连贯的文本段落，在许多语言建模基准上实现最先进的性能，并执行基本的阅读理解、机器翻译、问答和总结——所有这些都不需要针对特定任务的训练，GPT，2是GPT，1的直接扩展，其参数是GPT，1的10倍以上，并且在超过10倍的数据量上进行训练，GPT，2的训...

2024-11-14 500

数码资讯

一文彻底搞懂GPT

GPT，3是一个具有1750亿个参数的自回归语言模型，比任何以前的非稀疏语言模型多10倍，对于所有任务，GPT，3均无需任何梯度更新或微调即可应用，任务和少样本演示完全通过与模型的文本交互来指定，可以生成新闻文章样本，而人类评估者很难将这些样本与人类撰写的文章区分开来，接下来分为四部分，摘要、引言、...

2024-11-14 907

数码资讯

Transformer动画讲解

一、GPT的核心是TransformerGPT，GenerativePre，trainedTransformer，是一种基于单向Transformer解码器的预训练语言模型，它通过在大规模语料库上的无监督学习来捕捉语言的统计规律，从而具备强大的文本生成能力，在GPT，GenerativePre，tr...

2024-11-14 481

娱乐八卦

Liquid 液态智能的新篇章 AI发布液态基础模型

01概述在人工智能的世界里，每一轮技术革新都可能颠覆我们对未来的认知，今天，我们要探讨的正是液态智能，LiquidAI，公司带来的全新系列——液态基础模型，LiquidFoundationModels，简称LFMs，这不仅是一次简单的产品迭代，更是一场关于AI模型性能与效率的革命，液态基础模型，性能...

2024-11-14 629

百货快讯

Agents在日常工作的五个实际用例！ AI

在当今快节奏的工作环境中，人工智能，AI，正以前所未有的速度改变着我们的工作方式，AI助手作为新一代通用人工智能，GenAI，的代表，正在引领一场智能革命，它们不仅具备强大的思考和推理能力，还能自动化处理日常任务，从而提高工作效率，随着AutoGen、CrewAI、LangChain等框架的不断发展...

2024-11-14 907

科技

Arcee AI发布SuperNova 超级新星降临

01引言在人工智能，AI，的世界里，大型语言模型已经成为解决复杂任务、提升决策过程的重要工具，但这些模型的扩展也带来了高计算成本、低可访问性和环境影响等挑战，ArceeAI直面这些挑战，推出了SuperNova，Medius——一款旨在保持大型模型高质量输出的同时，克服其局限性的小语言模型，02Su...

2024-11-14 401

头条

探究Med 大型语言模型在医学领域的应用

01、概述在医学领域，信息的精确性、可靠性和安全性至关重要，随着人工智能，AI，技术的发展，大型语言模型，LLM，如GPT，3和BERT为医学领域带来了新的机遇，这些模型在语言处理方面的能力，使其在医学应用中显示出巨大潜力，包括知识检索、临床决策支持和患者分流，多医学问答，医学问题回答基准为了评估L...

2024-11-14 602

科技

利用agent自动生成论文idea 再也不用担心做科研没有思路了 ResearchAgent

大家好，我是HxShine今天分享微软的一篇文章，ResearchAgent，IterativeResearchIdeaGenerationoverScientificLiteraturewithLargeLanguageModels，传统的科学研究过程包括新研究想法的提出和通过精心设计的实验来验证...

2024-11-14 523

生活科普

Berkeley 对不相关的RAG检索结果进行建模 RAFT UC

大家好，我是HxShine，今天推荐一篇UCBerkeley的一篇RAG效果优化的文章～大模型引入新的知识一般有两个途径，一种是RAG检索增强，一种是SFT，哪种方式效果比较好呢，或者说有没有一些其他的更为有效的方式呢，这篇论文介绍了一种新的训练方法——检索增强型微调，RAFT，RetrievalA...

2024-11-14 990

数码资讯

Thought TOT of Tree

今天分享一篇普林斯顿大学的一篇文章，TreeofThoughts，DeliberateProblemSolvingwithLargeLanguageModels[1]，思维之树，用大型语言模型解决复杂问题，这篇工作还是非常有借鉴意义的，OpenAI的AndrejKarpathy，前TeslaAI高级...

2024-11-14 897

饰品装饰

小孩子才做选择成年人当然是全都要大模型微调哪家好

一、概述title，UNIPELT，AUnifiedFrameworkforParameter，EfficientLanguageModelTuning论文地址，https，arxiv.org，abs，2110.07577代码，https，github.com，morningmoni，UniPELT...

2024-11-14 936

数码资讯

利用LLM本身训练SoTA Microsoft embedding模型

大家好，我是HxShine今天分享一篇Microsoft公司的一篇文章，Title，ImprovingTextEmbeddingswithLargeLanguageModels，使用大型语言模型改善文本嵌入，这篇文章探索了直接利用LLM来做embedding模型，其只需要利用合成数据和少于1000次...

2024-11-14 677

数码资讯

利用LLM本身训练SoTA embedding模型

大家好，我是HxShine今天分享一篇Microsoft公司的一篇文章，Title，ImprovingTextEmbeddingswithLargeLanguageModels，使用大型语言模型改善文本嵌入，这篇文章探索了直接利用LLM来做embedding模型，其只需要利用合成数据和少于1000次...

2024-11-14 336

玩具模型

利用LLM合成数据训练模型有哪些坑 EMNLP 2023

大家好，我是HxShine今天我们将介绍EMNLP2023的一篇大模型，LLMs，生成文本分类任务合成数据的文章，标题是，Synthetic&gt，实际落地中，高质量训练数据的收集和筛选既耗费时间又成本昂贵，研究人员探索使用LLMs生成合成数据作为替代方法，然而，LLMs生成的合成数据在支持...

2024-11-14 124

行业热门

by Step Verify Let OpenAI s Step详细解读

一、概述title，Let，sVerifyStepbyStep论文地址，https，arxiv.org，abs，2305.20050代码，https，github.com，openai，prm800k1.1Motivation1.2Methods说明，左边是正确的slutions，右边有部分推理是错...

2024-11-14 255

包含"大模型"标签的文章

一文彻底搞懂论文

一文彻底搞懂GPT

Transformer动画讲解

Liquid 液态智能的新篇章 AI发布液态基础模型

Agents在日常工作的五个实际用例！ AI

Arcee AI发布SuperNova 超级新星降临

探究Med 大型语言模型在医学领域的应用

利用agent自动生成论文idea 再也不用担心做科研没有思路了 ResearchAgent

Berkeley 对不相关的RAG检索结果进行建模 RAFT UC

Thought TOT of Tree

小孩子才做选择成年人当然是全都要大模型微调哪家好

利用LLM本身训练SoTA Microsoft embedding模型

利用LLM本身训练SoTA embedding模型

利用LLM合成数据训练模型有哪些坑 EMNLP 2023

by Step Verify Let OpenAI s Step详细解读

联系我们