包含"大型语言模型"标签的文章
-
大型语言模型 LLM 的历史与未来
大型语言模型,LLM,是现代科技的奇迹,它们的功能复杂,规模庞大,并且具有开创性的进展,本文将探索LLM的历史和未来,一、LLM的起源,NLP和神经网络大型语言模型,LLM,的创建并非一蹴而就,语言模型的第一个概念始于被称为自然语言处理,NLP,的基于规则的系统,这些系统遵循预定义的规则,根据文本...
-
进展与未来方向的研究 图遇见大型语言模型
摘要,在现实世界的应用中,如引文网络、社交网络和生物数据等领域,图,graph,在表示和分析复杂关系方面起着至关重要的作用,最近,大型语言模型,LargeLanguageModels,LLMs,在众多领域取得了显著成功,并且也被应用于与图相关的任务中,以超越传统的基于图神经网络,GraphNeura...
-
LLaMA
大型语言模型,LLMs,如GPT,4等,已经在多个领域展示了其强大的能力,能够通过对话帮助人们完成各种任务,然而,这些模型在需要语音输入或输出的场景中仍面临显著的限制,尽管最近的技术进展,如GPT,4o,提升了语音交互的响应速度,但依然存在延迟和质量方面的挑战,如何实现低延迟且高质量的语音交互,成为...
-
ICLR2024 大型语言模型的知识融合
摘要,从头开始训练大型语言模型,LLM,可以生成具有独特功能和优势的模型,但这需要巨大的成本,并可能导致冗余功能,另一种具有成本效益且引人注目的方法是将现有的预训练LLM合并为一个更强大的模型,然而,由于这些LLM架构各不相同,直接融合它们的权重并不可行,在本文中,我们引入了LLM知识融合的概念,...
-
Mol
引言在自然语言处理,NLP,的众多应用场景中,大型语言模型,LargeLanguageModel,LLM,展现了其卓越的文本理解与生成能力,不仅在传统的文本任务上成绩斐然,更在生物学、计算化学、药物研发等跨学科领域证明了其广泛的应用潜力,尽管如此,生物分子研究领域的特殊性—比如专用数据集的缺乏、数据...
-
他是如何使用LLM提升10倍效率的 让Google大牛告诉你
近年来,大型语言模型,LLM,在人工智能领域引起了巨大关注,有人认为它们是革命性的技术,将彻底改变我们的工作和生活方式,而另一些人则认为它们只是炒作,没有实际价值,Google技术专家NicholasCarlini在文章,HowIUseAI,中给出了他对LLM的看法,并展示它们如何帮助他提高工作效率...
-
用短输入模拟长样本 北大联合MSRA提出PoSE 高效拓展LLM上下文窗口
论文题目,PoSE,EfficientContextWindowExtensionofLLMsviaPositionalSkip,wiseTraining论文链接,https,arxiv.org,abs,2309.10代码链接,https,github.com,dwzhu,pku,PoSE一、研究简...
-
MoE 为什么最新的LLM使用混合专家 架构
本文详细介绍了混合专家,MoE,架构,该架构通过混合或融合不同的,专家,模型共同解决特定的问题,专业化的必要性医院有很多具有不同专长的专家和医生,他们擅长解决各自领域内的医疗难题,外科医生、心脏病专家、儿科医生等各类专家紧密合作,为患者提供了全面而个性化的医疗护理服务,同样,人们也可以将这一合作模式...
-
微软研究院新突破 如何让AI在专业领域更靠谱
01、概述在人工智能的世界里,大型语言模型,LLMs,就像是瑞士军刀,多才多艺,几乎无所不能,但是,当它们遇到需要特定领域知识的任务时,比如医疗保健、法律和金融,这些万能的模型就显得有些力不从心了,这是为什么呢,因为它们在训练时使用的数据集往往缺乏最新的专业信息,导致它们在回答专业问题时可能会,幻觉...
-
大型语言模型与智能机器人集成的调查研究
摘要,近年来,大型语言模型,LLMs,的集成已经彻底改变了机器人学领域,使机器人能够以类似人类的熟练程度进行交流、理解和推理,本文探讨了LLMs对机器人学多方面的影响,解决了利用这些模型在各个领域的关键挑战和机遇,通过将LLM应用归类并分析在机器人学的核心要素——通信、感知、规划和控制中,我们旨在为...
-
分享大型语言模型在自动驾驶方面的应用案例 ChatGPT可以开车吗
人工智能技术如今正在快速发展和应用,人工智能模型也是如此,拥有100亿个参数的通用模型的性能正在碾压拥有5000万个参数的任务特定模型,在从单一模型解决许多任务方面表现出了卓越的性能,人工智能模型也正在变得多模态,微软公司的Florence2和OpenAI公司的GPT,4V等新的视觉模型正在扩展这些...
-
改进RAG管道检索文档质量的五种方法
RAG可以利用外部信息提升大型语言模型的性能,其性能依赖于检索文档的质量,除了标准检索方法之外,还有4种方法可以提高所检索文档的质量,检索增强生成,RAG,是利用外部信息定制大型语言模型的重要技术之一,但是,RAG的性能取决于检索到的文档的质量,除了在RAG管道中使用的标准检索方法之外,还有这4种技...
-
文档概要索引 简单提升检索性能的新选择
今天介绍了一种全新的LlamaIndex数据结构,文档摘要索引,将描述它如何比传统语义搜索提供更好的检索性能,并通过一个示例进行了演示,背景大型语言模型,LLM,的核心用例之一是针对自己的数据进行问答,为此,我们将LLM与,检索,模型配对,该模型可以对知识语料库执行信息检索,并使用LLM对检索到的文...
-
评估RAG系统组件的终极指南
RAG系统包含两个核心组件,检索器和生成器,本文将介绍如何评估这两个组件,检索增强型生成,RAG,系统被设计用来提升大型语言模型,LLM,的响应质量,当用户提交查询时,RAG系统从向量数据库中提取相关信息,并将其作为场景传递给LLM,然后,LLM使用这个场景为用户生成响应,这一过程显著提高了LLM反...
-
如何通过压缩提示降低GPT
如果使用得当,LLMLingua可以降低使用高级LLM的成本,并使更广泛的用户和应用程序可以使用LLM,像GPT,4和Claude这样的大型语言模型,LLM,可以通过良好的提示工程学习新任务,然而,较长的提示会增加使用这些模型的成本,并且还会减慢它们的运行速度,LLMLingua是微软公司开发的一项...