包含"GPT"标签的文章

  • 突破AI性能瓶颈!揭秘LLaMA

      本文介绍了一种名为,的方法,通过将现有的大型语言模型,LLMs,转化为混合专家网络,MoE,,从而解决了训练MoE时遇到的数据饥饿和不稳定性问题,该方法基于著名的LLaMA,27B模型,并将其参数分为多个专家,然后对转换后的MoE模型进行持续预训练以进一步提高性能,实验结果表明,在使用200B个标记...

    2024-11-15 698
  • RAISE如何让AI更聪明 Agent的进化

      嘿,大家好!这里是一个专注于AI智能体的频道!今天和大家聊聊一个经典的,贝壳提出的RAISEAgent架构,除了架构之外,还包含一个全面的智能体训练框架,从数据选取到场景增强等等,FromLLMtoConversationalAgent,AMemoryEnhancedArchitecturewith...

    2024-11-15 107
  • Logic 突破大语言模型的逻辑瓶颈

      亲爱的读者,感谢您阅读到这里,正如我们探讨的语言模型一样,每个人都有自己的潜力和价值,认清自己,要么接受平凡,要么踏踏实实从0到1去积累资源,这世上从来没有简单的、一蹴而就的成功,无论是AI的发展还是个人的成长,都需要持续不断的努力和积累,如果您也对科技、人工智能和个人发展感兴趣,欢迎关注我们的微信...

    2024-11-15 380
  • 微软研究院新突破 如何让AI在专业领域更靠谱

      01、概述在人工智能的世界里,大型语言模型,LLMs,就像是瑞士军刀,多才多艺,几乎无所不能,但是,当它们遇到需要特定领域知识的任务时,比如医疗保健、法律和金融,这些万能的模型就显得有些力不从心了,这是为什么呢,因为它们在训练时使用的数据集往往缺乏最新的专业信息,导致它们在回答专业问题时可能会,幻觉...

    2024-11-15 495
  • 一文彻底搞懂GraphRAG

      自ChatGPT引领人工智能的新潮流以来,我们见证了大型语言模型,LLM,与私有数据结合的巨大潜力,这种结合不仅催生了功能强大的AI应用,也标志着AI专业能力的提升,然而,随着深入探究,我们发现传统的文本嵌入检索技术,Text2VecRAG,在处理知识库问答时仍存在局限,本文阐述如何通过图形RAG技...

    2024-11-15 773
  • 一文彻底搞懂Embedding

      Word2Vec是一种广泛使用的词嵌入,WordEmbedding,技术,它能够将单词表示为高维空间中的密集向量,从而捕捉单词之间的语义和语法关系,Word2Vec主要包含两种模型,Skip,Gram,跳字模型,和CBOW,ContinuousBagofWords,连续词袋模型,Skip,Gram与...

    2024-11-15 891
  • 一文读懂 基于Havenask向量检索 大模型 构建可靠的智能问答服务

      01Havenask介绍Havenask是阿里巴巴广泛使用的自研大规模分布式检索系统,是过去十多年阿里在电商领域积累下来的核心竞争力产品,广泛应用在搜推广和大数据检索等典型场景,在2022年云栖大会,云计算加速开源创新论坛上完成开源首发,同时作为阿里云开放搜索OpenSearch底层搜索引擎,Ope...

    2024-11-15 752
  • Sora 一文带你了解OpenAI

      最近AI圈最火的无疑是OpenAI在2月15日发布的Sora,Sora可以根据文本生成一分钟的高清视频,生成的视频画质、连续性、光影等都令人叹为观止,Sora无疑将视觉生成推到新的高度,本文将重点回答三个问题,一、背景在国内外大多数AI厂商还在卷大语言模型之际,OpenAI悄无声息地发布了文生视频,...

    2024-11-15 153
  • 一文汇总时序预测新思路

      在最近的时间序列预测研究工作中,有一类工作将图学习和时间序列结合了起来,从图学习的视角理解时间序列预测,这类工作中,一种是用图学习建模多变量间的关系,解决多元时序预测问题;另一种是直接把时间序列中的各个时间步看成图中的一个节点,用图学习建模时间步之间的依赖关系,这篇文章汇总了近期4篇图学习视角解决时...

    2024-11-15 745
  • 甚至学了好久还不知道大模型到底是个什么玩意 为什么你会觉得大模型很难学

      先从简单的开始,而不是从复杂的开始;简单意味着成就感,复杂意味着挫败感,理论是来自于现实中的实践结果,理论来自于实践,验证于实践;单纯的理论是没有生存空间的,为什么你觉得大模型很难,甚至觉得学不会大模型,原因就在于你太沉迷于理论,而忽略了实践的意义,大模型不是一个纯理论的科学大模型技术并不是一个纯粹...

    2024-11-15 962
  • 多模态大模型数据分析与实践

      数据集是大模型竞争的关键要素之一,AI大模型的突破得益于高质量数据的发展,训练大模型需要大规模、高质量、多模态的数据集,通常需要从各个领域和多个数据源收集数据,这些数据可以是文本、图像、语音、视频等多种形式,大语言模型训练使用的数据集规模爆发式增长,从2018年GPT,1数据集约为4.6GB,202...

    2024-11-15 620
  • 什么是声望 如何获取声望

      声望是技术人在AI.x社区的成长记录,技术人发布内容以及内容被推荐都会有相应的声望奖励,因此,声望越高代表着该用户在AI.x社区越德高望重——发布的有价值的内容越多,...。...

    2024-11-15 499
  • 什么是LLMOps?

      1.概念自2018年GPT,2的问世以来,大语言模型,LLM,如GPT系列逐渐发展壮大,尤其是GPT,3及其后续版本的推出,性能方面显著提升,这些模型的强大能力催生了众多应用,如客户服务的聊天机器人、多语言翻译服务和辅助写作编程的工具等,面对LLM在实际应用中的独特挑战,业界发展出了新的工具和最佳实...

    2024-11-15 927
  • 什么是AI Agent

      1概念在计算机、人工智能专业技术领域,一般将Agent译为,智能体,,其定义是在一定的环境中体现出自治性、反应性、社会性、预动性、思辨性,慎思性,、认知性等一种或多种智能特征的软件或硬件实体,AIAgent则是指由LLM驱动的智能体,目前它还没有一个被广泛接受的定义,但我们可以把它描述成这样一个系统...

    2024-11-15 749
  • 一文详解多模态智能体 最新进展 核心组件 LMAs

      文章链接,https,arxiv.org,pdf,2402.15116github地址,https,github.com,jun0wanan,awesome,large,multimodal,agents大语言模型,LLMs,在为基于文本的AI智能体提供动力方面取得了卓越的表现,赋予它们类似于人类的...

    2024-11-15 536

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息