GPT_第24页_坚曼百货商行

突破AI性能瓶颈！揭秘LLaMA

本文介绍了一种名为，的方法，通过将现有的大型语言模型，LLMs，转化为混合专家网络，MoE，，从而解决了训练MoE时遇到的数据饥饿和不稳定性问题，该方法基于著名的LLaMA，27B模型，并将其参数分为多个专家，然后对转换后的MoE模型进行持续预训练以进一步提高性能，实验结果表明，在使用200B个标记...

2024-11-15 701

百货

RAISE如何让AI更聪明 Agent的进化

嘿，大家好！这里是一个专注于AI智能体的频道！今天和大家聊聊一个经典的，贝壳提出的RAISEAgent架构，除了架构之外，还包含一个全面的智能体训练框架，从数据选取到场景增强等等，FromLLMtoConversationalAgent，AMemoryEnhancedArchitecturewith...

2024-11-15 112

百货

Logic 突破大语言模型的逻辑瓶颈

亲爱的读者，感谢您阅读到这里，正如我们探讨的语言模型一样，每个人都有自己的潜力和价值，认清自己，要么接受平凡，要么踏踏实实从0到1去积累资源，这世上从来没有简单的、一蹴而就的成功，无论是AI的发展还是个人的成长，都需要持续不断的努力和积累，如果您也对科技、人工智能和个人发展感兴趣，欢迎关注我们的微信...

2024-11-15 383

生活资讯

微软研究院新突破如何让AI在专业领域更靠谱

01、概述在人工智能的世界里，大型语言模型，LLMs，就像是瑞士军刀，多才多艺，几乎无所不能，但是，当它们遇到需要特定领域知识的任务时，比如医疗保健、法律和金融，这些万能的模型就显得有些力不从心了，这是为什么呢，因为它们在训练时使用的数据集往往缺乏最新的专业信息，导致它们在回答专业问题时可能会，幻觉...

2024-11-15 500

其他百货

一文彻底搞懂GraphRAG

自ChatGPT引领人工智能的新潮流以来，我们见证了大型语言模型，LLM，与私有数据结合的巨大潜力，这种结合不仅催生了功能强大的AI应用，也标志着AI专业能力的提升，然而，随着深入探究，我们发现传统的文本嵌入检索技术，Text2VecRAG，在处理知识库问答时仍存在局限，本文阐述如何通过图形RAG技...

2024-11-15 774

娱乐

一文彻底搞懂Embedding

Word2Vec是一种广泛使用的词嵌入，WordEmbedding，技术，它能够将单词表示为高维空间中的密集向量，从而捕捉单词之间的语义和语法关系，Word2Vec主要包含两种模型，Skip，Gram，跳字模型，和CBOW，ContinuousBagofWords，连续词袋模型，Skip，Gram与...

2024-11-15 893

科技

一文读懂基于Havenask向量检索大模型构建可靠的智能问答服务

01Havenask介绍Havenask是阿里巴巴广泛使用的自研大规模分布式检索系统，是过去十多年阿里在电商领域积累下来的核心竞争力产品，广泛应用在搜推广和大数据检索等典型场景，在2022年云栖大会，云计算加速开源创新论坛上完成开源首发，同时作为阿里云开放搜索OpenSearch底层搜索引擎，Ope...

2024-11-15 758

头条

Sora 一文带你了解OpenAI

最近AI圈最火的无疑是OpenAI在2月15日发布的Sora，Sora可以根据文本生成一分钟的高清视频，生成的视频画质、连续性、光影等都令人叹为观止，Sora无疑将视觉生成推到新的高度，本文将重点回答三个问题，一、背景在国内外大多数AI厂商还在卷大语言模型之际，OpenAI悄无声息地发布了文生视频，...

2024-11-15 160

新闻资讯

一文汇总时序预测新思路

在最近的时间序列预测研究工作中，有一类工作将图学习和时间序列结合了起来，从图学习的视角理解时间序列预测，这类工作中，一种是用图学习建模多变量间的关系，解决多元时序预测问题；另一种是直接把时间序列中的各个时间步看成图中的一个节点，用图学习建模时间步之间的依赖关系，这篇文章汇总了近期4篇图学习视角解决时...

2024-11-15 749

饰品装饰

甚至学了好久还不知道大模型到底是个什么玩意为什么你会觉得大模型很难学

先从简单的开始，而不是从复杂的开始；简单意味着成就感，复杂意味着挫败感，理论是来自于现实中的实践结果，理论来自于实践，验证于实践；单纯的理论是没有生存空间的，为什么你觉得大模型很难，甚至觉得学不会大模型，原因就在于你太沉迷于理论，而忽略了实践的意义，大模型不是一个纯理论的科学大模型技术并不是一个纯粹...

2024-11-15 967

包包服装

多模态大模型数据分析与实践

数据集是大模型竞争的关键要素之一，AI大模型的突破得益于高质量数据的发展，训练大模型需要大规模、高质量、多模态的数据集，通常需要从各个领域和多个数据源收集数据，这些数据可以是文本、图像、语音、视频等多种形式，大语言模型训练使用的数据集规模爆发式增长，从2018年GPT，1数据集约为4.6GB，202...

2024-11-15 624

家电数码

什么是声望如何获取声望

声望是技术人在AI.x社区的成长记录，技术人发布内容以及内容被推荐都会有相应的声望奖励，因此，声望越高代表着该用户在AI.x社区越德高望重——发布的有价值的内容越多，...。...

2024-11-15 505

百货快讯

什么是LLMOps?

1.概念自2018年GPT，2的问世以来，大语言模型，LLM，如GPT系列逐渐发展壮大，尤其是GPT，3及其后续版本的推出，性能方面显著提升，这些模型的强大能力催生了众多应用，如客户服务的聊天机器人、多语言翻译服务和辅助写作编程的工具等，面对LLM在实际应用中的独特挑战，业界发展出了新的工具和最佳实...

2024-11-15 931

行业热门

什么是AI Agent

1概念在计算机、人工智能专业技术领域，一般将Agent译为，智能体，，其定义是在一定的环境中体现出自治性、反应性、社会性、预动性、思辨性，慎思性，、认知性等一种或多种智能特征的软件或硬件实体，AIAgent则是指由LLM驱动的智能体，目前它还没有一个被广泛接受的定义，但我们可以把它描述成这样一个系统...

2024-11-15 751

头条

一文详解多模态智能体最新进展核心组件 LMAs

文章链接，https，arxiv.org，pdf，2402.15116github地址，https，github.com，jun0wanan，awesome，large，multimodal，agents大语言模型，LLMs，在为基于文本的AI智能体提供动力方面取得了卓越的表现，赋予它们类似于人类的...

2024-11-15 542

包含"GPT"标签的文章