包含"模型"标签的文章

  • LLaMA 英特尔实验室最新成果

      随着模型规模的不断扩大,其对计算资源的需求也水涨船高,高昂的内存和计算成本不仅限制了LLMs在高性能计算平台之外的应用,也增加了研究和开发的门槛,这对于资源有限的研究机构和企业尤其成问题,在这样的背景下,减小LLMs的大小和计算复杂度显得尤为重要,这可以使LLMs在更广泛的硬件平台上得到应用,包括那...

    2024-11-15 798
  • 一文读懂 基于Havenask向量检索 大模型 构建可靠的智能问答服务

      01Havenask介绍Havenask是阿里巴巴广泛使用的自研大规模分布式检索系统,是过去十多年阿里在电商领域积累下来的核心竞争力产品,广泛应用在搜推广和大数据检索等典型场景,在2022年云栖大会,云计算加速开源创新论坛上完成开源首发,同时作为阿里云开放搜索OpenSearch底层搜索引擎,Ope...

    2024-11-15 751
  • 什么是LLMOps?

      1.概念自2018年GPT,2的问世以来,大语言模型,LLM,如GPT系列逐渐发展壮大,尤其是GPT,3及其后续版本的推出,性能方面显著提升,这些模型的强大能力催生了众多应用,如客户服务的聊天机器人、多语言翻译服务和辅助写作编程的工具等,面对LLM在实际应用中的独特挑战,业界发展出了新的工具和最佳实...

    2024-11-15 927
  • 一文详解多模态智能体 最新进展 核心组件 LMAs

      文章链接,https,arxiv.org,pdf,2402.15116github地址,https,github.com,jun0wanan,awesome,large,multimodal,agents大语言模型,LLMs,在为基于文本的AI智能体提供动力方面取得了卓越的表现,赋予它们类似于人类的...

    2024-11-15 536
  • 一文详解视觉Transformer模型压缩和加速策略 量化

      论文链接,​​https,arxiv.org,pdf,2404.10407​​视觉Transformer,ViT,在计算机视觉领域标志性地实现了一次革命,超越了各种任务的最先进模型,然而,它们的实际应用受到高计算和内存需求的限制,本研究通过评估四种主要的模型压缩技术,量化、低秩近似、知识蒸馏和剪枝,...

    2024-11-15 379
  • 一文详解3D内容生成算法 朴素

      文章链接,https,arxiv.org,pdf,2402.01166近年来,人工智能生成内容,AIGC,方面取得了显著进展,涉及多种输入形式,如文本、图像、视频、音频和3D内容,其中,3D内容是最接近真实世界3D环境的视觉形式,并蕴含着巨大的知识量,3D内容生成展示了学术和实践价值,同时也面临着巨...

    2024-11-15 323
  • 一文详解大语言模型的流行架构与训练技术

      这篇博客全面介绍了大型语言模型,LLMs,的构建流程,从流行架构的选择到实际建模的每个关键步骤,文章首先探讨了LLMs的模型架构,然后详细阐述了数据准备过程,包括数据的收集、清洗和去重,接着是关于如何进行有效标记化的讨论,在模型构建方面,博客详细解释了采用自监督学习方法的预训练过程,以及对模型进行指...

    2024-11-15 292
  • 大模型落地应用指北

      一、大模型概述1.什么是大模型本文的大模型特指的是大规模数据训练得到的预训练模型,对于大模型,2021年8月李飞飞联合100多名专家发布了一份研究报告,OntheOpportunitiesandRiskofFoundationModels,,他们将大模型统一命名为fundationmodel,也可以...

    2024-11-15 726
  • 图像生成

      文章,https,arxiv.org,pdf,2404.02790.pdf数据集,​​​https,MuLAn,dataset.github.io,​​文本到图像生成已经取得了令人惊讶的成果,但精确的空间可控性和prompt的保真度仍然是极具挑战性的,通常通过繁琐的prompt工程、场景布局条件或图...

    2024-11-15 855
  • 大模型榜单还能信吗 一个假模型就能登顶排行榜

      1.缘起目前评测大语言模型主要有两种方法,•通过人类投票来进行评估,比如,ChatbotArena,但是这种往往需要花费较长的时间,•为了降低人类标注的依赖,还有另外一种自动化的LLM基准测试,这种方法成本低、容易扩展,自动化基准测试也成为了众多模型的热门选择,而且测试中的高胜率往往能带来显著的宣传...

    2024-11-15 603
  • 为什么你的模型生成的内容长度总是不超过2K? AgentWrite

      1.为什么要研究LongWriter随着大语言模型的发展,越来越多的大语言模型都具备了长上下文能力,甚至有的达到了100万token,但是,相较于大家关注的海量输入,大模型的生成长篇幅的内容时就显得力不从心了,比如,如上图,作者在各种模型上要求生成超过2000字的内容时,基本上都没有成功,随着提示词...

    2024-11-15 620
  • 最新研究 大语言模型使用Json格式输出会降低模型性能吗

      1.背景大语言模型在工业界应用的一个主要障碍就是大语言模型,LLMs,不遵循标准化输出格式,这种不一致性,使得输出解析变得更为复杂,也削弱了这些模型的可靠性,所以,大家普遍会采用结构化输出的方式来规避这一问题,也就是使用格式化限制,比如以标准化格式进行输出,比如,Json、XML等,这些限制可以通过...

    2024-11-15 339
  • 媲美Sora 文生超1分钟 1080P视频 谷歌发布Veo

      5月15日,谷歌召开,I,O2024,大会,并宣布了100多种产品和大模型,其中,有两款产品令人印象深刻,一个是支持跨文本、视频、音频的多模态AIAgent—ProjectAstra;另外一个便是视频模型Veo,据悉,Veo支持文本生成超过1分钟的1080P超高清视频,在文本语义还原、视频动作一致性...

    2024-11-15 201
  • Salesforce等开源1万亿tokens多模态数据集 斯坦福

      华盛顿大学、斯坦福大学、Salesforce等研究人员联合开源了多模态数据集MINT,1T,据悉,MINT,1T共包含了大约1万亿个文本标记和34亿张图像,是现有开源多模态数据集的10倍,同时还首次从ArXiv网站中爬取了专业论文,进一步提升了数据质量,这对于开源领域开发GPT,4o、Gemini等...

    2024-11-15 678
  • RAG能帮助LLM更靠谱吗 斯坦福新研究

      大语言模型,LLM,虽然功能强大,但容易出现幻觉,此外,它们受限于其训练语料库中包含的知识,因此无法回答有关近期事件或公开受限信息的查询,为了解决上述问题,检索增强生成,RAG,是一种常用的框架,它在LLM的提示中提供相关检索内容,获得相关信息的参考文档或数据库,并可以显著提高模型的准确性,大多数商...

    2024-11-15 948

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息