包含"通义千问"标签的文章
-
知其然知其所以然 模型也能
1.引言部分今天要给大家分享一篇很有意思的论文,这篇论文主要解决的是什么问题呢,就是如何让大语言模型在专业领域,比如医疗、科学领域表现得更好,你们有没有想过,虽然现在的ChatGPT、Claude这些大模型很厉害,但在专业领域它们的表现还是不够好,对吧,比如说,当我们问它一个关于支气管扩张的专业问题...
-
史上首个实时AI视频生成技术 速度提升10.6倍 DiT通用
实时AI视频生成来了!本周三,新加坡国立大学尤洋团队提出了业内第一种可以实时输出的,基于DiT的视频生成方法,该技术名为PyramidAttentionBroadcast,PAB,通过减少冗余注意力计算,PAB实现了高达21.6FPS的帧率和10.6倍的加速,同时不会牺牲包括Open,Sora、Op...
-
对比调优 减少多模态模型幻觉 谷歌通过数据增强
随着Gemini、GPT,4o等模型的出现,具备看、听、说的多模态大模型成为了新的主流,由于训练数据复杂、模型架构过于复杂,在生成、识别内容时很容易出现错误描述也称为,幻觉,,例如,当看到一张包含刀、叉和勺子的餐具图片时,模型会错误地描述为牙签,为了解决这个难题,谷歌DeepMind、谷歌云AI研究...
-
Face 大模型微调 Hugging Transformers全流程实战
大模型微调,HuggingFaceTransformers全流程实战内容精选发布于2024,9,2610,36592浏览0收藏随着大模型在人工智能领域的兴起,如何将其应用于垂直领域成为关键问题,本文描述了模型微调技术,通过调整预训练模型的参数,使其适应特定任务,从而提升模型在特定领域的表现,文中以Y...
-
如何不爬梯免费使用AI文生图
现在各种AI大模型大行其道,前有ChatGPT颠覆了我们对对话型AI的原有印象,后有Sora文生视频,让我们看到了利用AI进行创意创作的无限可能性,如今各大公司和团队都争相提出自己的大模型,各种网页端和软件应用也极大地降低了我们使用AI作为生产力的门槛,可惜很多要么需要翻墙爬梯子,要么需要付费买会员...
-
大模型不看图也能正确回答视觉问题! 中科大等意外发现
大模型不看图,竟也能正确回答视觉问题,!中科大、香港中文大学、上海AILab的研究团队团队意外发现了这一离奇现象,他们首先看到像GPT,4V、GeminiPro、Qwen1.5,72B、Yi,VL,34B以及LLaVA,Next,34B等大模型,不管是闭源还是开源,语言模型还是多模态,竟然只根据在多...
-
全新官方合作包 Face全面拥抱LangChain Hugging
通过上述介绍,相信你已经可以轻松地在你的LangChain项目中集成HuggingFace平台的强大功能,无论是聊天机器人、文本嵌入还是数据集加载,HuggingFace平台都能为你提供更多的开源模型的支持,...。...
-
如何使用NotebookLM制作YouTube视频学习指南
NotebookLM使用AI来总结和组织要点,可以轻松地用YouTube视频创建学习指南,只需上传视频链接,这个工具就可以帮助你将内容转换成结构化指南,用YouTube视频制作学习指南可能很花时间,但是NotebookLM简化了这项任务,NotebookLM是一个帮助你做笔记和总结的工具,它使用AI...
-
如何使用HippoRAG增强LLM的记忆
译者,李睿审校,重楼大型语言模型,LLM,已经证明是一种非常宝贵的思考工具,经过大量文本、代码和其他媒体数据集的训练,它们能够创作出接近人类水平的文章、翻译语言、生成图像,还能以信息丰富的方式回答人们提出的问题,甚至可以编写不同类型的创意内容,但是,尽管它们功能强大,即使是最先进的LLM也有一个基本...
-
如何使用聚类分析分割数据
本文揭示了聚类分析在分割、分析和洞察相似数据组方面具有的潜力,机器学习不仅仅涉及做预测,还涉及其他无监督过程,其中聚类尤为突出,本文介绍了聚类和聚类分析,着重表明了聚类分析在分割、分析和洞察相似数据组方面具有的潜力,什么是聚类?简单来说,聚类就是将相似的数据项分组在一起,这好比在杂货店里将相似的水果...
-
HippoRAG如何从大脑获取线索以改进LLM检索
译者,李睿审校,重楼知识存储和检索正在成为大型语言模型,LLM,应用的重要组成部分,虽然检索增强生成,RAG,在该领域取得了巨大进步,但一些局限性仍然没有克服,俄亥俄州立大学和斯坦福大学的研究团队推出了HippoRAG,这是一种创新性的检索框架,其设计理念源于人类长期记忆系统中的海马索引理论,Hip...
-
Ilya推荐的30篇文章 OpenAI前CTO 1 认真读完将理解当下90%的AI技术
近日,网上流传一份ilya推荐给JohnCarmack的阅读清单,该清单包含了当今与AI相关30篇顶级文章,并称如果真的将它们读完,就能理解当下90%的AI技术,下面笔者带大家速览这40篇文章内容概要,1,AttentionIsAllYouNeed不解释了,transformer开山论文,不得不看,...
-
常见几种大语言模型压缩技术分析详解
大型语言模型,LLM,在自然语言处理任务中取得了显著的成功,但同时也面临着模型过大、计算需求过高的问题,为了解决这些问题,模型压缩技术应运而生,旨在减小模型大小、降低计算复杂度并提升运行效率,本文将对LLM压缩技术进行详细的分析,包括剪枝、知识蒸馏和量化等关键技术,并结合实际应用案例进行分析,一、剪...
-
Sora关键技术逆向工程图解 揭去神秘面纱 张俊林
Sora生成的视频效果好吗,确实好,Sora算得上AGI发展历程上的里程碑吗,我个人觉得算,我们知道它效果好就行了,有必要知道Sora到底是怎么做的吗,我觉得最好是每个人能有知情的选择权,任何想知道的人都能够知道,这种状态比较好,那我们知道Sora到底是怎么做出来的吗,不知道,马斯克讽刺OpenAI...
-
国内首个中文原生DiT架构SOTA大模型全面开源!
非常令人激动,腾讯混元文生图大模型已在HuggingFace平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,且不管是企业还是个人开发者,全部免费可用,主页,https,dit.hunyuan.tencent.com,代码,https,github.com,Tencent,Hun...