包含"清言"标签的文章
-
文档概要索引 简单提升检索性能的新选择
今天介绍了一种全新的LlamaIndex数据结构,文档摘要索引,将描述它如何比传统语义搜索提供更好的检索性能,并通过一个示例进行了演示,背景大型语言模型,LLM,的核心用例之一是针对自己的数据进行问答,为此,我们将LLM与,检索,模型配对,该模型可以对知识语料库执行信息检索,并使用LLM对检索到的文...
-
超级Agent 像人一样操控电脑!
Anthropic深夜发布重大更新,升级版Claude3.5Sonnet、新型号Claude3.5Haiku以及超级Agent,computeruse,新的ComputerUse可能是迄今为止最先进的AIAgent之一,它可以像人类一样使用计算机——查看屏幕、移动光标、点击和输入文本,Claude3...
-
用于长文本生成的记忆增强检索 RAG新范式MemLong
传统的注意力机制由于时间和空间复杂度的二次方增长,以及在生成过程中键值缓存的内存消耗不断增加,限制了模型处理长文本的能力,相关的解决方案包括减少计算复杂度、改进记忆选择和引入检索增强语言建模,检索增强生成,RAG,和MemLong的记忆检索流程,a,当检索到的信息长度超过模型的处理能力时,RAG甚至...
-
LLM集中爆发的一周 Open 卷疯了!
开源大模型领域热闹非凡的一周,各种开源,PaperAgent进行了概括,端侧、Code、RAG、Agent、Reflection,反思纠正,、MoE,你关注的都在这里了,ReflectionLlama,3.1,70B开源ReflectionLlama,3.170B是世界上顶尖的OpenLLM,通过反...
-
RAG RAU 进行全面 对检索增强型语言模型 深入综述 RALM
大型语言模型,LLMs,在自然语言处理,NLP,领域促进了重大进展,但它们也面临着诸如幻觉和需要特定领域知识等挑战,为了缓解这些问题,最近的一些方法将从外部资源检索到的信息与LLMs相结合,显著提高了它们在NLP任务中的表现,但是缺乏对检索增强型语言模型,RALM,全面概述,因此,对包括检索增强生成...
-
o1推理扩展的风吹到了RAG 性能飙升58.9%!
以往的研究主要集中在通过增加检索文档的数量或长度来扩展检索增强生成,RAG,中检索到的知识,然而,仅增加知识量而不提供进一步的指导存在一定的局限性,为此,GoogleDeepMind研究了RAG在推理计算扩展,InferenceScaling,情况下的性能,特别是当上下文很长时,通过应用最优配置,在...
-
拥抱全新Agent ToolGen! 忘记Tool检索
传统大模型工具调用的方法依赖于将工具描述作为上下文输入,这受到上下文长度的限制,并需要单独的、通常效率低下的检索机制,之前基于检索的方法与ToolGen之间的比较,以前的方法使用检索器根据相似性匹配检索相关工具,这些工具进一步被放入提示中供LLMs选择,ToolGen可以通过直接生成工具标记来检索工...
-
黑神话 成精 送自家狗子一键 AI二创 点燃全网!爆改二郎神
全球玩家鏖战,黑神话·悟空,!已经有打通关的玩家了,我不羡慕,因为通关后的空虚寂寞马上就会找上你们,开启二周目、三周目的同时,网上已有人用AI让这个神话永不落幕,打开某书就发现网友已经玩得不亦乐乎,让我们的超级英雄去大战西方异形怪物——甚至有人已经提前展望,黑神话,系列的下一部了,看出取景地是祖国大...
-
进化2.0!一键跟踪运动物体 代码权重数据全开源 分割一切
又是发布即开源!Meta,分割一切AI,二代在SIGGRAPH上刚刚亮相,相较于上一代,它的能力从图像分割拓展到视频分割,可实时处理任意长视频,视频中没见过的对象也能轻松分割追踪,更关键的是,模型代码、权重以及数据集通通开源!它和Llama系列一样遵循Apache2.0许可协议,并根据BSD,3许可...
-
2024 CVPR
想象一下,你仅需要输入一段简单的文本描述,就可以生成对应的3D数字人动画的骨骼动作,而以往,这通常需要昂贵的动作捕捉设备或是专业的动画师逐帧绘制,这些骨骼动作可以进一步的用于游戏开发,影视制作,或者虚拟现实应用,来自阿尔伯塔大学的研究团队提出的新一代Text2Motion框架,MoMask,正在让这...
-
玩转大模型!用Replicate一键部署
Replicate是一个云端的机器学习模型运行平台,它可以让用户使用云端API直接运行机器学习模型,而无需了解复杂的机器学习模型内部构造,Replicate允许用户在Python或JupyterNotebook中运行模型,并在云端进行模型的部署和调优,你可以用它运行他人发布的开源模型,也可以打包并发...
-
刚刚发布!一键生成动漫风格图片的开源模型
向大家介绍一个最新的AIGC开源项目——AnimagineXL3.1,这个项目是动漫主题文本到图像模型的最新迭代,旨在为用户提供更加优化和强大的动漫图像生成体验,在AnimagineXL3.1中,开发团队着重优化了几个关键方面,以确保模型在性能和功能上达到新的高度,首先,他们扩展了训练数据,不仅包括...
-
时尚穿搭想换就换 各种风格一键完美搭配!这个引爆时尚圈的平台上线了
随着科技的发展,时尚领域也迎来了新的革命,传统的试衣方式逐渐被现代科技所取代,虚拟试衣间的出现使得用户可以在舒适的家中轻松体验不同的服装风格,先前给大家也介绍过一些虚拟试衣的技术,例如AnyFit或者OutfitAnyone等,今天AIGCer给大家介绍一款亲测效果超棒的,可在线操作的平台———,是...
-
多种风格图片一键生成! ai画图二次元网站AI小聚
随着ai画图技术的发展,市面上ai画图软件的出现无疑是为图片创作者开启了崭新的绘画方式,现在很多喜欢二次元的朋友,喜欢使用一些ai画图网站来创作二次元风格的图片,这些AI画图二次元网站拥有许多绘画功能,能够一键生成多种风格的图片,今天我们就来介绍一种用ai画二次元图片的方法,一、怎么用ai画二次元风...
-
Qwen2.5 新一代开源大模型的卓越力量 探索阿里通义千问
在人工智能领域的快速发展进程中,阿里通义千问的Qwen2.5模型以其强大的性能和广泛的应用潜力,成为了备受关注的焦点,2024云栖大会上的发布,更是让Qwen2.5走进了更多开发者和研究者的视野,本文将深入探讨Qwen2.5的各项技术特点和优势,一、总体概述Qwen2.5全系列涵盖了多个尺寸的大语言...