行业热门

  • MRAG 提升具有显著不同内容的多个文档复杂查询的检索准确性 一种多头RAG

      现有的RAG方案没有专注于需要检索多个具有显著不同内容的文档的查询,这类查询经常出现,但挑战在于这些文档的嵌入可能在嵌入空间中距离很远,难以全部检索,因此,提出一种多头检索增强生成方法,MRAG,Multi,HeadRAG,,它的关键思想是利用Transformer解码器的多头注意力层的激活,而不仅...

    2024-11-15 224
  • 微软 RAG并不是你唯一的解决方案!

      将外部数据整合到LLMs中的技术,如检索增强生成,RAG,和微调,得到广泛应用,但在不同专业领域有效部署数据增强LLMs面临着重大挑战,数据增强LLM应用中不同查询层次的主要技术总结​微软亚洲研究院,MSRA,提出了一种RAG任务分类方法,根据所需的外部数据类型和任务的主要焦点,将用户查询分为四个层...

    2024-11-15 252
  • 新一代智能助手GPT

      这两天我们见证了OpenAI、谷歌两巨头激烈的碰撞,二者竞争几乎白热化,14日,OpenAI凭借其GPT,4o模型,以语音和视频交互的全新方式,挑战传统的界限,15日,谷歌在2024年的I,O发布会上展示了ProjectAstra以及Gemini系列模型的最新进展,意图巩固其在搜索和AI领域的霸主地...

    2024-11-15 122
  • 使用自然语言进行SQL查询 3和LangChain 基于Llama

      在数据泛滥的今天,如何高效地从海量信息中提取有价值的洞察,已成为开发者面临的共同挑战,本文介绍一个创新项目——基于Streamlit的应用程序,它能够理解自然语言并直接与SQL数据库进行交互,从而简化数据分析流程,1环境设置在本项目中,我们选择PostgreSQL作为后端数据库,用户需自行安装并配置...

    2024-11-15 444
  • 一分钟搞定任意数量视图到3D场景重建 谷歌重磅发布CAT3D

      论文链接,https,arxiv.org,pdf,2405.10314项目链接,https,cat3d.github.io,3D重建的进步使得高质量的3D捕捉成为可能,但需要用户收集数百到数千张图像来创建一个3D场景,本文提出了CAT3D,一种通过多视点扩散模型模拟这种现实世界捕捉过程的方法,可以在...

    2024-11-15 248
  • 什么是AI Agent

      1概念在计算机、人工智能专业技术领域,一般将Agent译为,智能体,,其定义是在一定的环境中体现出自治性、反应性、社会性、预动性、思辨性,慎思性,、认知性等一种或多种智能特征的软件或硬件实体,AIAgent则是指由LLM驱动的智能体,目前它还没有一个被广泛接受的定义,但我们可以把它描述成这样一个系统...

    2024-11-15 751
  • 大语言模型推理算法 从解码到元生成 论文解读

      一、引言现代研究发现,训练大语言模型,LLMs,时增加计算量会带来更好的结果,但在推理时增加计算量的好处却较少被关注,本文聚焦于推理时的方法,探讨了令牌级生成算法、元生成算法和高效生成这三个主题,二、相关概念及背景1、用户目标在生成中的作用,用户使用语言模型生成输出时,可能希望获得高质量、多样化的输...

    2024-11-15 521
  • 音乐界的GPT免费!Suno v3.5全部开放 歌曲长达4分钟!未来敲敲塑料壶就能成天籁

      编辑,伊风出品,技术栈,微信号,blog51cto,Suno清晨干大事,宣布此前只对高级版和专业版用户开放的v3.5版本,所有用户都可用了!简单说,Suno生成的歌曲变长了也变强了,作为音乐界的ChatGPT,Sunov3的表现也很惊艳,但总让人听起来有种意犹未尽的感觉,相比市面上通常三分钟以上的流...

    2024-11-15 418
  • 卷不动了 Agentic的4种设计模式直接上手!

      小长假结束了,今天给家人们分享一下假期开源的一个Agent设计模式图,图画的很漂亮,热度蛮高的,然后还有大佬开源了配套的tutorialgithub项目,...。...

    2024-11-15 771
  • 我们距离GPT

      在ChatGPT引爆AI圈之后,很多人预言2024年将会是多模态的元年,的确,我们在23年的最后一季度见证了GPT,4V的发布,前不久Google家的Gemini和Anthropic的Claude3也同样支持多模态,MultimodaltoText,,并且Gemini1.5中能够从两小时的视频中准确...

    2024-11-15 871
  • 即插即用

      1模型创新点介绍1.1时间编码输入信息编码参考Informer论文,我们把源码和数据集制作进行了优化,方便任何带有时间特征列的数据集进行输入信息的编码,Informer在原始向量上不止增加了Transformer架构必备的PositionEmbedding,位置编码,还增加了与时间相关的各种编码,在...

    2024-11-15 414
  • 多模态

      本期推出结合CVPR2022视觉顶会论文RepLKNet的多模态故障诊断创新模型,适合各种故障诊断领域、电能质量扰动信号、各种声信号、脑电信号等分类任务,创新模型还未发表!!!有小论文、毕业论文需求的不容错过!提供马尔可夫转换场MTF、递归图RP、格拉姆矩阵GAF、连续小波变换CWT、短时傅里叶变换...

    2024-11-15 854
  • Auto

      Auto,Retrieval是一种高级的RAG技术,它在启动向量数据库检索之前使用AgentLLM动态推断元数据过滤器参数和语义查询,而不是将用户查询直接发送到向量数据库检索接口,例如密集向量搜索,的朴素RAG,您可以将其视为查询扩展,重写的一种形式,也可以将其视为函数调用的一种特定形式;后文我们将...

    2024-11-15 779
  • ICML 2024高分论文

      本文共同第一作者简介,张逸骅,密歇根州立大学计算机系博士三年级学生,师从SijiaLiu教授,主要研究方向是大模型的安全、隐私和效率问题,李平治,本科毕业于中国科学技术大学,将于2024Fall博士入学北卡罗来纳大学教堂山分校,师从陈天龙教授,主要研究兴趣集中在高效机器学习和AI4Science领域...

    2024-11-15 650
  • 揭示ChatGPT提示词背后的本质 让它火力全开 由浅到深

      你是否曾经想过,当你在使用ChatGPT这样的AI模型时,你输入的文字是如何影响模型的输出的,你是否知道,有一些特殊的文字,可以像咒语一样,引导模型发挥出最大的能力,甚至让它做出你想不到的事情,你是否想了解,如何与模型有效地沟通,让它成为你的得力助手,而不是你的对手,如果你对这些问题感兴趣,那么本文...

    2024-11-15 319

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息