行业热门

MRAG 提升具有显著不同内容的多个文档复杂查询的检索准确性一种多头RAG

现有的RAG方案没有专注于需要检索多个具有显著不同内容的文档的查询，这类查询经常出现，但挑战在于这些文档的嵌入可能在嵌入空间中距离很远，难以全部检索，因此，提出一种多头检索增强生成方法，MRAG，Multi，HeadRAG，，它的关键思想是利用Transformer解码器的多头注意力层的激活，而不仅...

2024-11-15 224

行业热门

微软 RAG并不是你唯一的解决方案！

将外部数据整合到LLMs中的技术，如检索增强生成，RAG，和微调，得到广泛应用，但在不同专业领域有效部署数据增强LLMs面临着重大挑战，数据增强LLM应用中不同查询层次的主要技术总结微软亚洲研究院，MSRA，提出了一种RAG任务分类方法，根据所需的外部数据类型和任务的主要焦点，将用户查询分为四个层...

2024-11-15 252

行业热门

新一代智能助手GPT

这两天我们见证了OpenAI、谷歌两巨头激烈的碰撞，二者竞争几乎白热化，14日，OpenAI凭借其GPT，4o模型，以语音和视频交互的全新方式，挑战传统的界限，15日，谷歌在2024年的I，O发布会上展示了ProjectAstra以及Gemini系列模型的最新进展，意图巩固其在搜索和AI领域的霸主地...

2024-11-15 122

行业热门

使用自然语言进行SQL查询 3和LangChain 基于Llama

在数据泛滥的今天，如何高效地从海量信息中提取有价值的洞察，已成为开发者面临的共同挑战，本文介绍一个创新项目——基于Streamlit的应用程序，它能够理解自然语言并直接与SQL数据库进行交互，从而简化数据分析流程，1环境设置在本项目中，我们选择PostgreSQL作为后端数据库，用户需自行安装并配置...

2024-11-15 444

行业热门

一分钟搞定任意数量视图到3D场景重建谷歌重磅发布CAT3D

论文链接，https，arxiv.org，pdf，2405.10314项目链接，https，cat3d.github.io，3D重建的进步使得高质量的3D捕捉成为可能，但需要用户收集数百到数千张图像来创建一个3D场景，本文提出了CAT3D，一种通过多视点扩散模型模拟这种现实世界捕捉过程的方法，可以在...

2024-11-15 248

行业热门

什么是AI Agent

1概念在计算机、人工智能专业技术领域，一般将Agent译为，智能体，，其定义是在一定的环境中体现出自治性、反应性、社会性、预动性、思辨性，慎思性，、认知性等一种或多种智能特征的软件或硬件实体，AIAgent则是指由LLM驱动的智能体，目前它还没有一个被广泛接受的定义，但我们可以把它描述成这样一个系统...

2024-11-15 751

行业热门

大语言模型推理算法从解码到元生成论文解读

一、引言现代研究发现，训练大语言模型，LLMs，时增加计算量会带来更好的结果，但在推理时增加计算量的好处却较少被关注，本文聚焦于推理时的方法，探讨了令牌级生成算法、元生成算法和高效生成这三个主题，二、相关概念及背景1、用户目标在生成中的作用，用户使用语言模型生成输出时，可能希望获得高质量、多样化的输...

2024-11-15 521

行业热门

音乐界的GPT免费！Suno v3.5全部开放歌曲长达4分钟！未来敲敲塑料壶就能成天籁

编辑，伊风出品，技术栈，微信号，blog51cto，Suno清晨干大事，宣布此前只对高级版和专业版用户开放的v3.5版本，所有用户都可用了！简单说，Suno生成的歌曲变长了也变强了，作为音乐界的ChatGPT，Sunov3的表现也很惊艳，但总让人听起来有种意犹未尽的感觉，相比市面上通常三分钟以上的流...

2024-11-15 418

行业热门

卷不动了 Agentic的4种设计模式直接上手！

小长假结束了，今天给家人们分享一下假期开源的一个Agent设计模式图，图画的很漂亮，热度蛮高的，然后还有大佬开源了配套的tutorialgithub项目，...。...

2024-11-15 771

行业热门

我们距离GPT

在ChatGPT引爆AI圈之后，很多人预言2024年将会是多模态的元年，的确，我们在23年的最后一季度见证了GPT，4V的发布，前不久Google家的Gemini和Anthropic的Claude3也同样支持多模态，MultimodaltoText，，并且Gemini1.5中能够从两小时的视频中准确...

2024-11-15 871

行业热门

即插即用

1模型创新点介绍1.1时间编码输入信息编码参考Informer论文，我们把源码和数据集制作进行了优化，方便任何带有时间特征列的数据集进行输入信息的编码，Informer在原始向量上不止增加了Transformer架构必备的PositionEmbedding，位置编码，还增加了与时间相关的各种编码，在...

2024-11-15 414

行业热门

多模态

本期推出结合CVPR2022视觉顶会论文RepLKNet的多模态故障诊断创新模型，适合各种故障诊断领域、电能质量扰动信号、各种声信号、脑电信号等分类任务，创新模型还未发表！！！有小论文、毕业论文需求的不容错过！提供马尔可夫转换场MTF、递归图RP、格拉姆矩阵GAF、连续小波变换CWT、短时傅里叶变换...

2024-11-15 854

行业热门

Auto

Auto，Retrieval是一种高级的RAG技术，它在启动向量数据库检索之前使用AgentLLM动态推断元数据过滤器参数和语义查询，而不是将用户查询直接发送到向量数据库检索接口，例如密集向量搜索，的朴素RAG，您可以将其视为查询扩展，重写的一种形式，也可以将其视为函数调用的一种特定形式；后文我们将...

2024-11-15 779

行业热门

ICML 2024高分论文

本文共同第一作者简介，张逸骅，密歇根州立大学计算机系博士三年级学生，师从SijiaLiu教授，主要研究方向是大模型的安全、隐私和效率问题，李平治，本科毕业于中国科学技术大学，将于2024Fall博士入学北卡罗来纳大学教堂山分校，师从陈天龙教授，主要研究兴趣集中在高效机器学习和AI4Science领域...

2024-11-15 650

行业热门

揭示ChatGPT提示词背后的本质让它火力全开由浅到深

你是否曾经想过，当你在使用ChatGPT这样的AI模型时，你输入的文字是如何影响模型的输出的，你是否知道，有一些特殊的文字，可以像咒语一样，引导模型发挥出最大的能力，甚至让它做出你想不到的事情，你是否想了解，如何与模型有效地沟通，让它成为你的得力助手，而不是你的对手，如果你对这些问题感兴趣，那么本文...

2024-11-15 319

行业热门

联系我们