新闻资讯
-
刚刚 OpenAI发布sCM提升50倍效率 扩散模型重大技术突破!
1、sCM新扩散模型在今日凌晨,OpenAI推出了创新的扩散模型方法sCM,这一方法仅需两步骤即可生成高质量的图片和3D模型,实现了高达50倍的时钟速度提升,特别是在处理高分辨率任务时表现尤为出色,举例来说,利用sCM训练的一个拥有15亿参数的模型,在单个A100GPU上,无需进行任何推理优化,就能...
-
如何改良基于Basis的时间序列预测模型
今天介绍一篇NIPS2023中上海交大和蚂蚁集团联合发表的时间序列预测文章,基于basis的时间序列建模,目前代码已经开源,论文的详细信息如下,论文标题,BasisFormer,Attention,basedTimeSeriesForecastingwithLearnableandInterpret...
-
时间序列预测 NLP大模型新作 为时序预测自动生成隐式Prompt
今天给大家介绍一篇最新的大模型,时间序列预测工作,由康涅狄格大学发表,提出了一种将时间序列在隐空间和NLP大模型对齐,并利用隐空间prompt提升时间序列预测效果的方法,论文标题,S2IP,LLM,SemanticSpaceInformedPromptLearningwithLLMforTimeSe...
-
微软提出LLM
大型语言模型,LLM,在系统级优化中的新进展近年来,大型语言模型,LLM,在解决复杂问题的推理能力方面取得了显著进展,使其能够有效管理数千种工具和API调用,这些改进释放了它们在大规模系统中的潜力,包括UI,网络界面、移动应用程序、SQL后端和远程感应平台,这些用途通过需要集成各种API来加载、过滤...
-
mPLUG
OCR,Free多页文档理解的挑战与进展在现代信息时代,多页文档的自动理解和处理变得尤为重要,这些文档可能包括书籍、报告、学术论文等,它们通常包含大量的文本、图表和其他视觉元素,传统的文档理解方法依赖于光学字符识别,OCR,技术将图像转换为文本数据,然而,OCR过程不仅耗时,而且在处理高分辨率或多页...
-
Next
作者,FrankWittkampf编译,岳扬AIAgents之间往往存在很大差异,配图源自MidJ01内容简介IntroductionAIAgents的行为主要由两点决定,1,它所运行的基础模型,以及,2,输入给该模型的上下文信息,上下文信息输入的方式直接影响着Agents任务执行效果,甚至可以说,...
-
准确评估大模型长上下文能力 港中文提出CLongEval中文基准测试集
论文题目,ClongEval,AChineseBenchmarkforEvaluatingLong,ContextLargeLanguageModels论文地址,https,arxiv.org,abs,2403.03514代码地址,https,github.com,zexuanqiu,C...
-
技术 15种先进的检索增强生成 RAG
一、现状在AI领域,从原型到生产的过程极具挑战,构建大型语言模型,LLM,、小型语言模型,SLM,或多模态应用虽令人激动,但将其转化为可扩展、可靠的生产系统,需深入理解其复杂性,这不仅仅是硬件扩展或算法优化的问题,而是涉及数据、模型架构与应用需求之间关系的深入探究,二、15种RAG技术在本文中,我们...
-
阿里发布多模态大模型WINGS 解决基于LLM的多模态训练灾难遗忘问题 南大&
今天给大家介绍一篇南京大学、阿里巴巴联合发表的多模态模型建模方法WINGS,解决基于LLM的多模态模型在进行跨模态建模时的灾难遗忘问题,论文标题,WINGS,LearningMultimodalLLMswithoutText,onlyForgetting下载地址,https,arxiv.org,...
-
效果超越Gen 10倍速度突破质量瓶颈
论文链接,https,arxiv.org,pdf,2405.18750项目链接,https,t2v,turbo.github.io,基于扩散的文本到视频,T2V,模型取得了显著的成功,但仍然受到迭代采样过程速度缓慢的影响,为了解决这一挑战,一些一致性模型被提出来促进快速推理,尽管以牺牲样本质量为代价...
-
哈工大团队提出智能仓库的多智能体深度学习解决方案 从目标分配到路径规划
随着物流行业的快速发展,智能仓库技术应运而生,旨在提高仓储效率和灵活性,传统仓库依赖传送带等固定设备,虽然能够完成基本的物料搬运任务,但其灵活性差,难以适应不断变化的需求,智能仓库通过引入多智能体系统,利用自主移动的机器人来完成货物的搬运和分拣,大大提升了仓储操作的效率和灵活性,然而智能仓库面临的一...
-
高质量3D资产规模化生成!南洋理工等重磅开源3DTopia 3D生成基础模型来了!只需5秒
文章链接,https,arxiv.org,pdf,2409.12957项目链接,https,3dtopia.github.io,3DTopia,XL,今天AI生成未来和大家分享的是南洋理工、北大、上海AILab和港中文联合发布的3DPBR资产生成最新工作3DTopia,XL,通过基于高效且表达力强的...
-
超GPT 阿里史上最大规模开源发布
今天凌晨,阿里巴巴官宣了史上最大规模的开源发布,推出了基础模型Qwen2.5、专用于编码Qwen2.5,Coder和数学的Qwen2.5,Math,这三大类模型一共有10多个版本,包括0.5B、1.5B、3B、7B、14B、32B和72B,适用于个人、企业以及移动端、PC等不同人群不同业务场景的模型...
-
一文汇总时序预测新思路
在最近的时间序列预测研究工作中,有一类工作将图学习和时间序列结合了起来,从图学习的视角理解时间序列预测,这类工作中,一种是用图学习建模多变量间的关系,解决多元时序预测问题;另一种是直接把时间序列中的各个时间步看成图中的一个节点,用图学习建模时间步之间的依赖关系,这篇文章汇总了近期4篇图学习视角解决时...
-
一文回顾常见图像融合方法
背景介绍图像融合将多个源图像,可能来自不同传感器、不同视角、不同时间点,的信息整合到单一的输出图像中,这一过程旨在通过有效合并各源图像中的互补、冗余或独特信息,生成一个既包含所有关键细节又具有增强特性的综合图像,例如对多帧不同曝光设置下的图像融合可以实现高动态范围,HDR,效果,对多帧不同焦段的图像...