包含"AI"标签的文章
-
HuggingFace模型转一键llamafile包完整教程 通义千问成功案例分享
随着通义千问开源版的发布,越来越多的用户希望能在本地部署这款优秀的中文大模型,然而,传统的部署方式往往需要复杂的环境配置,让很多非技术背景的用户望而却步,今天,我要向大家介绍一个革命性的方案,将通义千问转换为Llamafile格式,实现真正的一键运行!有关llamafile的特点,我在上周的文章中做...
-
框架HiQA MDQA 大幅降低区分度低的复杂多文档RAG的幻觉问题 先进的多文档问答
背景检索增强生成,RAG,迅速推进了语言模型领域,特别是在问答,QA,系统,通过在响应生成阶段集成外部文档,RAG显著提高了语言模型的准确性和可靠性,这种方法提高了响应的质量,并降低了幻觉的频率,其中模型生成了错误或误导性的信息,然而,这些方法表现出有限的检索精度时,面对众多的难以区分的文件,在其实...
-
一文彻底搞懂深度学习
Transformer是一种基于自注意力,Self,Attention,机制的深度学习模型,最初由Vaswani等人在2017年的论文,AttentionIsAllYouNeed,中提出,它完全基于注意力机制构建,摒弃了传统的循环和卷积结构,用于解决自然语言处理领域的任务,如机器翻译、文本生成等,T...
-
快速上云 100%中奖 社区专属福利 免费试用
活动时间内完成注册亚马逊云科技账号,即可获得以下福利免费试用100多款云产品,带你体验快速上云热门场景,带你手把手轻松搭建AI.x社区专属福利,100%获得精美礼品奖品名称奖品图片一等奖戴尔Pro无线键鼠套装二等奖定制电脑背包三等奖50元京东E卡中奖率100%!!!活动时间,即日起至11月29日16...
-
实现了个ChatGPT趋动的游戏 玩得乐此不疲
今天给大家带来一篇,简单实现一个ChatGPT驱动的游戏,文章,来自知乎@九号,已授权,今年四月份读了斯坦福GenerativeAgent的论文,觉得特别好玩,花几天时间实现了这个demo,后来拿着这个demo去参加hackathon,竟然拿了二等奖还帮我赢了1300多刀,最近提到这个demo,同事...
-
NeurIPS24 针对时序预测中时间戳特征的研究
这篇文章给大家介绍一下北邮在NeurIPS2024中发表的一篇时间序列预测工作,重点研究了如果有效利用时间戳特征提升时序预测效果,相关方法可以嵌入到现有的各类SOTA时序预测模型中,论文标题,RethinkingthePowerofTimestampsforRobustTimeSeriesForec...
-
通用3D 生成任意3D和4D场景!GenXD
文章链接,https,arxiv.org,pdf,2411.02319项目链接,https,gen,x,d.github.io,亮点直击总结速览解决的问题现有的2D视觉生成已取得显著进展,但3D和4D生成在实际应用中仍然面临挑战,主要由于缺乏大规模4D数据和有效的模型设计,提出的方案应用的技术达到的...
-
科学报告 自然 大模型在社会情境判断方面可以胜过人类
大模型在许多任务上表现优异,但是它们在社交情境中的判断能力仍是一个亟待解答的问题,社会情境判断不仅涉及对情境的理解,还包括适应和回应他人行为的能力,11月10日,自然,科学报告子刊发布文章,Largelanguagemodelscanoutperformhumansinsocialsituation...
-
探索Llama 3 迄今为止最强的开源大型语言模型!
在AI领在Meta的最新发布会上,公司官方宣布推出两个版本的Llama3模型,具体为80亿和700亿参数版本,这一举动不仅标志着Llama3成为目前全球最强大的开源大模型,同时也预示着人工智能技术向更高层次的跃进,Llama3的发布,是对AI领域的一次重大贡献,在多个基准测试中,Llama3的表现超...
-
DMS 如何破解电商7大挑战 AnalyticDB助力企业智能决策
导语本文为数据库,拥抱Data,AI,系列连载第1篇,该系列是阿里云瑶池数据库面向各行业Data,AI应用场景,基于真实客户案例&,最佳实践,展示Data,AI行业解决方案的连载文章,本篇内容针对电商行业痛点,将深入探讨如何利用数据与AI技术以及数据分析方法论,为电商行业注入新的活力与...
-
使用Streamlit LangChain和Bedrock构建一个交互式聊天机器人
本文将帮助你使用低代码前端、用于会话管理的LangChain以及用于生成响应的BedrockLLM来创建聊天机器人,在不断发展的AI领域,聊天机器人已成为一种不可或缺的工具,用于增强用户参与度和简化信息传递,本文将逐步介绍构建交互式聊天机器人的具体过程,使用Streamlit作为前端、使用LangC...
-
Retrieval让RAG再进化 Anthropic研究团队提出新技术 引入Contextual 大幅降低检索失败率
在当前的知识检索领域,RAG技术正引领着最新潮流,它的目标是为大型语言模型,LLM,提供丰富而精确的上下文信息,然而,传统RAG方法在处理信息时经常会忽略上下文细节,这限制了其从知识库中提取相关信息的能力,解决如何有效保存上下文信息的问题,已成为该领域的重点,针对这一挑战,Anthropic的研究...
-
LoRA或许暗藏玄机
大模型领域的发展日新月异,每天都有许多有趣的论文值得深入品读,下面是本期觉得比较有意思的论文,1、LoRA或许暗藏玄机近期,一项重磅研究揭示了AI训练中广受欢迎的LoRA方法可能存在隐患,虽然LoRA能让模型训练时节省90%以上的显存,在目标任务上表现堪比完整微调,但研究人员发现这种看似完美的方法背...
-
VideoAgent基于大语言模型的视频QA系统 斯坦福大学
架构上图是VideoAgent的概览图,VideoAgent通过搜索、聚合视频信息来完成长视频QA,整个系统包括一个核心LLM、VLM,视觉大语言模型,和CLIP工具,作者受到人类理解长视频的启发,提出了VideoAgent,通过基于Agent的系统来模拟这一过程的系统,将视频理解过程形式化为一系列...
-
人工智能 10分钟解读
一、前言2022年底,OpenAI推出的聊天机器人ChatGPT一经上线,便迅速引发了全球范围内的热议与追捧,仅在上线五天内,注册用户便突破了百万大关,ChatGPT的成功不仅展示了大语言模型,LLM,的强大能力,也标志着人类正式迈入了一个全新的人工智能时代,本文将以ChatGPT为切入点,回顾GP...