包含"大模型"标签的文章
-
Face Hugging Transformers全流程实战 大模型微调
大模型微调,HuggingFaceTransformers全流程实战原创精选作者,崔皓2024,09,2610,42,20本文描述了模型微调技术,通过调整预训练模型的参数,使其适应特定任务,从而提升模型在特定领域的表现,文中以Yelp数据集为例,详细介绍了如何使用HuggingFaceTransfo...
-
百度商业多模态理解及 AIGC 创新实践
首先来介绍一下我们对多模态内容的感知,1、多模态理解提升内容理解能力,让广告系统在细分场景下更懂内容,在提升内容理解能力时,会遇到很多现实的问题,什么是好的多模态基础表征,什么是一个好的多模态表征,从广度上要扩大数据应用的范围,从深度上要提升视觉效果,同时保证场景的数据微调,之前,常规的思路是,训练...
-
大模型应用探索
一、传统知识管理的背景与挑战1、企业知识管理的必要性知识管理是每个企业都面临的一个非常重要的环节,借助知识管家可以全面提升企业的效率,一方面,随着互联网应用的发展,知识爆炸,如何实现企业知识的共享称成为企业面临的一个问题,企业通过知识共享不仅能提升效率,也能减少重复工作,另一方面,通过知识共享的模式...
-
大模型系列
RAG是2023年最流行的基于LLM的应用系统架构,有许多产品几乎完全建立在RAG之上,覆盖了结合网络搜索引擎和LLM的问答服务,到成千上万个数据聊天的应用程序,很多人将RAG和Agent作为大模型应用的两种主流架构,但什么是RAG呢,RAG又涉及了哪些具体的技术呢,1.什么是RAGRAG即检索增强...
-
搜索推荐技术的前沿探索 从大数据到大模型
大家好,我是施兴,花名叔宝,,来自阿里云机器学习平台PAI,主要负责产品架构,我们团队主要负责,①搜索推荐,这是我们较为成熟的一个领域;②涉及图像和视频多模态处理,如图像视频打标和StableDiffusion文生图,文生视频等相关工作;③在大模型场景下,阿里有通义系列大模型,我们负责通义的底层平台...
-
将很快进入智能体阶段;OpenAI最初三个目标一个已失效;智慧和能源可解锁AGI OpenAI奥特曼最新对话
编辑,言征出品,技术栈,微信号,blog51cto,2025,OpenAI会有哪些动作,SamAltman定下了哪些目标,如何看待自,宫斗,后相创始员工离职潮,以及大模型创业公司的壁垒和未来在哪里,近日,YC总裁GarryTan与OpenAICEOSamAltman展开了一场创业对话,Sam回忆了自...
-
黄仁勋 英伟达稳坐全球第一 辛顿 李飞飞的历史交汇 成为新霸主!回顾这波AI潮的起源
出品,技术栈,微信号,blog51cto,过去12年的AI热潮得益于三位在面对广泛批评时依然追求非传统理念的先驱,一位是多伦多大学的GeoffreyHinton,他几十年如一日地推广神经网络,尽管几乎所有人都怀疑它,第二位是Nvidia的CEO黄仁勋,他早早意识到GPU不仅仅能用于图形处理,第三位是...
-
谷歌大牛呼吁 风险太大! 老板们应该倾听开发者心声 现在的AI代码生成器操之过急
编译,言征出品,技术栈,微信号,blog51cto,对于,AI帮助生产力提高,这件事情上,开发人员与他们的老板,意见其实非常不一致,最近,Atlassian,DXDevEx进行了一项现状调查,结果非常有意思——调查结果显示,公司老板们认为AI是提高开发人员生产力和满意度的最有效方法,但高达三分之二的...
-
LLM仍然不能规划 刷屏的OpenAI o1远未达到饱和
规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力,随着大型语言模型,LLM,的出现,人们对LLM是否具有这种规划能力产生了极大的兴趣,最近,OpenAI发布了o1模型,一举创造了很多历史记录,o1模型拥有真正的通用推理能力,在一系列高难基准测试中展现出了超强实力,相比GPT,4o有巨大提...
-
上交大发布首个OpenAI 满满的经验洞察 o1复现项目进展报告
团队介绍,本项目的核心开发团队主要由上海交通大学GAIR研究组的本科三年级、四年级学生以及直博一年级研究生组成,项目得到了来自NYU等一线大型语言模型领域顶尖研究科学家的指导,在人工智能领域掀起巨浪的OpenAIo1模型发布三周后,一支由高校年轻研究者组成的团队今天发布了题为o1Replicatio...
-
刚刚 OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次,从1开始,了,大语言模型还能向上突破,OpenAI再次证明了自己的实力,北京时间9月13日午夜,OpenAI正式公开一系列全新AI大模型,旨在专门解决难题,这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题,Op...
-
专家为思维链 OpenAI的o1是万金油吗 这三种任务不适合让AI 想太多 !研究发现 泼冷水
出品,技术栈,微信号,blog51cto,别想太多!这句劝解有一定道理,在很多问题上过度思考反而会适得其反!AI是否也会这样呢,自OpenAI的o1推出后,思维链成为了AI能力升级的一个新方向,掌握了,慢思考,的AI,通过思维链的逐步推理,大幅提高了模型理解问题的深度和准确性,o1在国际数学奥林匹克...
-
微软 上了搜索的快车吗 百度 Kimi 秘塔 大模型真的 到Perplexity 从谷歌 搭
编辑,伊风出品,技术栈,微信号,blog51cto,回到一年前,Perplexity可能没想到自己押宝的这条赛道如今挤满了人,毕竟,直到今年4月,这家AI搜索的领头羊才刚刚迈入10亿美元俱乐部,然而就在上周,谷歌和OpenAI前后脚发布了新的AI搜索功能,大有打擂台的硝烟味,一下子,所有注视着AI发...
-
五个开源大模型文档聊天机器人
如何让企业内部大量的文档方便地被管理者或者员工使用,是数字化过程中的一项重要内容,文档聊天机器人可以基于大模型并以聊天的交互方式为用户提供文档服务,这是目前一个比较流行的提高文档使用效率的方案,团队可以通过聊天机器人简单地询问与文档有关的问题,即可获得即时、准确的回答,节省了大量的查找文档的时间,从...
-
o1两分钟捏应用 模型能力还在迅猛提升 控制无人机翻跟头!奥特曼现场连线 OpenAI开发者日
昨日,OpenAI的开发者日活动如期而至!OpenAI这次的开发者日主打一个世界巡演,这次的伦敦场过后,11.21日在新加坡还有一场收官活动,这次,事务繁忙的奥特曼没有亲临现场,采用了视频通话的形式和观众见面,而抗起大旗的是,OpenAI开发者体验主管RomainHuet,现场是这样的,一整个人从众...