包含"AI"标签的文章

  • 生成式AI的发展方向 应当是Chat还是Agent

      现在看,应该是Agent,前一段时间,比尔.盖茨在他的博客上发表了,AIisabouttocompletelychangehowyouusecomputers,比尔·盖茨在这篇文章中探讨了AIAgent对我们未来生活的巨大影响,他谈到了AIAgent在医疗保健、教育、生产力、娱乐和购物等领域的作用,...

    2024-11-14 162
  • 智能推理新路径 组合优化在生成式AI中的前沿探索

      尽管LLMs在生成自然语言文本方面表现出色,但在推理任务中的表现却不尽如人意,推理任务需要模型具备更高层次的认知能力,包括逻辑推理、因果关系分析和战略规划等,然而现有的LLMs在这些方面的能力有限,主要表现在缺乏深度推理能力,LLMs在处理复杂推理任务时,往往依赖于简单的模式匹配和统计规律,缺乏真正...

    2024-11-14 632
  • 收益太少 高盛洞察 生成式AI 投入很高

      本文翻译自高盛的最新报告,GenAI,Toomuchtospend,toolittlebenefit?,,高潮过后,更多的人开始审视生成式AI带来的实际收益问题,生成式AI技术将对公司、行业乃至整个社会的带来变革的承诺持续受到推崇,预计在未来数年中,科技巨头、各类企业和公共事业单位将在资本开支上投入...

    2024-11-14 609
  • 生成式AI 的爆发元年

      2023年4月,距离chatGPT的正式发布已经过去了四个多月,距离NewBing的发布过去了两个月,而GPT4同样也已经发布了一个月,各式各样围绕chatGPT或者说LLM模型的生态、社区、工作不断涌现,对GithubTrending榜单一直关注的人可能早就注意到,围绕chatGPT的各种包装库以...

    2024-11-14 312
  • 第一个多模态MoE Aria

      大模型领域的发展日新月异,每天都有许多有趣的论文值得深入品读,下面是本期觉得比较有意思的论文,1、Aria,第一个多模态,文本,代码,图像,视频,MoE论文标题,Aria,AnOpenMultimodalNativeMixture,of,ExpertsModel论文链接,https,arxiv.or...

    2024-11-14 148
  • 手机也能跑大模型 AI视觉革新 Llama 3.2

      Meta最新发布的Llama3.2不仅能看,还能在你的手机上运行,这次更新带来了多模态支持的LlamaVision和专为设备端优化的tiny模型,共推出10个新模型,规模从1B纯文本到90B多模态,文本,图像,不等,Llama3.2的核心亮点,1.Llama3.2Vision,推出11B和90B两种...

    2024-11-14 131
  • 如何让LLM学会试错

      大模型领域的发展日新月异,每天都有许多有趣的论文值得深入品读,下面是本期觉得比较有意思的论文,1、如何让LLM学会试错2、LLM竟然学会了自我反省,它真的有自我意识吗,1、如何让LLM学会试错你有没有想过,为什么人工智能经常会犯愚蠢的错误,原因可能让你意外,因为我们一直在教它做一个完美主义者!最新研...

    2024-11-14 164
  • LLMs 理论 应用与机遇 方法 MLLMs等领域的模型合并

      ​一、结论写在前面论文标题,ModelMerginginLLMs,MLLMs,andBeyond,Methods,Theories,ApplicationsandOpportunities论文链接,​​https,arxiv.org,pdf,2408.07666​​项目链接,​​https,gith...

    2024-11-14 601
  • LLM训练的隐秘危机 1%的合成数据或致模型崩溃

      1、LLM训练的隐秘危机,1%的合成数据或致模型崩溃在LLM快速发展的今天,一个令人担忧的现象正悄然出现——模型崩溃,研究发现,即便在训练数据中仅包含1%的合成数据,也可能导致LLM模型性能严重下降,无论如何增加训练数据量都无法提升效果,更令人意外的是,增加模型规模这一当前广泛采用的方法,非但不能缓...

    2024-11-14 633
  • 3.0秒杀同级别大模型 IBM重磅发布Granite

      大模型领域的发展日新月异,每天都有许多有趣的论文值得深入品读,下面是本期觉得比较有意思的论文,1、大模型要断粮了,最新综述揭示AI数据困境与突围之道2、IBM重磅发布Granite3.0,8B参数秒杀同级别大模型,还能随便商用!3、全球首个39语言多模态大模型开源,告别英语霸权1、大模型要断粮了,最...

    2024-11-14 869
  • CoPilot 让每个教师都能成为优秀导师 AI助手Tutor

      大模型领域的发展日新月异,每天都有许多有趣的论文值得深入品读,下面是本期觉得比较有意思的论文,1、AI助手TutorCoPilot,让每个教师都能成为优秀导师2、Mamba模型,医学影像分析的新纪元1、AI助手TutorCoPilot,让每个教师都能成为优秀导师论文标题,TutorCoPilot,A...

    2024-11-14 901
  • Mistral AI界的小而美 AI的最新力作如何重新定义边缘计算

      大模型领域的发展日新月异,每天都有许多有趣的论文值得深入品读,下面是本期觉得比较有意思的论文,1、AI界的小而美,MistralAI的最新力作如何重新定义边缘计算2、多智能体协作让大语言模型训练效率暴增1、AI界的小而美,MistralAI的最新力作如何重新定义边缘计算在人工智能飞速发展的今天,一个...

    2024-11-14 268
  • 效果 预训练&amp OLMoE 开源的MoE语言模型

      论文标题,OLMoE,OpenMixture,of,ExpertsLanguageModels论文链接,​​https,arxiv.org,pdf,2409.02060​​Weights,​​https,hf.co,allenai,OLMoE,1B,7B,0924​​Data,​​https,hf....

    2024-11-14 529
  • 用于长文本建模的记忆增强检索 MemLong

      ​一、结论写在前面论文标题,MemLong,Memory,AugmentedRetrievalforLongTextModeling论文链接,https,arxiv.org,pdf,2408.16967LLMs在各个领域的最新进展取得了显著的成功,然而,由于注意力机制的二次时间和空间复杂性以及生成过...

    2024-11-14 921
  • o1复制之旅有点燃 327个样本打破常规 这个OpenAI

      1、327个样本打破常规,这个OpenAIo1复制之旅有点燃人工智能领域最近又掀起一阵波澜——OpenAI发布了令人瞩目的O1模型,然而,这个模型的具体细节却如同蒙着面纱一般神秘,面对这种情况,一群研究者决定开启了一场别开生面的O1复制之旅,试图揭开这层面纱,最引人注目的是,研究团队提出了一个创新的...

    2024-11-14 638

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息