包含"Agent"标签的文章

  • 英伟达&amp 斯坦福大学发布GRS 从真实世界观测中生成机器人仿真任务

      文章链接,https,arxiv.org,pdf,2410.15536亮点直击总结速览解决的问题,GRS系统旨在解决机器人、计算机视觉和AR,VR中的,真实到模拟,real,to,sim,转换问题,具体来说,通过单次RGBD观测生成数字孪生模拟环境,并生成适合虚拟agent训练的多样化、可解任务,提...

    2024-11-15 683
  • Salesforce等开源1万亿tokens多模态数据集 斯坦福

      华盛顿大学、斯坦福大学、Salesforce等研究人员联合开源了多模态数据集MINT,1T,据悉,MINT,1T共包含了大约1万亿个文本标记和34亿张图像,是现有开源多模态数据集的10倍,同时还首次从ArXiv网站中爬取了专业论文,进一步提升了数据质量,这对于开源领域开发GPT,4o、Gemini等...

    2024-11-15 679
  • AI诗人来了!斯坦福和微软联手 用大型语言模型优化诗歌创作

      探索大型语言模型,LLMs,在文本空间优化问题中的潜力在现代人工智能的研究与应用中,大型语言模型,LargeLanguageModels,简称LLMs,已经显示出其在处理复杂语言任务中的强大能力,从生成文本、理解文档到执行代码,LLMs的应用范围日益扩大,然而,除了这些生成性任务外,LLMs在优化问...

    2024-11-15 114
  • 开源大模型如何治理 斯坦福基础模型研究中心给您支招

      人工智能领域正经历着范式转变,基础模型,如GPT,4、LLAMA2,处于核心位置,驱动着技术创新和大量投资,这引发了对其监管的广泛需求,而在关于如何监管基础模型的讨论中,模型的发布过程至关重要,近日,由斯坦福大学基础模型研究中心主任PercyLiang领导的论文,ConsiderationsforG...

    2024-11-15 945
  • 阿里巴巴重磅开源EasyAnimate!基于DiT的长视频制作生态系统

      文章链接,https,arxiv.org,pdf,2405.18991开源地址,https,github.com,aigc,apps,EasyAnimate今天和大家一起学习下EasyAnimate,这是一种用于视频生成的高级方法,利用Transformer架构的强大性能实现高效成果,扩展了最初设计...

    2024-11-15 671
  • RAG能帮助LLM更靠谱吗 斯坦福新研究

      大语言模型,LLM,虽然功能强大,但容易出现幻觉,此外,它们受限于其训练语料库中包含的知识,因此无法回答有关近期事件或公开受限信息的查询,为了解决上述问题,检索增强生成,RAG,是一种常用的框架,它在LLM的提示中提供相关检索内容,获得相关信息的参考文档或数据库,并可以显著提高模型的准确性,大多数商...

    2024-11-15 948
  • 与OpenAI的Q*道殊同归 斯坦福团队发现语言模型的新路径为Q函数

      传统上LLM被视为复杂的文本生成器,能够在给定输入的基础上产生连贯且相关的输出,斯坦福大学的最新研究,FromrtoQ∗,YourLanguageModelisSecretlyaQ,Function,论文链接,​​​,为我们提供了一个全新的视角,它将LLM视为Q函数,这是强化学习中用于评估行动预期效...

    2024-11-15 966
  • 基于LLM增强的推荐系统重排

      一、结论写在前面论文来自香港城市大学、华为诺亚方舟实验室,论文标题,LLM,enhancedRerankinginRecommenderSystems论文链接,​​https,arxiv.org,pdf,2406.12433​​重排序是推荐系统中的关键组件,对精炼推荐算法的输出起着至关重要的作用,传...

    2024-11-15 770
  • 应对大模型即时感染 斯坦福大学和伦敦大学学院联合打造多智能体系统中的安全防线

      在多智能体系统中,LLM的应用变得越来越普遍,通过多个LLM协作来解决复杂任务的需求日益增加,然而随着这些技术的不断进步,新的安全威胁也随之而来,提示注入攻击是一种利用恶意提示来劫持模型执行非预期操作的攻击方式,在单智能体系统中,研究人员已经发现,这些攻击可以通过嵌入恶意提示在外部文档中,诱使模型执...

    2024-11-15 767
  • 是强者之间的游戏 直指 穷者唯有尽力而为 高能!谷歌前CEO斯坦福大学演讲内容泄露 AI 富者更富

      整理,诺亚出品,技术栈,微信号,blog51cto,前谷歌CEO埃里克·施密特最近访问了斯坦福大学并发表了演讲,最初,施密特误以为这是一场闭门会议,并告诉在场学生们会议内容需要保密,然而,实际上会议正通过网络进行同步直播,这一乌龙导致施密特在输出观点时格外,直言不讳,尽管斯坦福大学之后迅速从YouT...

    2024-11-15 823
  • 斯坦福&amp 即插即用!CVD 第一个生成具有相机控制的多视图一致视频方案! 港中文

      论文链接,https,arxiv.org,abs,2405.17414项目链接,https,collaborativevideodiffusion.github.io,最近对视频生成的研究取得了巨大进展,使得可以从文本提示或图像生成高质量的视频,在视频生成过程中添加控制是未来的重要目标,而最近一些将...

    2024-11-15 528
  • Wetzstein教授团队提出全息增强现实眼镜 问鼎Nature!斯坦福大学Gordon

      比较现有增强现实眼镜传统的增强现实眼镜使用振幅空间光调制器,例如有机发光二极管或微型发光二极管,需要一个投影器为基础的光学引擎,其厚度通常至少与投影镜头的焦距相同,全息增强现实眼镜设计使用相位空间光调制器,可以非常靠近入射光栅,从而使设备形态最小化,此外,与传统的增强现实眼镜不同,该全息设计可以为虚...

    2024-11-15 884
  • Crawl4AI带你体验高效AI 搞定网页爬取和数据提取 Agent工作流程

      嘿,大家好!这里是一个专注于AI智能体的频道!今天我要跟大家分享一个超级棒的开源工具——Crawl4AI,这个工具简直是构建AIAgent的福音,它自动化了网页爬取和数据提取的过程,让开发者们能更高效地构建智能Agent来收集和分析信息,首先,Crawl4AI是完全开源且免费的,这意味着开发者们可以...

    2024-11-15 150
  • 微软新综述 大模型RAG系统的4层境界!

      今天分享这篇很干的文章!通过对RAG系统的用户Query进行难度区分,进而可以将系统划分为4个等级,RetrievalAugmentedGeneration,RAG,andBeyond,AComprehensiveSurveyonHowtoMakeyourLLMsuseExternal&gt...

    2024-11-15 892
  • Agent也有快慢脑了!这次真的不一样

      在与用户进行自然对话交互时,智能体需要完成两个核心任务,一是进行对话交流,二是执行推理与规划,智能体在对话过程中,需要综合利用所有可获取的信息来做出回应,同时其行为要始终围绕目标展开,这种对话交互与多步推理规划的双重模式,与卡尼曼所描述的人类快速和缓慢思维系统颇为相似,基于这一理念,DeepMind...

    2024-11-15 478

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息