包含"ChatGPT"标签的文章
-
一分钟教你学会ai文生图 怎么用ai文字生成绘画图
怎么用ai文字生成绘画图,在当今时代,ai技术的发展,为我们的日常生活带来了太多的变化,特别是现在的AI绘画软件,不仅能够实现文字生成图片,还可以根据一张图片生成新图片,它让图片创作的方式变得多样化,也增加了创作图片的乐趣,那么怎么用ai文字生成绘画图呢,下面这个ai文生图的方法,希望可以帮助到大家...
-
音乐界的GPT免费!Suno v3.5全部开放 歌曲长达4分钟!未来敲敲塑料壶就能成天籁
编辑,伊风出品,技术栈,微信号,blog51cto,Suno清晨干大事,宣布此前只对高级版和专业版用户开放的v3.5版本,所有用户都可用了!简单说,Suno生成的歌曲变长了也变强了,作为音乐界的ChatGPT,Sunov3的表现也很惊艳,但总让人听起来有种意犹未尽的感觉,相比市面上通常三分钟以上的流...
-
用哈密顿力学提升AI推理能力 从物理学到人工智能
10月8日瑞典皇家科学院宣布,将2024年诺贝尔物理学奖授予美国普林斯顿大学的约翰·霍普菲尔德,JohnJ.Hopfield,和加拿大多伦多大学的杰弗里·辛顿,GeoffreyE.Hinton,,以表彰他们,为推动利用人工神经网络进行机器学习作出的基础性发现和发明,这一消息不仅引起了物理学界的关注,...
-
英伟达& 斯坦福大学发布GRS 从真实世界观测中生成机器人仿真任务
文章链接,https,arxiv.org,pdf,2410.15536亮点直击总结速览解决的问题,GRS系统旨在解决机器人、计算机视觉和AR,VR中的,真实到模拟,real,to,sim,转换问题,具体来说,通过单次RGBD观测生成数字孪生模拟环境,并生成适合虚拟agent训练的多样化、可解任务,提...
-
Salesforce等开源1万亿tokens多模态数据集 斯坦福
华盛顿大学、斯坦福大学、Salesforce等研究人员联合开源了多模态数据集MINT,1T,据悉,MINT,1T共包含了大约1万亿个文本标记和34亿张图像,是现有开源多模态数据集的10倍,同时还首次从ArXiv网站中爬取了专业论文,进一步提升了数据质量,这对于开源领域开发GPT,4o、Gemini等...
-
AI诗人来了!斯坦福和微软联手 用大型语言模型优化诗歌创作
探索大型语言模型,LLMs,在文本空间优化问题中的潜力在现代人工智能的研究与应用中,大型语言模型,LargeLanguageModels,简称LLMs,已经显示出其在处理复杂语言任务中的强大能力,从生成文本、理解文档到执行代码,LLMs的应用范围日益扩大,然而,除了这些生成性任务外,LLMs在优化问...
-
开源大模型如何治理 斯坦福基础模型研究中心给您支招
人工智能领域正经历着范式转变,基础模型,如GPT,4、LLAMA2,处于核心位置,驱动着技术创新和大量投资,这引发了对其监管的广泛需求,而在关于如何监管基础模型的讨论中,模型的发布过程至关重要,近日,由斯坦福大学基础模型研究中心主任PercyLiang领导的论文,ConsiderationsforG...
-
阿里巴巴重磅开源EasyAnimate!基于DiT的长视频制作生态系统
文章链接,https,arxiv.org,pdf,2405.18991开源地址,https,github.com,aigc,apps,EasyAnimate今天和大家一起学习下EasyAnimate,这是一种用于视频生成的高级方法,利用Transformer架构的强大性能实现高效成果,扩展了最初设计...
-
RAG能帮助LLM更靠谱吗 斯坦福新研究
大语言模型,LLM,虽然功能强大,但容易出现幻觉,此外,它们受限于其训练语料库中包含的知识,因此无法回答有关近期事件或公开受限信息的查询,为了解决上述问题,检索增强生成,RAG,是一种常用的框架,它在LLM的提示中提供相关检索内容,获得相关信息的参考文档或数据库,并可以显著提高模型的准确性,大多数商...
-
与OpenAI的Q*道殊同归 斯坦福团队发现语言模型的新路径为Q函数
传统上LLM被视为复杂的文本生成器,能够在给定输入的基础上产生连贯且相关的输出,斯坦福大学的最新研究,FromrtoQ∗,YourLanguageModelisSecretlyaQ,Function,论文链接,,为我们提供了一个全新的视角,它将LLM视为Q函数,这是强化学习中用于评估行动预期效...
-
基于LLM增强的推荐系统重排
一、结论写在前面论文来自香港城市大学、华为诺亚方舟实验室,论文标题,LLM,enhancedRerankinginRecommenderSystems论文链接,https,arxiv.org,pdf,2406.12433重排序是推荐系统中的关键组件,对精炼推荐算法的输出起着至关重要的作用,传...
-
应对大模型即时感染 斯坦福大学和伦敦大学学院联合打造多智能体系统中的安全防线
在多智能体系统中,LLM的应用变得越来越普遍,通过多个LLM协作来解决复杂任务的需求日益增加,然而随着这些技术的不断进步,新的安全威胁也随之而来,提示注入攻击是一种利用恶意提示来劫持模型执行非预期操作的攻击方式,在单智能体系统中,研究人员已经发现,这些攻击可以通过嵌入恶意提示在外部文档中,诱使模型执...
-
是强者之间的游戏 直指 穷者唯有尽力而为 高能!谷歌前CEO斯坦福大学演讲内容泄露 AI 富者更富
整理,诺亚出品,技术栈,微信号,blog51cto,前谷歌CEO埃里克·施密特最近访问了斯坦福大学并发表了演讲,最初,施密特误以为这是一场闭门会议,并告诉在场学生们会议内容需要保密,然而,实际上会议正通过网络进行同步直播,这一乌龙导致施密特在输出观点时格外,直言不讳,尽管斯坦福大学之后迅速从YouT...
-
斯坦福& 即插即用!CVD 第一个生成具有相机控制的多视图一致视频方案! 港中文
论文链接,https,arxiv.org,abs,2405.17414项目链接,https,collaborativevideodiffusion.github.io,最近对视频生成的研究取得了巨大进展,使得可以从文本提示或图像生成高质量的视频,在视频生成过程中添加控制是未来的重要目标,而最近一些将...
-
Wetzstein教授团队提出全息增强现实眼镜 问鼎Nature!斯坦福大学Gordon
比较现有增强现实眼镜传统的增强现实眼镜使用振幅空间光调制器,例如有机发光二极管或微型发光二极管,需要一个投影器为基础的光学引擎,其厚度通常至少与投影镜头的焦距相同,全息增强现实眼镜设计使用相位空间光调制器,可以非常靠近入射光栅,从而使设备形态最小化,此外,与传统的增强现实眼镜不同,该全息设计可以为虚...