包含"模型"标签的文章

  • 帮你实现! 国产开源大语言模型 ChatGLM 想不想把ChatGPT装在自己电脑上

      ChatGLM,6B是一个开源的、支持中英双语的对话语言模型,基于GeneralLanguageModel,GLM,架构,具有62亿参数,结合模型量化技术,用户可以在消费级的显卡上进行本地部署,INT4量化级别下最低只需6GB显存,ChatGLM,6B使用了和ChatGPT相似的技术,针对中文问答和...

    2024-11-14 497
  • 大模型也有小偷 上交大给大模型制作 人类可读指纹 为保护你的参数

      大模型的预训练需要耗费巨量的计算资源和数据,因而预训练模型的参数也正成为各大机构重点保护的核心竞争力和资产,然而,不同于传统的软件知识产权保护可以通过比对源代码来确认是否存在代码盗用,对预训练模型参数盗用的判断存在以下两方面的新问题,1,预训练模型的参数,尤其是千亿级别模型的参数,通常不会开源,2,...

    2024-11-14 99
  • NLP模型超越人类水平 你可能碰到了大忽悠

      编译,张睿毅、武帅、钱天培一个军方训练的神经网络声称可以分类图像中的坦克,但实际上,它只是学会了识别不同的亮度,因为一种类型的坦克仅出现在明亮的图片中,而另一种类型仅出现在较暗的图片中,一个游戏AI在学会了在第一关的最后故意死去,而不是在更难的第二关的开局死去,因为这样可以得到更高的分数,AI通过某...

    2024-11-14 815
  • LeCun 大模型方向错了 智力无法接近人类 Yann

      语言只承载了所有人类知识的一小部分;大部分人类知识、所有动物知识都是非语言的;因此,大语言模型是无法接近人类水平智能的,,这是图灵奖得主YannLeCun对于人工智能前景的最新思考,昨天,他与纽约大学博士后JacobBrowning合著的新文章发表在,NOEMA,上,引发了人们的讨论,在文章中,作者...

    2024-11-14 797
  • 苹果创新大模型压缩技术 大模型有机会塞进手机里了

      大型语言模型,LLM,,尤其是生成式预训练Transformer,GPT,模型在许多复杂的语言任务上表现出了出色的性能,这一突破使人们希望在移动设备上本地运行这些LLM,以保护用户隐私,可是,即使是小型LLM也太大,无法在这些设备上运行,举例来说,小型LLaMA有7B参数,其FP16版本大小为14G...

    2024-11-14 484
  • 国产大模型在卷什么 Llama2开源后

      7月19日,开源社区最强的大模型从Llama升级到Llama2,后者在2万亿的token上进行训练,训练数据增加了40%,在包括推理、编码、精通性和知识测试等许多外部基准测试中,皆优于其他开源语言模型,以前的开源大模型都没有形成像Llama这样的社区,而Llama系列模型正是在这种非常活跃的社区文化...

    2024-11-14 826
  • 声音效果媲美人类 MaskGCT宣布开源 国产最强语音大模型诞生

      近期,港中大,深圳,联手趣丸科技联合推出了新一代大规模声音克隆TTS模型——MaskGCT,该模型在包含10万小时多语言数据的Emilia数据集上进行训练,展现出超自然的语音克隆、风格迁移以及跨语言生成能力,同时保持了较强的稳定性,MaskGCT已在香港中文大学,深圳,与上海人工智能实验室联合开发的...

    2024-11-14 279
  • 是全村希望还是智商税 开源模型

      大模型的场域,被开闭源自动地划分为两个阵营,自此,开闭源之争的硝烟一直盘旋在大模型的上空,从奥特曼颇为无力的辩称,OpenAI的Open指的是人工智能成果的广泛共享,而非模型的开源,到李彦宏直截了当的断言,开源模型可能是一种,智商税,,随着时间的推移,开源模型只会越来越落后,开源模型在商业模式上的断...

    2024-11-14 767
  • 大模型不性感了! 公开征集建议!网友 出炉 OpenAI 大模型宪法

      编辑,云昭出品,技术栈,微信号,blog51cto,本周的OpenAI,似乎并未辜负其名称中的,开放,字样,近日,OpenAI虽然没有开源任何新模型,但该公司非常之,清流,,一改铜臭的商业味道,1.OpenAI加入开放性组织推出内容真实性工具5月7日,该公司发布公告加入C2PA,致力于开发确定内容来...

    2024-11-14 699
  • Thoughtworks肖然 大模型走向大众 需要新的应用开发逻辑

      嘉宾,肖然采访&amp,撰稿,云昭出品,技术栈,微信号,blog51cto,新年伊始,AI大佬们频繁被问及一个话题,什么时候有杀手级AI应用,几个月过去,诸如AIPin、RabbitR1、Devin等AI产品一闪而过,真正令人,啊哈,的AI应用迟迟未现,大模型时代的KillerApp,并不会...

    2024-11-14 819
  • 官方现场摇人30s直出!视觉模型进入上下文时代 国产地表最强视频模型震惊歪果仁

      来自中国的视频生成模型,再一次震惊了全球大模型圈,生数科技推出的Vidu1.5,成为世界首个支持多主体一致性的多模态模型!上传小哥、机甲、街景,接下来,就是见证奇迹的时刻,人、物、环境,被天衣无缝地融合到了同一个视频中,简直令人惊叹,这种方法,颠覆了LoRA等传统的单点微调方法,标志着视频模型统一理...

    2024-11-14 616
  • 谷歌&amp 甚至网络!北大&amp 马普所提出TokenFormer Token化一切 Transformer从来没有这么灵活过!

      本论文第一作者是汪海洋,北京大学20级博士生,目前主要关注是通用模型的架构设计和学习算法,指导教授主要包括王立威,北京大学智能学院教授;BerntSchiele,德国马普计算所教授;FedericoTombari谷歌人工智能科学家等,新一代通用灵活的网络结构TokenFormer,Rethinkin...

    2024-11-14 369
  • V3 突破文本渲染限制 深度解析Recraft 黑马是怎样炼成的 文生图

      在当前的图像生成技术中,文本渲染的能力已逐渐成为衡量其先进性的重要标准,不论是学术界的最新研究还是市场上的先进产品,都在竞相展示其处理复杂文本的能力,这不仅标志着技术的进步,更是成为一种创新的分水岭,实际上,字图生成技术在多个领域内显示出显著的实用性,例如在设计海报、书籍封面、广告和LOGO等方面,...

    2024-11-14 287
  • 具身多智能体任务中规划与推理的基准测试框架 Meta最新!PARTNR

      本文提出了一个人机协作中的规划与推理任务基准,PARTNR,,旨在研究家庭活动中的人机协调,PARTNR任务展现了日常任务的特点,如空间、时间和异构agent能力约束,我们采用大型语言模型,LLMs,构建了一个半自动化的任务生成流程,并融入了循环中的模拟以进行实现和验证,PARTNR是同类基准中规模...

    2024-11-14 671
  • 感知规划一网打尽~ Waymo玩明白了!全新多模态端到端算法EMMA

      写在前面&amp,笔者的个人理解本文介绍了EMMA,一种用于自动驾驶的端到端多模态模型,EMMA建立在多模态大型语言模型的基础上,将原始摄像头传感器数据直接映射到各种特定于驾驶的输出中,包括规划者轨迹、感知目标和道路图元素,EMMA通过将所有非传感器输入,如导航指令和自车状态,和输出,如轨迹...

    2024-11-14 476

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息