模型_第20页_坚曼百货商行

帮你实现！国产开源大语言模型 ChatGLM 想不想把ChatGPT装在自己电脑上

ChatGLM，6B是一个开源的、支持中英双语的对话语言模型，基于GeneralLanguageModel，GLM，架构，具有62亿参数，结合模型量化技术，用户可以在消费级的显卡上进行本地部署，INT4量化级别下最低只需6GB显存，ChatGLM，6B使用了和ChatGPT相似的技术，针对中文问答和...

2024-11-14 497

生活资讯

大模型也有小偷上交大给大模型制作人类可读指纹为保护你的参数

大模型的预训练需要耗费巨量的计算资源和数据，因而预训练模型的参数也正成为各大机构重点保护的核心竞争力和资产，然而，不同于传统的软件知识产权保护可以通过比对源代码来确认是否存在代码盗用，对预训练模型参数盗用的判断存在以下两方面的新问题，1，预训练模型的参数，尤其是千亿级别模型的参数，通常不会开源，2，...

2024-11-14 99

玩具模型

NLP模型超越人类水平你可能碰到了大忽悠

编译，张睿毅、武帅、钱天培一个军方训练的神经网络声称可以分类图像中的坦克，但实际上，它只是学会了识别不同的亮度，因为一种类型的坦克仅出现在明亮的图片中，而另一种类型仅出现在较暗的图片中，一个游戏AI在学会了在第一关的最后故意死去，而不是在更难的第二关的开局死去，因为这样可以得到更高的分数，AI通过某...

2024-11-14 815

包包服装

LeCun 大模型方向错了智力无法接近人类 Yann

语言只承载了所有人类知识的一小部分；大部分人类知识、所有动物知识都是非语言的；因此，大语言模型是无法接近人类水平智能的，，这是图灵奖得主YannLeCun对于人工智能前景的最新思考，昨天，他与纽约大学博士后JacobBrowning合著的新文章发表在，NOEMA，上，引发了人们的讨论，在文章中，作者...

2024-11-14 797

百货

苹果创新大模型压缩技术大模型有机会塞进手机里了

大型语言模型，LLM，，尤其是生成式预训练Transformer，GPT，模型在许多复杂的语言任务上表现出了出色的性能，这一突破使人们希望在移动设备上本地运行这些LLM，以保护用户隐私，可是，即使是小型LLM也太大，无法在这些设备上运行，举例来说，小型LLaMA有7B参数，其FP16版本大小为14G...

2024-11-14 484

家电数码

国产大模型在卷什么 Llama2开源后

7月19日，开源社区最强的大模型从Llama升级到Llama2，后者在2万亿的token上进行训练，训练数据增加了40%，在包括推理、编码、精通性和知识测试等许多外部基准测试中，皆优于其他开源语言模型，以前的开源大模型都没有形成像Llama这样的社区，而Llama系列模型正是在这种非常活跃的社区文化...

2024-11-14 826

生活资讯

声音效果媲美人类 MaskGCT宣布开源国产最强语音大模型诞生

近期，港中大，深圳，联手趣丸科技联合推出了新一代大规模声音克隆TTS模型——MaskGCT，该模型在包含10万小时多语言数据的Emilia数据集上进行训练，展现出超自然的语音克隆、风格迁移以及跨语言生成能力，同时保持了较强的稳定性，MaskGCT已在香港中文大学，深圳，与上海人工智能实验室联合开发的...

2024-11-14 279

科技

是全村希望还是智商税开源模型

大模型的场域，被开闭源自动地划分为两个阵营，自此，开闭源之争的硝烟一直盘旋在大模型的上空，从奥特曼颇为无力的辩称，OpenAI的Open指的是人工智能成果的广泛共享，而非模型的开源，到李彦宏直截了当的断言，开源模型可能是一种，智商税，，随着时间的推移，开源模型只会越来越落后，开源模型在商业模式上的断...

2024-11-14 767

家电数码

大模型不性感了！公开征集建议！网友出炉 OpenAI 大模型宪法

编辑，云昭出品，技术栈，微信号，blog51cto，本周的OpenAI，似乎并未辜负其名称中的，开放，字样，近日，OpenAI虽然没有开源任何新模型，但该公司非常之，清流，，一改铜臭的商业味道，1.OpenAI加入开放性组织推出内容真实性工具5月7日，该公司发布公告加入C2PA，致力于开发确定内容来...

2024-11-14 699

头条

Thoughtworks肖然大模型走向大众需要新的应用开发逻辑

嘉宾，肖然采访&amp，撰稿，云昭出品，技术栈，微信号，blog51cto，新年伊始，AI大佬们频繁被问及一个话题，什么时候有杀手级AI应用，几个月过去，诸如AIPin、RabbitR1、Devin等AI产品一闪而过，真正令人，啊哈，的AI应用迟迟未现，大模型时代的KillerApp，并不会...

2024-11-14 819

头条

官方现场摇人30s直出！视觉模型进入上下文时代国产地表最强视频模型震惊歪果仁

来自中国的视频生成模型，再一次震惊了全球大模型圈，生数科技推出的Vidu1.5，成为世界首个支持多主体一致性的多模态模型！上传小哥、机甲、街景，接下来，就是见证奇迹的时刻，人、物、环境，被天衣无缝地融合到了同一个视频中，简直令人惊叹，这种方法，颠覆了LoRA等传统的单点微调方法，标志着视频模型统一理...

2024-11-14 616

生活资讯

谷歌&amp 甚至网络！北大&amp 马普所提出TokenFormer Token化一切 Transformer从来没有这么灵活过！

本论文第一作者是汪海洋，北京大学20级博士生，目前主要关注是通用模型的架构设计和学习算法，指导教授主要包括王立威，北京大学智能学院教授；BerntSchiele，德国马普计算所教授；FedericoTombari谷歌人工智能科学家等，新一代通用灵活的网络结构TokenFormer，Rethinkin...

2024-11-14 369

百货

V3 突破文本渲染限制深度解析Recraft 黑马是怎样炼成的文生图

在当前的图像生成技术中，文本渲染的能力已逐渐成为衡量其先进性的重要标准，不论是学术界的最新研究还是市场上的先进产品，都在竞相展示其处理复杂文本的能力，这不仅标志着技术的进步，更是成为一种创新的分水岭，实际上，字图生成技术在多个领域内显示出显著的实用性，例如在设计海报、书籍封面、广告和LOGO等方面，...

2024-11-14 287

百货

具身多智能体任务中规划与推理的基准测试框架 Meta最新！PARTNR

本文提出了一个人机协作中的规划与推理任务基准，PARTNR，，旨在研究家庭活动中的人机协调，PARTNR任务展现了日常任务的特点，如空间、时间和异构agent能力约束，我们采用大型语言模型，LLMs，构建了一个半自动化的任务生成流程，并融入了循环中的模拟以进行实现和验证，PARTNR是同类基准中规模...

2024-11-14 671

数码资讯

感知规划一网打尽~ Waymo玩明白了！全新多模态端到端算法EMMA

写在前面&amp，笔者的个人理解本文介绍了EMMA，一种用于自动驾驶的端到端多模态模型，EMMA建立在多模态大型语言模型的基础上，将原始摄像头传感器数据直接映射到各种特定于驾驶的输出中，包括规划者轨迹、感知目标和道路图元素，EMMA通过将所有非传感器输入，如导航指令和自车状态，和输出，如轨迹...

2024-11-14 476

包含"模型"标签的文章

帮你实现！国产开源大语言模型 ChatGLM 想不想把ChatGPT装在自己电脑上

大模型也有小偷上交大给大模型制作人类可读指纹为保护你的参数

NLP模型超越人类水平你可能碰到了大忽悠

LeCun 大模型方向错了智力无法接近人类 Yann

苹果创新大模型压缩技术大模型有机会塞进手机里了

国产大模型在卷什么 Llama2开源后

声音效果媲美人类 MaskGCT宣布开源国产最强语音大模型诞生

是全村希望还是智商税开源模型

大模型不性感了！公开征集建议！网友出炉 OpenAI 大模型宪法

Thoughtworks肖然大模型走向大众需要新的应用开发逻辑

官方现场摇人30s直出！视觉模型进入上下文时代国产地表最强视频模型震惊歪果仁

谷歌&amp 甚至网络！北大&amp 马普所提出TokenFormer Token化一切 Transformer从来没有这么灵活过！

V3 突破文本渲染限制深度解析Recraft 黑马是怎样炼成的文生图

具身多智能体任务中规划与推理的基准测试框架 Meta最新！PARTNR

感知规划一网打尽~ Waymo玩明白了！全新多模态端到端算法EMMA

联系我们