包含"模型"标签的文章

  • 一幅艺术画作让大模型诞生新生物材料! 活久见 贝多芬的第九交响曲竟然跟材料结构有相似性

      出品,技术栈,微信号,blog51cto,太酷了,12日消息,麻省理工大学研究团队发表了一篇新的研究结果,研究发现,通过大模型的加持,科学和艺术竟然存在某种隐藏联系,进而可以生成新的生物材料,基于图形的人工智能模型,中,建议创建一种新的基于菌丝体的生物材料,右,,其灵感来自于瓦西里·康定斯基的画作,...

    2024-11-14 935
  • 优雅谈大模型 一文读懂LoRA

      Microsoft于2021年推出的LoRA是一种经济型微调模型参数的方法,现在大模型的参数规模动不动都在10亿级别以上,微调大模型,微调这里代表着SFT,例如读者将某个大模型拿到自身领域,想使用自身领域的知识再次训练和精校大模型,就属于模型微调的领域,的全面微调模式下,需要调整所有的参数,因此所需...

    2024-11-14 862
  • HuggingFace模型转一键llamafile包完整教程 通义千问成功案例分享

      随着通义千问开源版的发布,越来越多的用户希望能在本地部署这款优秀的中文大模型,然而,传统的部署方式往往需要复杂的环境配置,让很多非技术背景的用户望而却步,今天,我要向大家介绍一个革命性的方案,将通义千问转换为Llamafile格式,实现真正的一键运行!有关llamafile的特点,我在上周的文章中做...

    2024-11-14 790
  • 通用3D 生成任意3D和4D场景!GenXD

      文章链接,https,arxiv.org,pdf,2411.02319项目链接,https,gen,x,d.github.io,亮点直击总结速览解决的问题现有的2D视觉生成已取得显著进展,但3D和4D生成在实际应用中仍然面临挑战,主要由于缺乏大规模4D数据和有效的模型设计,提出的方案应用的技术达到的...

    2024-11-14 711
  • 探索Llama 3 迄今为止最强的开源大型语言模型!

      在AI领在Meta的最新发布会上,公司官方宣布推出两个版本的Llama3模型,具体为80亿和700亿参数版本,这一举动不仅标志着Llama3成为目前全球最强大的开源大模型,同时也预示着人工智能技术向更高层次的跃进,Llama3的发布,是对AI领域的一次重大贡献,在多个基准测试中,Llama3的表现超...

    2024-11-14 519
  • NeurIPS`24

      文章链接,https,arxiv.org,pdf,2409.02389项目链接,https,msr3d.github.io,亮点直击总结速览解决的问题现有的场景理解数据集和基准测试在数据模态、多样性、规模和任务范围方面存在局限性,无法充分支持对3D场景中情境理解的研究,提出的方案提出了多模态情境问答...

    2024-11-14 409
  • 如何将模型微调效率提升2 Unsloth揭秘

      在当今人工智能快速发展的时代,语言模型的应用越来越广泛,然而,要将预训练的语言模型应用到具体的任务中,往往需要进行微调,Unsloth作为一个预训练模型微调框架,因其出色的性能和独特的技术特点,受到了众多开发者的关注,本文将深入探讨Unsloth的相关内容,帮助读者全面了解这个强大的工具,一、Uns...

    2024-11-14 389
  • GPT

      猛料来了,OpenAI下一代旗舰模型被曝提升不如预期,消息来自TheInformation,具体指代号,猎户座,Orion,的模型相对GPT,4的提升幅度,小于GPT,4相对GPT,3,已进入收益递减阶段,或许这也是奥特曼曾说,可能不会把新模型命名为GPT,5的原因之一,消息一出,著名悲观派学者Ga...

    2024-11-14 845
  • 视觉大模型训练和推理加速

      大家好,我是来自NVIDIAGPU计算专家团队的陶砺,很高兴今天有机会在这里跟大家分享一下我和我的同事陈庾,在SwinTransformer这个视觉大模的型训练和推理优化上的一些工作,其中一些的方法与策略,在其他的模型训练、推理的优化上都可以使用,来提高模型的吞吐、提升GPU的使用效率、加快模型的迭...

    2024-11-14 345
  • 大模型训练的GPU联手CPU显存优化分析方法

      问题二,频繁数据拷贝,训练效率低在显存足够的情况下,我们可以直接采用GPU模式去训练模型,但是让所有的网络层都运行在GPU上就一定最高效吗,其实GPU只对特定任务更快,而CPU擅长各种复杂的逻辑运算,框架中有一些OP会默认在CPU上执行,或者有一些OP的输出会被存储在CPU上,因为这些输出往往需要在...

    2024-11-14 362
  • 大模型应用于数字人

      大模型会改变整个软件行业,其中具有代表性的产品之一是数字人,那么,什么是数字人呢,数字人涉及了哪些关键技术呢,大模型对数字人的发展带来哪些影响呢,1.什么数字人,数字人目前还缺乏一个相对统一的定义,有人把人类的数字孪生体定义为数字人,有人把虚拟世界中具有人类行为的实体定义为数字人,有人将3D人体模型...

    2024-11-14 200
  • 机器学习

      上述预处理数据加载完,模型执行了初始化,然后优化器也初始化后,就可以进行迭代训练了,不过迭代训练最重要的是设置学习率,根据loss动态调整参数,代码如下,...。...

    2024-11-14 469
  • 大模型系列之解读MoE

      Mixtral8x7B的推出,使我们开始更多地关注基于MoE的大模型架构,那么,什么是MoE呢,1.MoE溯源MoE的概念起源于1991年的论文AdaptiveMixtureofLocalExperts,https,www.cs.toronto.edu,~hinton,absps,jjnh91.pd...

    2024-11-14 928
  • 大模型提效研发 pilot auto 从copilot到

      嘉宾丨揭光发编辑丨诺亚出品,技术栈,微信号,blog51cto,日前,在主办的,WOT全球技术创新大会2023·深圳站,活动中,腾讯智能创作与内容平台部技术专家揭光发带来了主题演讲,大模型提效研发,从copilot到autopilot,,探讨了大模型如何重塑软件开发形态,如何从copilot走向au...

    2024-11-14 771
  • 从苹果智能看端上大模型应用

      将生成式人工智能集成到边缘设备本身就是一个重大挑战,我们需要在智能手机和计算机有限的计算能力和内存范围内高效地运行高级模型,确保这些模型运行迅速,而不会耗尽电池寿命或使设备过热,端上的局限增加了大模型应用的复杂性,此外,保护用户隐私至关重要,需要AI在不依赖云服务器的情况下在本地处理数据,今年,苹果...

    2024-11-14 384

联系我们

QQ号:***

微信号:***

工作日:9:30-18:30,节假日休息