包含"清言"标签的文章
-
大模型是泡沫吗
我个人对llm是一种很复杂的态度,毕竟,它真的击碎了我2023年之前所有的技术积累,以前在nlp苦心钻研的训练经验、模型结构、不同任务类型的不同处理技巧,好像在ChatGPT面前显得一文不值,不过,事情都有两面性,与我的技术一起被击碎的,还有我那一潭死水的工作内容,我不再是特征工程师——,花了几个月...
-
综述
大家好,我是刘聪NLP,大模型已经展现出了较强的文本生成能力,但随着使用场景变得越加复杂和严格,除了避免生成误导或不当言论内容外,往往还希望可以满足用户的特殊需求,而可控文本生成就是为了在保持文本生成有用性、流畅性和多样性的同时,保证文本符合预定的控制条件,例如安全性、主题一致性、语言风格等,今天给...
-
大模型微调终极指南
大家好,我是刘聪NLP,今天给大家带来一篇大模型微调相关的最新综述,主要大模型微调归纳为7个阶段分别为数据准备、模型初始化、训练环境配置、模型微调、模型评估与验证、模型部署以及模型监控与维护,Paper,https,arxiv.org,abs,2408.13296模型微调,Fine,Tuning,就...
-
意料之中的尺寸 意料之外的效果 GLM4模型开源
写在前面今天智谱开了GLM,4,9B的模型,不是6B,是9B,一共开源了四个模型,Base版本模型,GLM,4,9B,、Chat版本模型,GLM,4,9B,Chat和GLM,4,9B,Chat,1M,和多模态模型,GLM,4V,9B,Chat,其中,模型为多语言模型除了支持中文、英文之外,还支持日语...
-
你值得拥有!!! Qwen2.5系列模型开源
Ta来了,Ta来了,Ta带着7个Size的开源模型迎面走来了,是的,期待已久的Qwen2.5开源了,共有7个尺寸规模,包括,0.5B、1.5B、3B、7B、14B、32B和72B,分别有Base模型和Instruct模型,本次全是Dense模型,没有MoE模型,同时还开源了Qwen2.5,Coder...
-
Agent智能代理如何快速变现 AI
AIAgent,即人工智能代理,是一种能够感知环境、进行自主理解、决策和执行动作的智能实体,它基于大语言模型,能够通过独立思考、调用工具来逐步完成给定目标的计算机程序,AIAgent的核心在于其自主性和自适应性,在特定任务或领域中能够自主地进行学习和改进,追溯起来,代理是一个历史悠久的概念,对这个概...
-
中国文生视频模型超高质量! 免费试用!国外惊讶 比肩Sora
中国知名大模型平台MiniMax旗下的海螺AI,最新上线的文生视频产品,受到了国外的盛赞,多数人表示一点也不比Sora、Runway、luma等国际顶级产品差,根据,AIGC开放社区,实际使用体验来看,其生成视频的质量、推理效率、动作一致性,多样性、文本语义还原、色彩搭配、景深、光影效果等非常优秀,...
-
AI生态中的云原生组件
1.核心云原生组件容器化技术是云原生的核心,它通过将应用及其依赖项打包到一个轻量级、独立的容器中,确保了应用在不同环境中的一致运行,作为两种主流的容器引擎,Docker和containerd广泛应用于AI模型的开发和部署,Docker提供了简便的容器化工具链,而containerd则作为一个高效、专...
-
大模型 付费API计费方式 API的使用 免费获取试用API方法 LLM
API,应用程序编程接口,ApplicationProgrammingInterface,是一组定义和协议,用于构建和集成应用程序软件,API允许不同的软件系统之间进行通信和数据交换,大模型API是大模型应用开发的基础,API的使用不需要很高的算力,CPU就能跑,1.API作用及优势大模型API,...
-
AI.x社区原创内容发布规范
欢迎来到AI.x,AI.x社区致力于为技术人提供一个和谐、融洽、气氛良好、内容优质的交流与学习的平台,社区鼓励大家积极踊跃发布有价值的内容,与我们共建AIGC的专属生态,一、原创要求,一,原创内容特指以下含义,原创帖子,本人独立完成的文章创作,不属于歪曲、篡改他人创作或者抄袭、剽窃他人创作而产生的作...
-
如何在淘宝人生2一键定制你的专属3D数字人
捏脸玩法是装扮类应用的一个核心功能,本文主要介绍了捏脸的AI相关玩法之一即基于用户上传的照片在淘宝人生2,又名,第二人生,一键生成专属3D数字人,阐述了淘天FC淘宝人生技术团队在图片捏脸上探索的心路历程,核心原理以及技术框架,本文的视角也不局限于图片捏脸本身,也介绍了其他AI类相关玩法在装扮类应用落...
-
100万上下文敞开用 谷歌最强大模型免费开放了!长音频理解功能独一份
谷歌最强大模型Gemini1.5Pro今天起,,全面,对外开放,目前完全免费,开发者可以通过API调用的方式使用,普通玩家也可以在谷歌AIStudio中直接体验,Ps.发布这则消息的谷歌工程师LoganKilpatrick正是原来OpenAI开发者关系的负责人,刚刚跳槽到谷歌,最让人期待的是,Gem...
-
以及新的开放前沿模型生态系统 3.1 战略 与Meta AI 的 解析Llama
今天,Meta发布了Llama3.1模型,延续了他们从最初的Llama3,预览版,开始就践行的开源理念,即尽早发布和频繁发布,Llama3.1模型有三种规模,8B、70B和长期传闻中的405B参数,对于其规模来说,这些模型是同类中最优秀的开源模型,4050亿参数模型直接与Anthropic的Clau...
-
AI工程中面临的开放挑战
我昨天在AI工程师世界博览会上发表了开幕主题演讲,我是临时加入议程的,OpenAI在最后一刻退出了他们的演讲,我受邀在不到24小时的通知时间内准备一个20分钟的演讲!我决定重点讲述自8个月前上次AI工程师峰会以来LLM,大语言模型,领域的亮点,并讨论该领域的一些未解决的挑战——这是我在早些时候的活动...
-
大模型开始进入收益递减的时代
目前人们好像已在接受这样的观点,大语言模型,LLMs,正在以指数速度进步,就在几天前,宾州大学沃登商学院,TheWhartonSchool,的EthanMollick教授在一篇广受关注的博客文章中声称,,目前对LLMs的能力评估显示,LLM的能力每5到14个月翻一番,实际上Mollick教授引用的研...