8 月 14 日下午,马斯克旗下的 xAI 公司发布了其第二代 AI 大模型 Grok 2 的测试版。Grok 2 包含 Grok 2 和 Grok 2 mini 两个版本,支持中文问答。目前,仅 X Premium 及 Premium+ 用户可以体验。非 X 订阅用户可以在 LMSYS 大模型竞技场 (Auto Arena of LLMs) 中免费体验 Grok 2 早期版本模型 sus-column-r。
马斯克于去年 4 月注册 xAI 公司。今年 5 月,xAI 宣布获得 60 亿美元的 B 轮融资,使该公司的估值达到约 240 亿美元。xAI 今年相继推出了 Grok 1 和升级版 Grok 1.5。
马斯克盛赞:“Grok 的速度快如火箭”。测试显示,Grok 2 测试版的逻辑推理能力有显著提升。该模型还具备文生图能力,使用 Black Forest Labs 的 FLUX.1 模型生成图像。
Grok 2 测试版不仅能够准确解答“9.8 和 9.11 哪个大”等人类测试大模型的经典难题,还可以数清“strawberry”中 R 的数量。
X 平台用户已上传了许多由 Grok 2 测试版模型生成的图片。在 GPQA、MMLU、MMLU-Pro、MATH、MathVista 等多项测评中,Grok 2 的得分都超过了 GPT-4 Turbo、Claude 3 Opus、Gemini Pro 1.5 等主流模型。根据知名研究机构 Large Model Systems Organization (LMSYS) 发布的最新评测数据,Grok 2 早期版本 (代号 sus-column-r) 已进入 LMSYS 推出的大模型竞技场 Chatbot Arena 排行榜前三,与 GPT-4o 并列。
Grok 2 测试版的发布标志着该模型又向正式商用迈进了一步。xAI 计划在本月稍晚推出 Grok 2 正式版本的企业 API。xAI 表示将强化安全功能,包括强制性的多因素身份验证(如 Yubikey、Apple TouchID 或 TOTP),并提供详尽的流量统计数据和高级计费分析服务,支持数据导出。
马斯克此前透露,xAI 将在今年年底左右发布更新版本的大模型 Grok 3。马斯克在今年 4 月接受挪威主权基金负责人 Nicolai Tangen 采访时表示,Grok 2 需要约 2 万张 H100 来训练。Grok 3 所需的算力资源只多不少。马斯克在上个月表示,xAI 公司一直在训练 Grok 3,该模型将使用 10 万块英伟达 H100 芯片进行训练,其水平将与尚未发布的 OpenAI GPT-5 相匹敌,甚至超越 GPT-5。
本网站的文章部分内容可能来源于网络和网友发布,仅供大家学习与参考,如有侵权,请联系站长进行删除处理,不代表本网站立场,转载者并注明出处:https://www.jmbhsh.com/xingyeremen/37131.html