马斯克发布 Grok 2 测试版：逻辑能力增强，引入文生图

4997

8 月 14 日下午，马斯克旗下的 xAI 公司发布了其第二代 AI 大模型 Grok 2 的测试版。Grok 2 包含 Grok 2 和 Grok 2 mini 两个版本，支持中文问答。目前，仅 X Premium 及 Premium+ 用户可以体验。非 X 订阅用户可以在 LMSYS 大模型竞技场 (Auto Arena of LLMs) 中免费体验 Grok 2 早期版本模型 sus-column-r。

马斯克于去年 4 月注册 xAI 公司。今年 5 月，xAI 宣布获得 60 亿美元的 B 轮融资，使该公司的估值达到约 240 亿美元。xAI 今年相继推出了 Grok 1 和升级版 Grok 1.5。

马斯克盛赞：“Grok 的速度快如火箭”。测试显示，Grok 2 测试版的逻辑推理能力有显著提升。该模型还具备文生图能力，使用 Black Forest Labs 的 FLUX.1 模型生成图像。

Grok 2 测试版不仅能够准确解答“9.8 和 9.11 哪个大”等人类测试大模型的经典难题，还可以数清“strawberry”中 R 的数量。

X 平台用户已上传了许多由 Grok 2 测试版模型生成的图片。在 GPQA、MMLU、MMLU-Pro、MATH、MathVista 等多项测评中，Grok 2 的得分都超过了 GPT-4 Turbo、Claude 3 Opus、Gemini Pro 1.5 等主流模型。根据知名研究机构 Large Model Systems Organization (LMSYS) 发布的最新评测数据，Grok 2 早期版本 (代号 sus-column-r) 已进入 LMSYS 推出的大模型竞技场 Chatbot Arena 排行榜前三，与 GPT-4o 并列。

Grok 2 测试版的发布标志着该模型又向正式商用迈进了一步。xAI 计划在本月稍晚推出 Grok 2 正式版本的企业 API。xAI 表示将强化安全功能，包括强制性的多因素身份验证（如 Yubikey、Apple TouchID 或 TOTP），并提供详尽的流量统计数据和高级计费分析服务，支持数据导出。

马斯克此前透露，xAI 将在今年年底左右发布更新版本的大模型 Grok 3。马斯克在今年 4 月接受挪威主权基金负责人 Nicolai Tangen 采访时表示，Grok 2 需要约 2 万张 H100 来训练。Grok 3 所需的算力资源只多不少。马斯克在上个月表示，xAI 公司一直在训练 Grok 3，该模型将使用 10 万块英伟达 H100 芯片进行训练，其水平将与尚未发布的 OpenAI GPT-5 相匹敌，甚至超越 GPT-5。

本网站的文章部分内容可能来源于网络和网友发布，仅供大家学习与参考，如有侵权，请联系站长进行删除处理，不代表本网站立场，转载者并注明出处：https://www.jmbhsh.com/xingyeremen/37131.html

马斯克发布 Grok 2 测试版：逻辑能力增强，引入文生图

相关推荐

联系我们