马斯克曝光的 Grok4，学会了「第一性旨趣」，但依然不到「AI 王炸」

发布日期：2025-07-11 05:29 点击次数：154

　　炒股就看金麒麟分析师研报，巨擘，专科，实时，全面，助您挖掘后劲主题契机！

　　开始：极客公园

　　Grok4 考试寥落在行，但没能信得过‘炸场’。

　　2025 年 7 月，马斯克依然是全科技圈最忙绿的东说念主之一。

　　特斯拉和 Optimus 机器东说念主样貌还在等他拍板，SpaceX 忙着准备下一次火箭辐射，Neuralink 链接股东脑机接口西宾；与此同期，他还要在 X 上和特朗普隔空对战、高调文告创立‘好意思国党’，多样话题造势一刻没停。

　　而在我方掌控的 X 这个‘大染缸’酬酢采集里，马斯克不仅饰演雇主、客服，还要看成首席网红全力吆喝，奉行 xAI 新一代的 Grok——阿谁他口中的‘真相机器’，来赶超 OpenAI 等敌手。

　　当地时候 7 月 9 日晚上，xAI 团队进行 Grok 4 Demo 直播，马斯克本东说念主也照例躬行站台，仍称Grok 是‘宇宙最强 AI’，说 Grok 4 比好多‘考虑生’‘博士’都强。

　　然则在 X 上，用户的牵挂还没刷新。

　　Grok 4 官宣期间，Grok 3 在给用户的回答中‘歌颂希特勒’的风云捏续发酵，这一话题也占据 Grok 4 直播今日的干系媒体头条。

　　Grok 4 今日的直播迟到一个小时才开动，还有效户在 xAI 帖子底下留言‘把 Grok 放出来！’也有东说念主链接刷着‘希特勒’干系梗嘲讽。

　　投入第四代的 Grok，在一些模子测试上刷出高分，但能否信得过科罚一些老问题？这个往往被质疑是‘直男 AI’‘谣喙搬运机’的‘真相机器’，又是否真能终了‘不外滤’却又不失控的首肯？

　　马斯克的‘考神 AI’

　　‘Grok 4 是在所有学科里都达到考虑生水平的，致使比大深广 PhD 都强。’直播误点 1 小时后，马斯克源流给 Grok 最新一代的水平如斯定位。

Grok 4 多样测试集松手|图片开始：X

　　天然，哪怕在文本里能解 99% 的坚苦，也不代表就能想象火箭、翻新药物、重塑经济。但马斯克称，AI 当今可能穷乏知识、巧合没发明新本事或新物理，但也仅仅‘时候问题’。

　　除了在 SAT、GRE 考试中获得近乎完好的收获，在‘东说念主类终极考试（HLE）’测试里，Grok 4 当今的得分比 Gemini 2.5 Pro、o3 都高，Grok 4 Heavy 版块更是碎裂了 40%。

Grok 4 HLE 松手|图片开始：X

　　xAI 团队成员解说，这些都是跨学科、盛开式、博士级别的坚苦，为了作念到这小数，Grok 4 在西宾上绝对换了念念路：不再仅仅堆参数和语料的范围，而是取舍将算力大头用在‘推理’层，引入可考证的松手奖励，让模子学会从‘第一性旨趣’念念考并转变错误。

　　他们还强调，跟着模子变得越来越智能，‘信得过特别旨的测试题目’数目正鄙人降，一些东说念主类作念不出的问题当今关于 AI 来说仍是是‘小菜一碟’了。

东说念主类终极考试|图片开始：X

　　据称，Grok 4 的西宾盘算量是 Grok 2 的 100 倍，他们还把多器具、多代理的用法，写进了最底层的西宾范式里。不是先训好个大模子再用插件‘调用器具’，而是让 AI 在西宾阶段就学会用器具科罚问题。

　　在演示里，xAI 团队成员展示了 Grok 4 解答数学题目、调用器具瞻望好意思国行状棒球大定约宇宙大赛赔率、创建黑洞碰撞的可视化效果等例子。

　　除了这些看似平平无奇、市面主流 AI 也能作念到的功能，Grok 4 还能‘找到个东说念主尊府相片最仙葩的 xAI 职工’并复返干系搜索松手。

　　马斯克对此寥落强调，Grok 4 致使‘能连系什么是最仙葩’。

Grok 4 找相片|图片开始：X

　　在 AI 语音方面，xAI 团队称，他们的语音模子在曩昔 8 周内反映速率提高了 2 倍，延长减少一半，X 平台用户使用量也在‘腾飞’。

　　他们还演示了让 Grok 柔声安危用户、唱歌，并对比了 ChatGPT 语音花样，强调 Grok 不会像其他 AI 那样往往打断东说念主谈话。

Grok 4 与 ChatGPT 语音花样演示对比|图片开始：X

　　xAI 团队还共享了 Grok 在 Vending-Bench 中的测试松手。

　　Vending-Bench 通过自动售货机的运营任务，主要不雅察模子在超长对话中是否能保捏稳当和连贯。许多 AI 模子在短期任务中推崇出色，但在永劫候运行中，它们可能会出现决议衰败、渐忘要害信息，致使堕入‘崩溃轮回’。

　　在这项测试中，Grok 4 销售量最多，比 Claude Opus 4、东说念主类、Gemini2.5 Pro、o3 都多，与竞争敌手比拟，净钞票加多了一倍。

　　马斯克和团队还文告，xAI 的企业部门当今仍是‘开业’。

Grok 4 Vending-Bench 松手|图片开始：X

　　此外，爱玩游戏的马斯克还让团队展示了 Grok 4 如何用于游戏缔造：一个东说念主不错用 Grok 4 在 4 小时内作念出 FPS（第一东说念主称射击游戏）原型。

　　马斯克称，畴昔让大模子玩游戏、评估游戏、生成游戏，需要 AI 有很强的视频连系才能。这是 xAI 的其中一个发展标的。

Grok 4 用于游戏场景|图片开始：X

　　天然，Grok 4 也并非无敌，它在图像连系和生成上仍逊于 OpenAI、Anthropic 等敌手。

　　不外 xAI 里面也仍是画好大饼，示意下一代基础模子顽强化图像和音频连系，接着是视频生成，争取在这些方面获得‘惊东说念主’效果。

　　马斯克还喊话，‘到本年底前，我预期能出现第一段信得过可看的 AI 生成电视剧，来岁就能有完整可看的电影。’

　　AI 编程亦然接下来要点，天然竞争敌手们早已在阛阓腾飞，xAI 团队示意会以最快的速率进行缔造，目下里面正在西宾专用模子。

xAI 下一步筹画|图片开始：X

　　‘机械希特勒’事件抢风头

　　Grok 从领先的约略原型到第四代，只用了不到两年时候，足以看出马斯克让 xAI 团队‘彻夜赶工’‘速即卷出地表最强 AI’的作风。

xAI 职工据称在办公室搭帐篷睡眠|图片开始：X

　　然则，在 Grok 4 直播这一天，不管是直播前，照旧直播后，霸占头条的都是 Grok‘歌颂希特勒’或自称‘机械希特勒’的问题。

　　7 月，Grok 在 X 上向用户输出的回答中，有多条自称‘MechaHitler（机械希特勒）’的帖子，宣称是马斯克‘从一开动就把我想象成这么’，并戏弄我方默许等于‘投放红色药丸的花样’。

Grok 在一些回答中自称机械希特勒|图片开始：X 针对 Grok 自称希特勒的步履，用户制作了讽刺漫画｜图片开始：X

针对 Grok 自称希特勒的步履，用户制作了讽刺漫画|图片开始：X

　　有效户分析，这起事件或与 7 月 4 日更新联系，该更新减少了‘醒悟过滤器’，优先处理 X 上的帖子而非传统开始，导致 Grok 回答出现未流程滤的历害内容。

　　还有少部分用户为 Grok 辩称，这都是一些想玩梗的用户辅导 Grok 回答的。马斯克曾经加入争论，称 Grok‘过于服从用户的条目’且‘过于渴慕被主管’，并补充说，这个问题‘正在得到科罚’。

　　xAI 声明称，它‘知说念’Grok 的帖子，并正在发奋删除这些‘不适当’的帖子，并补充说该公司‘已聘用步履，在 Grok 在 X 上发帖之前拦阻仇恨言论’。

　　Grok 的系统指示词被放在 GitHub 上，xAI 对率领 Grok 复兴的系统指示词进行了调度。此前，他们指示聊天机器东说念主‘不遁入政事上不正确的目的，只有这些目的有充分的把柄’，该指示如今被删除。

Grok 称正在删除不适当的帖子|图片开始：X

　　事实上，Grok 的回答曾经让马斯克我方感到失望。

　　马斯克本年曾责问 Grok 的回答有‘要紧演叨’，‘邹缨齐紫地重迭传统媒体’，并誓词要让 Grok‘重写所有这个词东说念主类知识体系，添加缺失信息并删除错误’。他还曾让 Grok‘假定来自媒体的主不雅不雅点是有偏见的’。

马斯克曾对 Grok 的输出示意起火|图片开始：X 马斯克想用 Grok 重写所有这个词东说念主类知识库｜图片开始：X

马斯克想用 Grok 重写所有这个词东说念主类知识库|图片开始：X

　　在 AI 聊天机器东说念主同质化的阛阓上，马斯克但愿 Grok 能脱颖而出，敢说实话。马斯克对 ChatGPT、Claude 等‘安全过滤’的模子极其起火，说那些模子是‘被编程去撒谎’。

官网宣传 Grok 的卖点是‘不审查过滤’谜底|图片开始：xAI

　　这种想象照实眩惑了好多反感‘过度审查’的用户，但也一些问题，巧合被骂‘太醒悟’，巧合被斥‘太顶点’。当用户品评 Grok 的回答时，Grok 巧合还会用‘真相并不老是令东说念主惬心的’或‘本质并不在乎感受’等说法为我方申辩。

　　但骨子上，若是不审查，不外滤，AI 对皆的问题所有这个词行业当今都还没科罚。

马斯克曾说 xAI 和 Grok 的工作是连系寰宇|图片开始：X

　　即便 Grok 当下仍有问题，马斯克称，‘根据我的训戒，Grok 4 是 AI 第一次玩忽科罚本质宇宙中难以科罚的工程问题，而这些问题的谜底在互联网或竹素中是找不到的。何况情况会变得更好。’

　　他的愿景很庞杂，想要用 AI 来连系所有这个词寰宇。Grok 4 直播前一天，他还在 X 上转发前高管的采访片断，里面说：‘埃隆每天早上醒来都会想，今天我能为东说念主类作念些什么？我能作念些什么对东说念主类的畴昔产生影响？’

　　马斯克还将刻下的 AI 发展阶段态状为‘智能大爆炸’，称这是历史上最好奇的期间：

　　‘咱们要保险 AI 是个好 AI’。

　　‘即使它最终不是好的，我也但愿辞世看见它发生。’

海量资讯、精确解读，尽在新浪财经APP

背负剪辑：何俊熹

联系我们

马斯克曝光的 Grok4，学会了「第一性旨趣」，但依然不到「AI 王炸」