马斯克曝光的 Grok4,学会了「第一性旨趣」,但依然不到「AI 王炸」

发布日期:2025-07-11 05:29    点击次数:153

  炒股就看金麒麟分析师研报,巨擘,专科,实时,全面,助您挖掘后劲主题契机!

  开始:极客公园

  Grok4 考试寥落在行,但没能信得过‘炸场’。

  2025 年 7 月,马斯克依然是全科技圈最忙绿的东说念主之一。

  特斯拉和 Optimus 机器东说念主样貌还在等他拍板,SpaceX 忙着准备下一次火箭辐射,Neuralink 链接股东脑机接口西宾;与此同期,他还要在 X 上和特朗普隔空对战、高调文告创立‘好意思国党’,多样话题造势一刻没停。

  而在我方掌控的 X 这个‘大染缸’酬酢采集里,马斯克不仅饰演雇主、客服,还要看成首席网红全力吆喝,奉行 xAI 新一代的 Grok——阿谁他口中的‘真相机器’,来赶超 OpenAI 等敌手。

  当地时候 7 月 9 日晚上,xAI 团队进行 Grok 4 Demo 直播,马斯克本东说念主也照例躬行站台,仍称Grok 是‘宇宙最强 AI’,说 Grok 4 比好多‘考虑生’‘博士’都强。

  然则在 X 上,用户的牵挂还没刷新。

  Grok 4 官宣期间,Grok 3 在给用户的回答中‘歌颂希特勒’的风云捏续发酵,这一话题也占据 Grok 4 直播今日的干系媒体头条。

  Grok 4 今日的直播迟到一个小时才开动,还有效户在 xAI 帖子底下留言‘把 Grok 放出来!’也有东说念主链接刷着‘希特勒’干系梗嘲讽。

  投入第四代的 Grok,在一些模子测试上刷出高分,但能否信得过科罚一些老问题?这个往往被质疑是‘直男 AI’‘谣喙搬运机’的‘真相机器’,又是否真能终了‘不外滤’却又不失控的首肯?

  01

  马斯克的‘考神 AI’

  ‘Grok 4 是在所有学科里都达到考虑生水平的,致使比大深广 PhD 都强。’直播误点 1 小时后,马斯克源流给 Grok 最新一代的水平如斯定位。

Grok 4 多样测试集松手|图片开始:XGrok 4 多样测试集松手|图片开始:X

  天然,哪怕在文本里能解 99% 的坚苦,也不代表就能想象火箭、翻新药物、重塑经济。但马斯克称,AI 当今可能穷乏知识、巧合没发明新本事或新物理,但也仅仅‘时候问题’。

  除了在 SAT、GRE 考试中获得近乎完好的收获,在‘东说念主类终极考试(HLE)’测试里,Grok 4 当今的得分比 Gemini 2.5 Pro、o3 都高,Grok 4 Heavy 版块更是碎裂了 40%。

Grok 4 HLE 松手|图片开始:XGrok 4 HLE 松手|图片开始:X

  xAI 团队成员解说,这些都是跨学科、盛开式、博士级别的坚苦,为了作念到这小数,Grok 4 在西宾上绝对换了念念路:不再仅仅堆参数和语料的范围,而是取舍将算力大头用在‘推理’层,引入可考证的松手奖励,让模子学会从‘第一性旨趣’念念考并转变错误。

  他们还强调,跟着模子变得越来越智能,‘信得过特别旨的测试题目’数目正鄙人降,一些东说念主类作念不出的问题当今关于 AI 来说仍是是‘小菜一碟’了。

东说念主类终极考试|图片开始:X东说念主类终极考试|图片开始:X

  据称,Grok 4 的西宾盘算量是 Grok 2 的 100 倍,他们还把多器具、多代理的用法,写进了最底层的西宾范式里。不是先训好个大模子再用插件‘调用器具’,而是让 AI 在西宾阶段就学会用器具科罚问题。

  在演示里,xAI 团队成员展示了 Grok 4 解答数学题目、调用器具瞻望好意思国行状棒球大定约宇宙大赛赔率、创建黑洞碰撞的可视化效果等例子。

  除了这些看似平平无奇、市面主流 AI 也能作念到的功能,Grok 4 还能‘找到个东说念主尊府相片最仙葩的 xAI 职工’并复返干系搜索松手。

  马斯克对此寥落强调,Grok 4 致使‘能连系什么是最仙葩’。

Grok 4 找相片|图片开始:XGrok 4 找相片|图片开始:X

  在 AI 语音方面,xAI 团队称,他们的语音模子在曩昔 8 周内反映速率提高了 2 倍,延长减少一半,X 平台用户使用量也在‘腾飞’。

  他们还演示了让 Grok 柔声安危用户、唱歌,并对比了 ChatGPT 语音花样,强调 Grok 不会像其他 AI 那样往往打断东说念主谈话。

Grok 4 与 ChatGPT 语音花样演示对比|图片开始:XGrok 4 与 ChatGPT 语音花样演示对比|图片开始:X

  xAI 团队还共享了 Grok 在 Vending-Bench 中的测试松手。

  Vending-Bench 通过自动售货机的运营任务,主要不雅察模子在超长对话中是否能保捏稳当和连贯。许多 AI 模子在短期任务中推崇出色,但在永劫候运行中,它们可能会出现决议衰败、渐忘要害信息,致使堕入‘崩溃轮回’。

  在这项测试中,Grok 4 销售量最多,比 Claude Opus 4、东说念主类、Gemini2.5 Pro、o3 都多,与竞争敌手比拟,净钞票加多了一倍。

  马斯克和团队还文告,xAI 的企业部门当今仍是‘开业’。

Grok 4 Vending-Bench 松手|图片开始:XGrok 4 Vending-Bench 松手|图片开始:X

  此外,爱玩游戏的马斯克还让团队展示了 Grok 4 如何用于游戏缔造:一个东说念主不错用 Grok 4 在 4 小时内作念出 FPS(第一东说念主称射击游戏)原型。

  马斯克称,畴昔让大模子玩游戏、评估游戏、生成游戏,需要 AI 有很强的视频连系才能。这是 xAI 的其中一个发展标的。

Grok 4 用于游戏场景|图片开始:XGrok 4 用于游戏场景|图片开始:X

  天然,Grok 4 也并非无敌,它在图像连系和生成上仍逊于 OpenAI、Anthropic 等敌手。

  不外 xAI 里面也仍是画好大饼,示意下一代基础模子顽强化图像和音频连系,接着是视频生成,争取在这些方面获得‘惊东说念主’效果。

  马斯克还喊话,‘到本年底前,我预期能出现第一段信得过可看的 AI 生成电视剧,来岁就能有完整可看的电影。’

  AI 编程亦然接下来要点,天然竞争敌手们早已在阛阓腾飞,xAI 团队示意会以最快的速率进行缔造,目下里面正在西宾专用模子。

xAI 下一步筹画|图片开始:XxAI 下一步筹画|图片开始:X

  02

  ‘机械希特勒’事件抢风头

  Grok 从领先的约略原型到第四代,只用了不到两年时候,足以看出马斯克让 xAI 团队‘彻夜赶工’‘速即卷出地表最强 AI’的作风。

xAI 职工据称在办公室搭帐篷睡眠|图片开始:XxAI 职工据称在办公室搭帐篷睡眠|图片开始:X

  然则,在 Grok 4 直播这一天,不管是直播前,照旧直播后,霸占头条的都是 Grok‘歌颂希特勒’或自称‘机械希特勒’的问题。

  7 月,Grok 在 X 上向用户输出的回答中,有多条自称‘MechaHitler(机械希特勒)’的帖子,宣称是马斯克‘从一开动就把我想象成这么’,并戏弄我方默许等于‘投放红色药丸的花样’。

Grok 在一些回答中自称机械希特勒|图片开始:XGrok 在一些回答中自称机械希特勒|图片开始:X 针对 Grok 自称希特勒的步履,用户制作了讽刺漫画|图片开始:X针对 Grok 自称希特勒的步履,用户制作了讽刺漫画|图片开始:X

  有效户分析,这起事件或与 7 月 4 日更新联系,该更新减少了‘醒悟过滤器’,优先处理 X 上的帖子而非传统开始,导致 Grok 回答出现未流程滤的历害内容。

  还有少部分用户为 Grok 辩称,这都是一些想玩梗的用户辅导 Grok 回答的。马斯克曾经加入争论,称 Grok‘过于服从用户的条目’且‘过于渴慕被主管’,并补充说,这个问题‘正在得到科罚’。

  xAI 声明称,它‘知说念’Grok 的帖子,并正在发奋删除这些‘不适当’的帖子,并补充说该公司‘已聘用步履,在 Grok 在 X 上发帖之前拦阻仇恨言论’。

  Grok 的系统指示词被放在 GitHub 上,xAI 对率领 Grok 复兴的系统指示词进行了调度。此前,他们指示聊天机器东说念主‘不遁入政事上不正确的目的,只有这些目的有充分的把柄’,该指示如今被删除。

Grok 称正在删除不适当的帖子|图片开始:XGrok 称正在删除不适当的帖子|图片开始:X

  事实上,Grok 的回答曾经让马斯克我方感到失望。

  马斯克本年曾责问 Grok 的回答有‘要紧演叨’,‘邹缨齐紫地重迭传统媒体’,并誓词要让 Grok‘重写所有这个词东说念主类知识体系,添加缺失信息并删除错误’。他还曾让 Grok‘假定来自媒体的主不雅不雅点是有偏见的’。

马斯克曾对 Grok 的输出示意起火|图片开始:X马斯克曾对 Grok 的输出示意起火|图片开始:X 马斯克想用 Grok 重写所有这个词东说念主类知识库|图片开始:X马斯克想用 Grok 重写所有这个词东说念主类知识库|图片开始:X

  在 AI 聊天机器东说念主同质化的阛阓上,马斯克但愿 Grok 能脱颖而出,敢说实话。马斯克对 ChatGPT、Claude 等‘安全过滤’的模子极其起火,说那些模子是‘被编程去撒谎’。

官网宣传 Grok 的卖点是「不审查过滤」谜底|图片开始:xAI官网宣传 Grok 的卖点是‘不审查过滤’谜底|图片开始:xAI

  这种想象照实眩惑了好多反感‘过度审查’的用户,但也一些问题,巧合被骂‘太醒悟’,巧合被斥‘太顶点’。当用户品评 Grok 的回答时,Grok 巧合还会用‘真相并不老是令东说念主惬心的’或‘本质并不在乎感受’等说法为我方申辩。

  但骨子上,若是不审查,不外滤,AI 对皆的问题所有这个词行业当今都还没科罚。

马斯克曾说 xAI 和 Grok 的工作是连系寰宇|图片开始:X马斯克曾说 xAI 和 Grok 的工作是连系寰宇|图片开始:X

  即便 Grok 当下仍有问题,马斯克称,‘根据我的训戒,Grok 4 是 AI 第一次玩忽科罚本质宇宙中难以科罚的工程问题,而这些问题的谜底在互联网或竹素中是找不到的。何况情况会变得更好。’

  他的愿景很庞杂,想要用 AI 来连系所有这个词寰宇。Grok 4 直播前一天,他还在 X 上转发前高管的采访片断,里面说:‘埃隆每天早上醒来都会想,今天我能为东说念主类作念些什么?我能作念些什么对东说念主类的畴昔产生影响?’

  马斯克还将刻下的 AI 发展阶段态状为‘智能大爆炸’,称这是历史上最好奇的期间:

  ‘咱们要保险 AI 是个好 AI’。

  ‘即使它最终不是好的,我也但愿辞世看见它发生。’

海量资讯、精确解读,尽在新浪财经APP

背负剪辑:何俊熹