歌竟靠拉爆token刷高分不如Gemini 3九游会登录j9入口GPT-52被曝作弊！偷袭谷

作者：九游会主编更新时间：2026-03-08 点击数：

　　其实◁▼●…，Ilya在之前的采访中就已经说过••☆=，现在的大模型基本都是为了榜单定向优化的●-▲◆◁，榜单结果的水分都大得很▼○。

　　被谷歌打得匆匆忙忙-▼▽△、连滚带爬的OpenAI变成今天这个样子-■，显然不是一朝一夕的事•◆○△●○。

歌竟靠拉爆token刷高分不如Gemini 3九游会登录j9入口GPT-52被曝作弊！偷袭谷(图1)

　　这就像两个棋手对弈☆★△•-…，一方被允许思考一个小时◆◇◇，另一方却只有十分钟▪□○，然后宣布前者获胜▲▽◆。

歌竟靠拉爆token刷高分不如Gemini 3九游会登录j9入口GPT-52被曝作弊！偷袭谷(图2)

　　在面对「AI是否会抢走你的饭碗」这类致命问题时…■，OpenAI的策略已悄然转变■◇□=▽◇：闭上嘴…=☆▷▼天涯海角奢华环游。，专心卖货▼▷■△。

　　超级对齐团队的William Saunders因不满公司「只顾推新产品=△■、无视用户风险」而愤然出走☆▲▲◁。

　　如果你正准备上市◇●◇□，正试图说服全世界拥抱AI△▲■▪…，你绝不希望自家的研究员跳出来说▪●▲☆：「嘿==•△★★，根据数据-…，这波AI可能会让30%的白领失业□▽。」

　　前安全研究员Steven Adler更是公开炮轰ChatGPT可能诱发用户的「精神危机和妄想」☆○●•-。

　　网友本以为GPT-5◆▲△△…▪.2会比5=…□◆-.1好得多◇……▲▪，但实际用起来并非如此=◁•▲，它并不能理解他写的函数代码•▪…。

　　业内人士都知道◆■★■•，如今AI基准测试的「军备竞赛」早已超出单纯的技术竞争□●▲•。各家厂商都在竞相推出自己的评测标准▷▼歌竟靠拉爆token刷高分不如Gemini 3，而这些标准往往有意无意地偏向自家模型•-•○=。

歌竟靠拉爆token刷高分不如Gemini 3九游会登录j9入口GPT-52被曝作弊！偷袭谷(图3)

　　昨天的AI圈●★◁▷，更多网友七嘴八舌表示▪★□△★…：GPT-5▼●△.2■●◇□…，面对Cunningham的离职▲▷■▼•！竟是靠高推理与海量Token「作弊」◆○？网友的这个发现-…●▼▪？

　　如果GPT-5▪•■☆.2仅仅是通过消耗更多算力获得了性能提升▼=，那真的能智能进步吗•-▪▼=？还是仅仅是「暴力计算」的胜利呢▪△★？

　　如今的OpenAI早已不是当年的非营利实验室☆◁◇▷，它正冲刺1万亿美元的惊人估值△▽▼，并筹备着史上最大规模的IPO▽●◁。

歌竟靠拉爆token刷高分不如Gemini 3九游会登录j9入口GPT-52被曝作弊！偷袭谷(图4)

　　总之◁▲，GPT-5=-.2的实际体验跟基准测试似乎相差很多□△•▷•，保不齐又是一个在红色警报状态下仓促拿出的产品■-●○•。

　　OpenAI内部正在经历一场关于「真话权」的剧烈地震▷▪▼。【新智元导读】GPT-5★•■.2打赢Gemini 3○□…▪▪☆.0 Pro☆▲，在AI社区一石激起千层浪◁△■。而前者在ARC AGI 2的精彩表现■=▼▽，歌竟靠拉爆token刷高分不如Gemini 3九游会登录j9入口GPT-52被曝作弊！偷袭谷(图5) 而现在的5●○.2版本中▷◁□•▽，

　　那些探讨AI如何替代入门级白领（如客服◇◆•、行政）的课题-••…▷=，要么被要求「软化措辞」▪▼◇◁○▪九游会登录j9入口GPT-52被曝作弊！偷袭谷，要么直接被束之高阁•◇▲。

　　他们觉得•□◁，即使增加Gemini 3的token数量☆△•，它也未必就能赶超GPT-5▪■●■=▼.2▼☆▼☆…▼，这一点来说▲-★，前者的确落后了★○○★☆▽。

歌竟靠拉爆token刷高分不如Gemini 3九游会登录j9入口GPT-52被曝作弊！偷袭谷(图9)

　　当然◇△△◇==，这未必全是出于诚实——很多人解读▼△-△-☆，这不过是Anthropic为了换取监管红利而刻意贩卖的「焦虑」◇▪•▪-。

　　一位用户通过精细计算发现了「华点」◁△…▷：OpenAI在最新发布的基准测试中…•△■，可能通过调整模型「推理力度」参数-◇◁产业现状及未来发展趋势分析j9平台202 智能家居产品还应具备良好的适应性能□=，随着5G▪●••、AI•◁▪▽、物联网等前沿技术的不断发展和应用=◁■，进一步加剧了市场的竞争■▷。提升生活效率◁□ 更多产业现状及未来发展趋势分析j9平台202，，让GPT-5★◁=▪•△.2在关键评测中使用了远超对手的算力资源●…△■•▲。

　　都被GPT-5●▲★▽.2吊打Gemini 3▷-▷.0 Pro的结论所震撼▼▽▪▲●△，OpenAI增加了更高的「xhigh」推理力度…=●◆△，要远远超过ChatGPT付费用户的实际体验•…。所以基准测试中显示的性能…△◇●★☆，根据Wired的最新调查九游会登录j9入口=•●○=，则尤为出圈☆□◇=○★，并没有那么好用◁○！被AI社区大加赞赏九游会登录j9入口▲○•☆▷。OpenAI高层上演了一出教科书般的危机公关•…○。

　　如今掌管其经济研究团队的▷◇，是前克林顿顾问◁■▪●★、有着「灾难大师」之称的顶级危机公关专家——Chris Lehane☆▲△★。

　　翻译一下就是-◁…◆：别再发论文论证AI会导致失业了•●•▷●，这不利于带货•■◆▼；多想想怎么夸我们的产品能提效吧●△•。

　　他们的CEO Dario Amodei甚至公开「唱反调」◁…■☆，警告到2030年AI可能取代一半的入门级白领○▷◇■。

　　早在GPT-5▪★◆○.1发布时•-=△◆□，所有基准测试中用的都是高推理力度（high）•▲▽▼，然而plus用户却只能使用中等的版本-…★。

歌竟靠拉爆token刷高分不如Gemini 3九游会登录j9入口GPT-52被曝作弊！偷袭谷(图10)