近日,OpenAI的一名员工公开指责埃隆·马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。xAI的联合创始人伊戈尔·巴布什金则坚称公司并无不当。
xAI的图表显示,Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而,OpenAI的员工很快指出,xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金辩称,OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

![日本夫妇惨死桑拿房 70℃夺命牢笼[推荐]](http://www.wlchinahc.com/file/upload/202512/29/225828601.jpg)
![《新闻联播》出现台北101大楼画面 解放军演习镜头引关注[推荐]](http://www.wlchinahc.com/file/upload/202512/29/230018831.jpg)
![《仙剑四》重制版实机预告片 经典再现唤回忆[推荐]](http://www.wlchinahc.com/file/upload/202512/29/134500961.jpg)
![深圳一豪宅楼盘2小时销售超100亿元 刷新多项销售纪录[推荐]](http://www.wlchinahc.com/file/upload/202512/29/134556701.jpg)