第374章 好戏上演
  从图表上可以看出,o1模型的得分,明显高於其他ai模型,呈现出一种“一骑绝尘”的姿態。
  真的是这样吗?
  嘿嘿!
  苏阳看著屏幕上奥特曼的表演,呵呵笑。
  “这些所谓的专业测试,也就只能骗一骗那些不懂技术的普通网民罢了。
  原因很简单,这样的测试,完全是可以刷题。
  只要提前让ai模型学习大量的类似题目,它就能在测试中取得高分。但这並不代表它真的具备了强大的推理能力,更像是一种应试技巧而已。
  与此同时,openai的发布会现场,奥特曼还在滔滔不绝地吹嘘著o1模型在数学基准测试上的优异表现。
  “在gsm8k测试中,”奥特曼指著大屏幕上一张图表,“o1模型的得分达到了惊人的95.4%!这比排名第二的模型高出了近5个百分点!这是一个巨大的差距!这意味著什么?这意味著,o1模型在解决数学应用题方面,已经达到了接近人类专家的水平。”
  奥特曼不断地强调o1模型在各种数学基准测试上的出色表现,试图营造出一种“openai再次站在了人工智慧技术最前沿”的氛围。看他自信满满的表情,仿佛在告诉全世界:openai才是人工智慧领域的王者。
  直播间的评论区里,讚嘆声再次占据了主导地位。许多网友被o1模型在数学基准测试上的出色表现所折服,纷纷表示惊嘆和讚赏。
  “太强了!openai果然是ai领域的领导者。”
  “95.4%!这简直是不可思议!”
  “o1模型已经超越人类了!”
  “openai又一次改变了世界!”