摘要:
财联社2月1日讯(编辑 史正丞)面对“东方AI力量”的压力,美国OpenAI公司周五正式上线竞品推理模型o3-mini,并首次向免费用户开放推理模型。(来源:OpenAI)轻量级推...
# OpenAI推o3 - mini模型,免费用户也能尝鲜!
各位粉丝朋友们,今天要给大家带来一则科技圈的重磅消息。财联社2月1日消息,面对“东方AI力量”带来的竞争压力,美国OpenAI公司在本周五有了大动作,正式上线了竞品推理模型o3 - mini,而且首次向免费用户开放推理模型,这一举措无疑在AI领域扔下了一颗重磅炸弹。
轻量级推理大模型o3 - mini其实早在去年12月的直播活动中就已亮相,当时一同登场的还有“满血版”的o3模型。OpenAI公司宣称,o3具备更先进、近似人类的推理能力,在解决编程、数学、科学等理工科问题方面,均超越了现役的o1模型。此前公司就曾透露,o3 - mini会在1月底先上架,而o3则“会在不久之后推出”。
o3 - mini到底有什么特别之处呢?OpenAI介绍,o3 - mini支持开发者调整“AI推理努力程度”的选项,分为低、中、高三个级别。这种灵活性太关键了,它意味着o3 - mini在面对难题时能够“更努力思考”,而在需要效率的时候又能优先考虑回应速度。
我们再来看看o3 - mini在各项测试中的表现。在周五的新闻稿中,OpenAI披露了o3 - mini在2024年美国数学邀请赛(AIME 2024)测试中的情况。低推理努力的o3 - mini准确率达到了60%,这和o1 - mini差不多,但是速率更快。而在中等努力下,o3 - mini准确率能够提升到79.6%,和o1模型相当。在最高努力水平时,o3 - mini的准确率则能进一步提升至87.3%。这一连串的数据,足以证明o3 - mini在数学推理方面的强大实力。
在博士级科学问题(GPQA Diamond)方面,三种努力程度模型的准确率也相当可观,分别为70.6%、76.8%和79.7%。横向对比一下,DeepSeek - R1模型在AIME 2024测试中的准确率为79.8%,而在GPQA Diamond测试中的准确率为71.5%。通过这样的对比,我们能更清晰地看到o3 - mini的优势与不足。
有意思的是,有不少人认为,DeepSeek的出现让OpenAI突然之间变大方了。为什么这么说呢?因为OpenAI宣布,从周五开始,免费ChatGPT用户也能通过在编辑器中选择“推理”来尝试o3 - mini模型,这可是公司的推理模型首次向免费用户开放。对于广大免费用户来说,这无疑是一个巨大的福利。
对于付费用户,OpenAI也给出了相应的升级方案。o3 - mini将在模型选择器中替代o1 - mini。每月花费20美元左右的ChatGPT Plus和Team用户,速率限制也从o1 - mini的每天50条,提升到o3 - mini的150条。而每月支付200美元的ChatGPT Pro用户,能无限制地访问o3 - mini。
OpenAI此次推出o3 - mini模型并向免费用户开放,一方面是为了应对竞争压力,提升自身产品的竞争力;另一方面,也让更多用户能够体验到先进的AI推理技术。未来,o3 - mini能否在AI市场中占据一席之地,“满血版”的o3又会带来怎样的惊喜,让我们拭目以待!
