OpenAI上架推理模型o3-mini首次向免费用户开放推理功能

访客 2025-02-04 09:05:19 4524

默认

摘要： 财联社2月1日讯（编辑史正丞）面对“东方AI力量”的压力，美国OpenAI公司周五正式上线竞品推理模型o3-mini，并首次向免费用户开放推理模型。（来源：OpenAI）轻量级推...

# OpenAI推o3 - mini模型，免费用户也能尝鲜！各位粉丝朋友们，今天要给大家带来一则科技圈的重磅消息。财联社2月1日消息，面对“东方AI力量”带来的竞争压力，美国OpenAI公司在本周五有了大动作，正式上线了竞品推理模型o3 - mini，而且首次向免费用户开放推理模型，这一举措无疑在AI领域扔下了一颗重磅炸弹。轻量级推理大模型o3 - mini其实早在去年12月的直播活动中就已亮相，当时一同登场的还有“满血版”的o3模型。OpenAI公司宣称，o3具备更先进、近似人类的推理能力，在解决编程、数学、科学等理工科问题方面，均超越了现役的o1模型。此前公司就曾透露，o3 - mini会在1月底先上架，而o3则“会在不久之后推出”。 o3 - mini到底有什么特别之处呢？OpenAI介绍，o3 - mini支持开发者调整“AI推理努力程度”的选项，分为低、中、高三个级别。这种灵活性太关键了，它意味着o3 - mini在面对难题时能够“更努力思考”，而在需要效率的时候又能优先考虑回应速度。我们再来看看o3 - mini在各项测试中的表现。在周五的新闻稿中，OpenAI披露了o3 - mini在2024年美国数学邀请赛（AIME 2024）测试中的情况。低推理努力的o3 - mini准确率达到了60%，这和o1 - mini差不多，但是速率更快。而在中等努力下，o3 - mini准确率能够提升到79.6%，和o1模型相当。在最高努力水平时，o3 - mini的准确率则能进一步提升至87.3%。这一连串的数据，足以证明o3 - mini在数学推理方面的强大实力。在博士级科学问题（GPQA Diamond）方面，三种努力程度模型的准确率也相当可观，分别为70.6%、76.8%和79.7%。横向对比一下，DeepSeek - R1模型在AIME 2024测试中的准确率为79.8%，而在GPQA Diamond测试中的准确率为71.5%。通过这样的对比，我们能更清晰地看到o3 - mini的优势与不足。有意思的是，有不少人认为，DeepSeek的出现让OpenAI突然之间变大方了。为什么这么说呢？因为OpenAI宣布，从周五开始，免费ChatGPT用户也能通过在编辑器中选择“推理”来尝试o3 - mini模型，这可是公司的推理模型首次向免费用户开放。对于广大免费用户来说，这无疑是一个巨大的福利。对于付费用户，OpenAI也给出了相应的升级方案。o3 - mini将在模型选择器中替代o1 - mini。每月花费20美元左右的ChatGPT Plus和Team用户，速率限制也从o1 - mini的每天50条，提升到o3 - mini的150条。而每月支付200美元的ChatGPT Pro用户，能无限制地访问o3 - mini。 OpenAI此次推出o3 - mini模型并向免费用户开放，一方面是为了应对竞争压力，提升自身产品的竞争力；另一方面，也让更多用户能够体验到先进的AI推理技术。未来，o3 - mini能否在AI市场中占据一席之地，“满血版”的o3又会带来怎样的惊喜，让我们拭目以待！