界面新闻记者 |
界面新闻编辑 | 宋佳楠
OpenAI还是那个最会玩营销的AI公司,早早预告了自己的“12 Days of Christmas”,这将是其年底最重要的一系列发布会。
12月6日凌晨,OpenAI年末狂欢“Day 1”开启,在山姆·奥特曼的总结下,两项更新最为重磅:o1模型“满血版”,以及价值200美元/月的ChatGPT Pro订阅计划。
相较于三个月前发布的o1-preview,o1的智能水平、处理速度、多模态能力均有明显变化。
通过模型解决数学竞赛题、编程竞赛题的结果呈现,o1对比o1-preview的智能水平普遍上升40%-50%,不过在博士级别科学问题的处理上,o1表现反倒稍逊o1-preview。
山姆·奥特曼提到,o1在处理复杂问题时的重大错误率降低了34%,并且不再是所有难度的问题都会花费较长时间,新版o1会根据问题的难易程度调整处理时间,简单问题往往仅需几秒,而非几分钟,这个调整可让用户等待时间普遍下调50%,也解决了o1模式此前最受诟病的问题之一。
更重要的是,新版o1加入了多模态识别能力。OpenAI对此的展现方式格外“硬核”,o1负责人直接手绘了一张供太空数据中心使用的“太空中太阳能收集流程图”。由于太空中无法水冷,员工要求o1计算,如果需要供给1GW的电,多大面积散热片才能维持GPU正常运转。
10秒之后,o1堆积了满屏的精密计算,最终给出了正确的结果:242万平方米。
根据OpenAI的安排,即日起,o1面向ChatGPT Plus和团队用户开放,企业和教育用户则需要等到下周。
相比智能水平明显升级的o1,200美元/月的ChatGPT Pro更值得关注。尽管此前已有传闻,但外界一直惊讶于OpenAI竟然会将一个订阅制收费提升到这么高,这是此前基础订阅版本20美元费用的10倍。
实际上,OpenAI对ChatGPT Pro并不敷衍,在这套服务系统中,它提供了目前最强的o1 pro mode。
在国际数学奥林匹克预选赛题目(AIME 2024)中,o1 pro正确率达到86,高于o1版本的78。在编程问题上,两者能力以90对89旗鼓相当。不过在处理博士级科学问题上,o1 pro实现了约3%的优势。
为了证明这些个位数性能提升是否值得200美元,OpenAI还通过极其严苛的连续测试来展示o1 pro mode的稳定性与可靠性。显然,这些能力并不是针对普通需求用户打造,而是那些对模型使用体验有同样严格要求的高阶用户。
值得一提的是,在ChatGPT Pro模式下,用户可以无限制使用各种高阶模型,包括高级语音模式。
这仅仅是OpenAI连续12天狂欢的第一天,还有超过90%的内容等待解锁。不过从各种传闻来看,剩余内容中相对重磅的可能是成为“期货”已久的Sora。在视频模型上,OpenAI终于需要对行业做个更具体的交代了。