OpenAI 最近推出了一个全新的模型,名为01,这是在 GPT 系列之外的首个新系列模型,尤其注重其推理能力。
什么是推理能力?
简单来说,推理能力指的是模型能够进行更深入和更长时间的思考过程。
如何访问新模型?
目前,所有的 ChatGPT Plus 会员和团队账户用户都可以使用该模型。作为会员用户,我已经可以访问01Preview和01 Mini版本。值得注意的是,新模型存在一定的使用限制:
- 通过 ChatGPT 使用 01Preview,每周消息限制为30条;
- 01Mini 则为每周50条消息;
- 虽然API访问没有数量限制,但仅对在OpenAI上消费超过1000美元的用户开放。
推理能力的深入探讨
在此之前,我们熟悉的模型如 GPT-4.0,以及其他一些竞争产品,功能相似,而Zero One则引入了新的思维方式。推理模型在处理请求时,需要花更多时间进行思考,而不仅仅是快速给出答案。
例如,在撰写长江的文章时,传统的模型可能直接产出结果,而推理模型则会在回答之前进行多步骤的思考和分析。
思维链技术
近年来,一种名为“思维链”的技术日益流行。它通过分步思考,使模型在面临复杂问题时,减少跳过重要步骤或出错的可能性。
数学能力的提升
推理模型能解决较为复杂的数学问题。针对数学竞赛,GPT 4.0曾只答对了13题,但最新的GPT 01预览模型的正确率达到了56%,即将发布的完整O1模型更是达到了83.3%。这表明新的推理模型在精准度上有了明显提升。
AI品牌企划示例
以新品牌“windy有风”为例,当我要求推理模型制定商业计划时,它花了九秒进行思考,最后提供了详细的营销和财务预算分析。这与过去的模型形成了鲜明对比,后者往往无法给出深度思考后的答案。
AI写回文测试
在01pre中进行的一个有趣测试是生成回文。例如,让模型写一个包含“有风”和“床”的回文,新的推理模型能更好地理解和处理这种语言游戏,而之前的模型则表现平平。
翻译能力
翻译在语言之间极具挑战性。一个特别的例子是,当我要求将“如今的小鲜肉越来越多了”翻译成英文时,新的模型展现出了更好的翻译和理解能力。
提示技巧
针对o1模型,建议使用一些新的提示方式:
- 不再需要明确要求“逐步思考”或“边想边说”,模型已自我适应这种工作方式。
- 简洁的提示往往会更有效,避免过多多余信息的干扰。
结束语
当前使用频率为30条的信息限制和缺乏一些工具的局限性是我们需关注的点。然而,随着功能的不断丰富与开发,未来ChatGPT将能够自动选择模型和工具,完美满足用户的需求。