OpenAI o1 API 改变了 AI 模型处理复杂任务的方式。o1 系列模型通过鼓励深度思考,在科学和逻辑推理方面表现出色。这些模型目前处于测试阶段,并设定了令人印象深刻的基准,包括在竞争性编程中取得高排名,并在各个科学领域超越人类专家。
了解 OpenAI o1 API 之前的模型
OpenAI o1 API 现在具有推理令牌。与以前的模型不同,o1 模型使用推理令牌在响应之前仔细思考问题。由于这种内部推理过程,该模型可以处理更复杂的任务,尤其是在编码、数学和科学等领域。
OpenAI o1 API 有两个版本:o1-preview 和 o1-mini。o1-preview 模型用于解决需要大量知识的难题。这个早期预览模型展示了完整 o1 系列的功能。o1-mini 速度更快、成本更低。它适用于不需要太多常识但仍需要精确推理的任务,例如编码和科学。
OpenAI o1 API 为何脱颖而出?
OpenAI o1 API 在推理任务上表现异常出色。o1 模型在科学推理方面表现出色,在竞争性编程问题中排名第 89 位,并在美国数学奥林匹克资格赛中取得高分。这些模型在解决物理、生物和化学问题方面比人类更准确。这使它们成为科学领域的有用工具。
由于 OpenAI o1 API 目前处于测试阶段,因此开发人员应注意某些限制。测试版仅支持文本输入,并且某些聊天完成 API 参数尚不可用。例如,不支持图像输入、系统消息和流媒体。此外,函数调用和响应格式参数等工具不可用,并且某些设置(如温度和 presence_penalty)已修复。
尽管存在这些限制,OpenAI o1 API 仍提供了高达 128,000 个代币,具体模型允许不同的最大输出 token 限制。o1-preview 模型最多可以生成 32,768 个代币而 o1-mini 型号最多可产生 65,536 个代币。这个扩展的上下文窗口对于处理需要大量推理的复杂任务特别有益。
管理成本和代币限制
使用 OpenAI o1 API 的挑战之一是管理推理过程所需的大量令牌使用相关的成本。o1 模型会生成推理令牌(对用户不可见)和完成令牌(可见输出)。为了帮助开发人员管理这些成本,OpenAI 引入了 max_completion_tokens
参数,允许用户控制生成的代币总数。
此参数至关重要,因为推理标记的数量有时会超过可见完成标记的数量,从而导致更高的成本而没有相应的可见输出。通过调整 max_completion_tokens
参数,开发人员可以确保他们在预算范围内,同时仍然受益于强大的推理能力 OpenAI o1 API。
促进 o1 模型的最佳实践
使用 OpenAI o1 API 时,保持提示简单直接至关重要。模型旨在通过简单的指令表现出色,而复杂的提示策略(如思路链提示)可能没有必要。此外,使用分隔符来指示输入的不同部分可以帮助模型更准确地解释信息。
随着 OpenAI o1 API 的不断发展,预计未来更新中将添加多模态和工具使用等其他功能。目前,开发人员可以探索 o1 型号 并尝试其先进的推理功能来创建创新的应用程序。
如何访问 OpenAI o1 API
由于 API 处于测试阶段,因此目前对其访问受到限制。如果您是有兴趣使用 o1 模型的开发人员,请按照以下步骤获取访问权限:
- 检查您的使用等级: 访问 o1 型号 仅限于第 5 层的开发人员。您可以在 OpenAI 的平台上验证您的使用层。
- 请求访问: 如果您符合条件,请通过 OpenAI 的开发者门户申请访问权限。您可能需要提供有关预期用例的详细信息。
- 了解速率限制: 在测试阶段,API 的最低速率限制为每分钟 20 个请求 (RPM)。请据此规划您的使用情况。
获得访问权限后,您可以通过聊天完成端点开始尝试 o1-preview 和 o1-mini 模型。请记住,随着 API 结束测试阶段,可能会提供更多功能和更广泛的访问权限。
图片来源:OpenAI
Source: OpenAI o1 API 在复杂推理方面迈出新一步