OpenAI 的年度 DevDay 大会传统上是发布人工智能领域重大公告和突破性进展的舞台。去年的活动活动丰富多彩,发布了包括 GPT Store(该项目最终面临挑战)在内的新产品和工具。然而,今年的 DevDay 将采取截然不同的方式。
OpenAI 将其战略重大转变——将 DevDay 2024 从单一的大型活动转变为一系列在三个城市举行的亲密开发者交流会议:旧金山(10 月 1 日)、伦敦(10 月 30 日)和新加坡(11 月 21 日)。
此举强调了重新注重与开发者社区建立更紧密联系。
我们正在举办 OpenAI DevDay!今年秋天,欢迎来到旧金山、伦敦或新加坡,参加我们的实践课程、演示和最佳实践。与我们的工程师见面,了解世界各地的开发人员如何使用 OpenAI 进行构建。https://t.co/VI8UNJPJcf pic.twitter.com/zlrTAsb2TT
— OpenAI 开发者(@OpenAIDevs) 2024 年 8 月 5 日
GPT-5 不会很快到来
尽管人们对下一代车型的期待可能很高, DevDay 2024 不会成为此类声明的平台。相反,重点将放在展示 OpenAI 应用程序编程接口 (API) 和开发者服务方面的进步。由 OpenAI 产品和工程团队领导的研讨会、分组会议和现场演示将让开发者更深入地了解现有的工具和功能。此外,开发者聚焦将重点介绍来自 OpenAI 开发者社区的令人印象深刻的创作和创新项目。
OpenAI 最近的重点已转向采用更渐进的方式进行生成式 AI 开发。该公司的首要任务似乎是改进和优化现有工具,同时训练其继任者以取代当前的旗舰模型 GPT-4o 和 GPT-4o mini。这一战略转变反映了该公司致力于提高整体模型性能并解决与模型稳定性相关的过去问题。虽然有些人可能会认为,根据特定的基准,OpenAI 可能已经失去了其在生成式 AI 竞赛中的领先地位,但认识到核心开发方面正在进行的努力至关重要。
寻找创新动力
影响 OpenAI 战略转变的一个潜在因素是获取高质量训练数据的难度越来越大。包括来自 OpenAI 的模型在内的生成式 AI 模型严重依赖从网络上抓取的海量数据集。然而,由于担心抄袭和缺乏归属,许多创作者封锁了对其内容的访问,阻碍了数据收集过程。来自 Originality.AI 的数据表明 目前,全球前 1000 个网站中,超过 35% 的网站主动屏蔽了 OpenAI 的网络爬虫。此外,麻省理工学院数据来源计划的研究显示,很大一部分(约 25%)“高质量”数据源已被限制在主要的人工智能训练数据集之外。
Epoch AI 研究小组预测,这种数据访问限制趋势可能导致 2026-2032 年生成式 AI 模型的训练数据严重短缺。再加上潜在的版权侵权诉讼威胁,OpenAI 被迫与出版商和数据经纪人达成昂贵的许可协议。
尽管面临当前挑战,OpenAI 仍在不断创新。据报道,该公司已经开发出一种推理技术,有可能改善特定领域(尤其是数学查询)的模型响应。OpenAI 的首席技术官 Mira Murati 甚至暗示未来的模型将拥有“博士级”的智能。这些都是雄心勃勃的目标,也带来了巨大的压力。复杂模型的训练需要大量的财务投资,据报道,OpenAI 在计算资源和顶级研究人员方面投入了数十亿美元。
最终优先考虑人工智能安全?
OpenAI 仍在努力应对有关使用可能受版权保护的数据进行训练、限制性员工保密协议 (NDA) 以及边缘安全研究人员被排除在讨论之外的担忧等争议。这种向较慢开发周期的战略转变可能会带来意想不到的好处——抵消了 OpenAI 牺牲对 AI 安全的关注以支持生成式 AI 技术的快速发展的说法。
通过优先考虑开发人员参与和 API 改进,OpenAI 似乎正在进入一个新篇章,专注于建立强大的基础并培育蓬勃发展的开发人员生态系统。虽然等待下一代模型的时间可能会延长,但这种转变意味着可能重新致力于长期可持续发展,将安全性和透明度纳入 AI 进步的核心。
特色图片来源: OpenAI 开发者/X
Source: GPT-5 将不会在 2024 年 OpenAI DevDay 上发布