CrowdStrike 和 Meta 推出了 Cyber​​SOCEval,这是一个开源基准套件,旨在评估安全运营中心 (SOC) 中人工智能模型的性能。这一举措是在网络安全领域的关键时刻提出的,人工智能同时助长了复杂的威胁和创新的防御。该工具旨在帮助企业应对人工智能驱动的网络安全解决方案的激增,确保他们选择能够针对现实世界的攻击带来切实好处的模型。

网络安全领导者 CrowdStrike 与开源人工智能先驱 Meta 之间的合作解决了一个紧迫的挑战:可用的人工智能工具种类繁多,每种工具都有不同的功能和成本。正如 CrowdStrike 在新闻稿中所述,“如果没有明确的基准,就很难知道哪些系统、用例和性能标准能够针对现实世界的攻击提供真正的 AI 优势。”Cyber​​SOCEval 通过在基本网络安全任务(包括事件响应、威胁分析理解和恶意软件测试)上测试大型语言模型 (LLM) 来填补这一空白。这些基准为组织提供了一种结构化的方法来评估各种人工智能系统的优缺点,超越了模糊的主张和经验证据。

除了评估之外,该框架还为人工智能开发生态系统提供了更广泛的影响。通过揭示企业客户如何在网络安全环境中部署法学硕士,Cyber​​SOCEval 为开发人员提供了创建更专业、更有效模型的见解。这可以加速针对安全的人工智能的进步,最终加强金融服务等高风险环境中的防御。

此次发布凸显了网络安全领域不断升级的“数字军备竞赛”,人工智能为攻击者和防御者提供了支持。恶意行为者正在利用人工智能来应对新的威胁,例如自动密码暴力破解,它利用机器学习以前所未有的速度破解凭据。作为回应,SOC 正在将人工智能集成到其运营中,以检测异常、分析威胁并自动响应。这反映了生物军备竞赛,就像免疫系统与不断进化的病原体的战斗一样,防御系统必须不断适应才能保持领先。

现实世界的证据凸显了风险和潜在的回报。万事达卡和英国《金融时报》经度最近的一项调查显示,金融服务公司通过部署人工智能工具来打击人工智能欺诈,节省了数百万美元。这些节省源于更快的威胁检测和减少的人工干预,展示了人工智能如何将网络安全从成本中心转变为战略优势。然而,如果没有像 Cyber​​SOCEval 这样的可靠基准,组织就会冒着投资性能不佳的工具而无法应对新兴风险的风险。

Meta 对开源原则的承诺是该项目的核心。与 OpenAI 等专有模型不同,开源方法允许开发人员访问模型权重,在某些情况下还可以访问源代码,从而促进协作创新。这种透明度可以实现快速迭代和定制,这对于威胁每天都在变化的领域至关重要。 Meta 超级智能实验室部门的生成人工智能产品总监 Vincent Konguet 强调了协作潜力:“有了这些基准,并为安全和人工智能社区的进一步改进开放,我们可以作为一个行业更快地发挥人工智能在防御高级攻击(包括基于人工智能的威胁)方面的潜力。”

当企业为 2025 年人工智能驱动的网络威胁预计激增做好准备时,CyberSOCEval 的时机尤为重要。专家预计复杂的攻击将会增加,包括基于深度伪造的网络钓鱼和人工智能优化的恶意软件。通过提供标准化的评估方法,该套件可以帮助网络安全专业人员优先考虑在现实场景中表现出色的工具,例如在勒索软件事件期间对警报进行分类或剖析网络钓鱼活动。

无障碍是该计划的一个关键特征。 Cyber​​SOCEval 可在 GitHub 上免费获取,邀请全球安全和人工智能社区做出贡献。其他资源(包括详细的基准规范和使用指南)托管在该项目的专用网站上。这种开放模式与封闭的生态系统形成鲜明对比,有可能实现高质量人工智能安全工具的民主化,并减少小型组织的障碍。

随着人工智能在网络安全中的作用不断加深,像 Cyber​​SOCEval 这样的举措代表了迈向负责任创新的关键一步。它们不仅有助于工具选择,还促进对人工智能在防御日益智能的对手方面的局限性和可能性的共同理解。为了对于正在努力解决工具过载问题的企业来说,该基准套件提供了一条清晰的途径,可以做出更明智的决策,有可能避免代价高昂的违规行为并增强整体弹性。

总之,CrowdStrike 和 Meta 之间的合作标志着人工智能网络安全市场的成熟,基准驱动着责任和进步。随着威胁的增加,像 Cyber​​SOCEval 这样的工具对于确保人工智能充当盾牌而不是漏洞至关重要。

  Airbnb 的人工智能聊天机器人现在可以处理三分之一的客户请求