发布模型卡：概述安全和风险缓解措施

啦北科技资讯 2024-08-11 906 0 英雄联盟四级考试

IT之家8月10日消息，OpenAI公司于8月8日发布报告，概述了GPT-4o模型的系统卡（SystemCard），介绍了包括外部红队（模拟敌人攻击）、准备框架（PreparednessFramework）在内的诸多细节。

OpenAI表示GPT-4o模型的核心就是准备框架（PreparednessFramework），这是一种评估和降低人工智能系统相关风险的系统方法。IT之家从报道中获悉，该框架主要用于识别网络安全、生物威胁、说服和模型自主性等领域的潜在危险。

除了针对GPT-4和GPT-4V进行的安全评估和缓解措施外，OpenAI还针对GPT-4o的音频功能开展了更多安全工作。

评估的风险包括扬声器识别、未经授权的语音生成、受版权保护内容的潜在生成、无根据推断以及不允许的内容。基于这些评估结果，OpenAI在模型和系统层面都实施了保障措施。

OpenAI还与100多名外部红队人员合作，在向公众发布模型之前对其进行评估。红队人员将进行探索性的能力发现，评估模型带来的新的潜在风险，发布模型卡：概述安全和风险缓解措施并对缓解措施进行压力测试。

免责声明：本网站部分内容由用户自行上传，若侵犯了您的权益，请联系我们处理，谢谢！联系QQ：2760375052