APIEval-20
一个让AI代理在API漏洞面前汗流浃背的基准测试,逐个模式进行考验。
APIEval-20 是一个用于评估AI代理在实际API测试中表现的任务基准。它涵盖7个领域的20个场景,仅通过模式和负载衡量漏洞发现能力,并在Hugging Face上提供公开数据集。
Free

如何使用 APIEval-20?
APIEval-20 提供了一个结构化基准,用于评估AI代理仅利用模式和负载信息检测API漏洞的能力。开发者和研究人员可借此测试其AI模型在7个领域20个场景中的表现,识别弱点并改进测试自动化。
APIEval-20 的核心功能
APIEval-20 的使用场景
APIEval-20 的常见问题
最受影响的职业
AI研究员
软件工程师
质量保证工程师
DevOps工程师
数据科学家
工程经理
产品经理
技术负责人
系统架构师
安全分析师