AI安全

共找到 3 个AI工具

个工具

主分类: 编程

子分类: AI安全

找到 3 个匹配工具

相关AI工具

点击任意工具查看详细信息

JailbreakZoo

JailbreakZoo是一个专注于破解大型模型（包括大型语言模型和视觉语言模型）的资源库。该项目旨在探索这些高级AI模型的漏洞、利用方法和防御机制，目的是促进对大规模AI系统安全方面的更深入理解和认识。

AI安全模型破解防御机制

编程访问

Frontier Safety Framework

Frontier Safety Framework是Google DeepMind提出的一套协议，用于主动识别未来AI能力可能导致严重伤害的情况，并建立机制来检测和减轻这些风险。该框架专注于模型层面的强大能力，如卓越的代理能力或复杂的网络能力。它旨在补充我们的对齐研究，即训练模型按照人类价值观和社会目标行事，以及Google现有的AI责任和安全实践。

风险评估模型评估 AI安全 +1

编程访问

PyRIT

PyRIT是由Azure开发的Python风险识别工具，旨在帮助安全专业人员和机器学习工程师主动发现其生成AI系统中的风险。该工具自动化了AI红队任务，使操作者能够专注于更复杂和耗时的任务，同时能够识别安全和隐私危害。

AI安全风险识别自动化框架

编程访问

探索更多编程工具

AI安全是编程分类下的热门子分类，包含 3 个优质AI工具

浏览编程分类分类

AI安全

相关AI工具

JailbreakZoo

Frontier Safety Framework

PyRIT

相关子分类

开发与工具

AI模型

代码助手

AI开发助手

模型训练与部署

AI代码助手

开发平台

研究工具

探索更多编程工具

AI安全

相关AI工具

JailbreakZoo

Frontier Safety Framework

PyRIT

相关子分类

开发与工具

AI模型

代码助手

AI开发助手

模型训练与部署

AI代码助手

开发平台

研究工具

探索更多 编程 工具

探索更多编程工具