震裕科技企业 AI 内训 · 课堂操练包

Skill 评测操练包

打开任意标签页,复制评测方法、评分细则、评测范例和 Benchmark 资产规范。课堂建议流程:先写一个 Skill 初稿,再用评测包生成报告、用例、证据和可复跑结果。

返回课件 下载评测包 zip
① 规范名称、结构、字段、文件完整性,决定能不能被管理。
② 触发WHEN、WHEN NOT、正例和反例,决定会不会被正确调用。
③ 执行工作流、输入、输出、示例、失败处理,决定结果是否稳定。
④ Benchmark方法、用例、证据和结果落盘,决定能不能复跑比较。
⑤ 维护Owner、版本、引用文件、复盘记录,决定能否长期迭代。

加载中

已复制