Koala OSS Club


Promptfoo | LLM 的测试驱动开发


Promptfoo 是一个开源的 LLM 测试框架,支持用 YAML 定义测试用例,自动对比多个模型输出,还能检查 Prompt 注入等安全风险。它强调测试驱动的 LLM 开发,而不是反复试错。支持接入 CI/CD,也提供合规报告映射到 OWASP、NIST 等标准。 点评:LLM 应用进入生产环境后,可观测性和测试覆盖是两大痛点。Promptfoo 把传统软件测试的方法论引入 AI 领域,这种思路比单纯依赖人工评估更可持续。前段时间 Anthropic 发布的博客中,提到他们内部也在使用这个工具做 Agent 质量评估,也是让 Promptfoo 获得了更多的关注。
URL
https://www.promptfoo.dev/
标签
AI,安全,工具
视频
科技周报视频合集