夕小瑶科技 AI 评测实验室出品
一个功能强大的桌面端应用,能够快速生成AI模型测评网站,支持文生文和文生图功能。告别重复编码,一键生成专业测评报告!
- 🚀 一键测评: 配置API后即可开始AI模型测评,无需编写代码
- 📝 文生文测评: 支持代码生成、创意写作、逻辑推理等多种文本生成测试
- 🎨 文生图测评: 支持图像生成质量、创意表现、风格一致性测试
- 🎯 智能提示词管理: 内置丰富提示词库,支持手动管理和AI自动生成
- 🌐 美观网站生成: 自动生成响应式测评结果展示网站,支持搜索筛选
- 🔄 高效并发测试: 支持多线程并发测试,大幅提高测评效率
- 💾 断点续传: 测试中断后可继续执行,避免重复工作
- 📊 详细统计分析: 提供测试用例统计、成功率分析等功能
- 双击
启动工具.bat即可运行
-
安装依赖
pip install -r requirements.txt
-
运行程序
python main.py
# 运行完整系统测试
python test_system.py
# 测试GUI组件
python test_gui.pyAI模型快速测评工具/
├── main.py # 🎯 主程序入口(GUI应用)
├── test_engine.py # ⚙️ 测试执行引擎(API调用、结果处理)
├── prompt_manager.py # 📝 提示词管理器(测试用例管理)
├── website_generator.py # 🌐 网站生成器(HTML生成)
├── utils.py # 🔧 工具函数库(通用工具)
├── config.example.json # 📋 配置文件模板
├── requirements.txt # 📦 依赖包列表
├── 启动工具.bat # 🚀 Windows启动脚本
├── test_system.py # 🧪 系统测试脚本
├── test_gui.py # 🖥️ GUI测试脚本
├── test_cases/ # 📚 测试用例目录
│ ├── text_cases.json # 📝 文生文测试用例
│ └── image_cases.json# 🎨 文生图测试用例
├── output/ # 📤 测试结果输出目录
│ ├── text/ # 📝 文生文结果
│ ├── image/ # 🎨 文生图结果
│ └── website/ # 🌐 生成的网站
└── README.md # 📖 项目说明文档
- 在"配置设置"标签页中输入API地址、密钥和模型名称
- 设置合适的并发线程数(建议5-15)
- 切换到"开始测评"标签页
- 选择测评类型(文生文/文生图/全部)
- 点击"开始测评"按钮,实时查看进度和日志
- 在"提示词管理"标签页中查看和编辑测试用例
- 支持手动添加、编辑、删除测试用例
- 支持AI自动生成新的测试用例
- 测评完成后,在"结果查看"标签页点击"生成网站"
- 自动打开浏览器查看美观的测评结果网站
- 支持搜索、筛选、分类查看测试结果
- 桌面应用: 基于Python + Tkinter,跨平台兼容
- API兼容: 支持OpenAI格式的各种AI模型API
- 响应式设计: 生成的网站支持PC和移动端访问
- 实时监控: 可视化进度条和详细日志输出
- 数据持久化: JSON格式存储,便于数据管理和迁移
- 模块化架构: 清晰的代码结构,易于维护和扩展
- 支持导入/导出测试用例
- 可自定义测试难度、分类、标签
- 支持批量操作和AI辅助生成
- 自动生成响应式HTML网站
- 支持搜索、筛选、排序功能
- 美观的卡片式布局和动画效果
- 多线程并发测试,提高效率
- 智能重试机制,提高成功率
- 断点续传,避免重复工作
© 2025 夕小瑶科技. All Rights Reserved.