🚀 AI模型快速测评工具 v2.0

夕小瑶科技 AI 评测实验室出品

一个功能强大的桌面端应用，能够快速生成AI模型测评网站，支持文生文和文生图功能。告别重复编码，一键生成专业测评报告！

✨ 功能特点

🚀 一键测评: 配置API后即可开始AI模型测评，无需编写代码
📝 文生文测评: 支持代码生成、创意写作、逻辑推理等多种文本生成测试
🎨 文生图测评: 支持图像生成质量、创意表现、风格一致性测试
🎯 智能提示词管理: 内置丰富提示词库，支持手动管理和AI自动生成
🌐 美观网站生成: 自动生成响应式测评结果展示网站，支持搜索筛选
🔄 高效并发测试: 支持多线程并发测试，大幅提高测评效率
💾 断点续传: 测试中断后可继续执行，避免重复工作
📊 详细统计分析: 提供测试用例统计、成功率分析等功能

🚀 快速开始

方法一：使用启动脚本（推荐）

双击 启动工具.bat 即可运行

方法二：命令行启动

安装依赖
```
pip install -r requirements.txt
```
运行程序
```
python main.py
```

方法三：系统测试

# 运行完整系统测试
python test_system.py

# 测试GUI组件
python test_gui.py

📁 项目结构

AI模型快速测评工具/
├── main.py              # 🎯 主程序入口（GUI应用）
├── test_engine.py       # ⚙️ 测试执行引擎（API调用、结果处理）
├── prompt_manager.py    # 📝 提示词管理器（测试用例管理）
├── website_generator.py # 🌐 网站生成器（HTML生成）
├── utils.py            # 🔧 工具函数库（通用工具）
├── config.example.json # 📋 配置文件模板
├── requirements.txt    # 📦 依赖包列表
├── 启动工具.bat        # 🚀 Windows启动脚本
├── test_system.py      # 🧪 系统测试脚本
├── test_gui.py         # 🖥️ GUI测试脚本
├── test_cases/         # 📚 测试用例目录
│   ├── text_cases.json # 📝 文生文测试用例
│   └── image_cases.json# 🎨 文生图测试用例
├── output/            # 📤 测试结果输出目录
│   ├── text/          # 📝 文生文结果
│   ├── image/         # 🎨 文生图结果
│   └── website/       # 🌐 生成的网站
└── README.md          # 📖 项目说明文档

📖 使用说明

1️⃣ 配置设置

在"配置设置"标签页中输入API地址、密钥和模型名称
设置合适的并发线程数（建议5-15）

2️⃣ 开始测评

切换到"开始测评"标签页
选择测评类型（文生文/文生图/全部）
点击"开始测评"按钮，实时查看进度和日志

3️⃣ 提示词管理

在"提示词管理"标签页中查看和编辑测试用例
支持手动添加、编辑、删除测试用例
支持AI自动生成新的测试用例

4️⃣ 结果查看

测评完成后，在"结果查看"标签页点击"生成网站"
自动打开浏览器查看美观的测评结果网站
支持搜索、筛选、分类查看测试结果

🛠️ 技术特点

桌面应用: 基于Python + Tkinter，跨平台兼容
API兼容: 支持OpenAI格式的各种AI模型API
响应式设计: 生成的网站支持PC和移动端访问
实时监控: 可视化进度条和详细日志输出
数据持久化: JSON格式存储，便于数据管理和迁移
模块化架构: 清晰的代码结构，易于维护和扩展

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🚀 AI模型快速测评工具 v2.0

✨ 功能特点

🚀 快速开始

方法一：使用启动脚本（推荐）

方法二：命令行启动

方法三：系统测试

📁 项目结构

📖 使用说明

1️⃣ 配置设置

2️⃣ 开始测评

3️⃣ 提示词管理

4️⃣ 结果查看

🛠️ 技术特点

🔧 高级功能

自定义测试用例

网站定制

性能优化

版权信息

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
test_cases		test_cases
.gitignore		.gitignore
README.md		README.md
config.example.json		config.example.json
main.py		main.py
prompt_manager.py		prompt_manager.py
requirements.txt		requirements.txt
test_engine.py		test_engine.py
test_gui.py		test_gui.py
test_system.py		test_system.py
utils.py		utils.py
website_generator.py		website_generator.py
启动工具.bat		启动工具.bat

Folders and files

Latest commit

History

Repository files navigation

🚀 AI模型快速测评工具 v2.0

✨ 功能特点

🚀 快速开始

方法一：使用启动脚本（推荐）

方法二：命令行启动

方法三：系统测试

📁 项目结构

📖 使用说明

1️⃣ 配置设置

2️⃣ 开始测评

3️⃣ 提示词管理

4️⃣ 结果查看

🛠️ 技术特点

🔧 高级功能

自定义测试用例

网站定制

性能优化

版权信息

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages