Skip to content

147228/model-test-trae-solo

Repository files navigation

🚀 AI模型快速测评工具 v2.0

夕小瑶科技 AI 评测实验室出品

一个功能强大的桌面端应用,能够快速生成AI模型测评网站,支持文生文和文生图功能。告别重复编码,一键生成专业测评报告!

✨ 功能特点

  • 🚀 一键测评: 配置API后即可开始AI模型测评,无需编写代码
  • 📝 文生文测评: 支持代码生成、创意写作、逻辑推理等多种文本生成测试
  • 🎨 文生图测评: 支持图像生成质量、创意表现、风格一致性测试
  • 🎯 智能提示词管理: 内置丰富提示词库,支持手动管理和AI自动生成
  • 🌐 美观网站生成: 自动生成响应式测评结果展示网站,支持搜索筛选
  • 🔄 高效并发测试: 支持多线程并发测试,大幅提高测评效率
  • 💾 断点续传: 测试中断后可继续执行,避免重复工作
  • 📊 详细统计分析: 提供测试用例统计、成功率分析等功能

🚀 快速开始

方法一:使用启动脚本(推荐)

  1. 双击 启动工具.bat 即可运行

方法二:命令行启动

  1. 安装依赖

    pip install -r requirements.txt
  2. 运行程序

    python main.py

方法三:系统测试

# 运行完整系统测试
python test_system.py

# 测试GUI组件
python test_gui.py

📁 项目结构

AI模型快速测评工具/
├── main.py              # 🎯 主程序入口(GUI应用)
├── test_engine.py       # ⚙️ 测试执行引擎(API调用、结果处理)
├── prompt_manager.py    # 📝 提示词管理器(测试用例管理)
├── website_generator.py # 🌐 网站生成器(HTML生成)
├── utils.py            # 🔧 工具函数库(通用工具)
├── config.example.json # 📋 配置文件模板
├── requirements.txt    # 📦 依赖包列表
├── 启动工具.bat        # 🚀 Windows启动脚本
├── test_system.py      # 🧪 系统测试脚本
├── test_gui.py         # 🖥️ GUI测试脚本
├── test_cases/         # 📚 测试用例目录
│   ├── text_cases.json # 📝 文生文测试用例
│   └── image_cases.json# 🎨 文生图测试用例
├── output/            # 📤 测试结果输出目录
│   ├── text/          # 📝 文生文结果
│   ├── image/         # 🎨 文生图结果
│   └── website/       # 🌐 生成的网站
└── README.md          # 📖 项目说明文档

📖 使用说明

1️⃣ 配置设置

  • 在"配置设置"标签页中输入API地址、密钥和模型名称
  • 设置合适的并发线程数(建议5-15)

2️⃣ 开始测评

  • 切换到"开始测评"标签页
  • 选择测评类型(文生文/文生图/全部)
  • 点击"开始测评"按钮,实时查看进度和日志

3️⃣ 提示词管理

  • 在"提示词管理"标签页中查看和编辑测试用例
  • 支持手动添加、编辑、删除测试用例
  • 支持AI自动生成新的测试用例

4️⃣ 结果查看

  • 测评完成后,在"结果查看"标签页点击"生成网站"
  • 自动打开浏览器查看美观的测评结果网站
  • 支持搜索、筛选、分类查看测试结果

🛠️ 技术特点

  • 桌面应用: 基于Python + Tkinter,跨平台兼容
  • API兼容: 支持OpenAI格式的各种AI模型API
  • 响应式设计: 生成的网站支持PC和移动端访问
  • 实时监控: 可视化进度条和详细日志输出
  • 数据持久化: JSON格式存储,便于数据管理和迁移
  • 模块化架构: 清晰的代码结构,易于维护和扩展

🔧 高级功能

自定义测试用例

  • 支持导入/导出测试用例
  • 可自定义测试难度、分类、标签
  • 支持批量操作和AI辅助生成

网站定制

  • 自动生成响应式HTML网站
  • 支持搜索、筛选、排序功能
  • 美观的卡片式布局和动画效果

性能优化

  • 多线程并发测试,提高效率
  • 智能重试机制,提高成功率
  • 断点续传,避免重复工作

版权信息

© 2025 夕小瑶科技. All Rights Reserved.

About

AI 模型快速测评工具和测评网站生成器

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors