Autobox Engine

Multi-agent AI simulation runtime engine powered by TypeScript, BullMQ, and OpenAI

Overview

autobox-engine-ts is a TypeScript-based simulation runtime that orchestrates multi-agent AI conversations using OpenAI's GPT models. It's designed to simulate complex social interactions, decision-making scenarios, and collaborative problem-solving through autonomous AI agents.

This is a complete rewrite of the Python/Thespian-based engine, migrating from an actor-based architecture to a simpler message queue system using BullMQ and Redis.

Key Features

🤖 Multi-Agent Orchestration - Coordinate multiple AI agents with distinct roles and personalities
📨 Message Queue Architecture - BullMQ-powered reliable message passing between agents
🎯 Structured Agent Roles - Orchestrator, Planner, Evaluator, Reporter, and Worker agents
📊 Real-time Metrics - Track simulation progress and evaluate outcomes
🔌 REST API - Control and monitor simulations via HTTP endpoints
🐳 Docker Ready - Containerized deployment for isolation and scalability
⚡ Hot Reload - Fast development with tsx watch mode
📝 OpenAPI Documentation - Auto-generated Swagger UI for API exploration

Architecture

┌─────────────────────────────────────────────────────────┐
│              Express API Server (Port 3000)             │
│         (Status, Metrics, Instructions, Info)           │
└─────────────────────────────────────────────────────────┘
                            ↓
┌─────────────────────────────────────────────────────────┐
│                    Simulation Runtime                   │
│                                                          │
│  ┌──────────────┐    ┌─────────────────────────────┐  │
│  │ Orchestrator │───→│     MessageBroker (Redis)   │  │
│  └──────────────┘    │                              │  │
│         ↓            │  ┌────────────────────────┐  │  │
│  ┌──────────────┐    │  │ Agent Queues (BullMQ)│  │  │
│  │   Planner    │←──→│  │ - orchestrator-queue │  │  │
│  └──────────────┘    │  │ - planner-queue      │  │  │
│         ↓            │  │ - evaluator-queue    │  │  │
│  ┌──────────────┐    │  │ - reporter-queue     │  │  │
│  │  Evaluator   │←──→│  │ - worker-N-queue    │  │  │
│  └──────────────┘    │  └────────────────────────┘  │  │
│         ↓            └─────────────────────────────┘  │
│  ┌──────────────┐                                      │
│  │  Reporter    │                                      │
│  └──────────────┘                                      │
│         ↓                                               │
│  ┌──────────────┐                                      │
│  │ Worker Agents│ (Custom personas & roles)            │
│  └──────────────┘                                      │
└─────────────────────────────────────────────────────────┘
                            ↓
                    ┌──────────────┐
                    │  OpenAI API  │
                    │ (GPT Models) │
                    └──────────────┘

Agent Types

Orchestrator: Coordinates simulation flow and decides which agent speaks next
Planner: Creates conversation plan and manages turn order
Evaluator: Evaluates simulation progress against defined metrics
Reporter: Generates final simulation summary and insights
Workers: Custom agents with unique personas (e.g., ANA, JOHN, DETECTIVE)

Quick Start

Prerequisites

Node.js 18+ and Yarn 4.x
Redis server running locally or remotely
OpenAI API Key with access to GPT models
Docker (optional, for containerized deployment)

Installation

# Install dependencies
yarn install

# Copy environment template
cp .env.example .env

# Edit .env with your configuration
nano .env

Configuration

Set up your .env file:

# OpenAI API Key (required)
OPENAI_API_KEY=sk-your-api-key-here

# Redis Configuration
REDIS_HOST=localhost
REDIS_PORT=6379

# Server Configuration
PORT=3000
NODE_ENV=development
LOG_LEVEL=info

# JWT Configuration (for API auth)
JWT_SECRET=your-secret-key-here

Running Your First Simulation

# Start development server with default simulation
yarn dev

# Run specific simulation
yarn dev --simulation-name=summer_vacation
yarn dev --simulation-name=crime_detective
yarn dev --simulation-name=gift_choice
yarn dev --simulation-name=nordic_team

The API server will be available at http://localhost:3000 with Swagger documentation at http://localhost:3000/docs.

Available Simulations

The project includes four example simulations in examples/simulations/:

1. Summer Vacation Planning

File: summer_vacation.json Scenario: A couple (ANA and JOHN) decides on a vacation destination Agents: 2 workers Use Case: Decision-making, negotiation, relationship dynamics

2. Crime Detective

File: crime_detective.json Scenario: Detective solves a murder at a high-society gala Agents: DETECTIVE, SINGER, DRIVER, BANKER Use Case: Mystery solving, interrogation, deduction

3. Gift Choice

File: gift_choice.json Scenario: Selecting the perfect gift Use Case: Preference elicitation, recommendation

4. Nordic Team Planning

File: nordic_team.json Scenario: Software development project planning Agents: Team with Nordic names Use Case: Project management, team collaboration

Usage

Development Mode

# Start with hot reload
yarn dev

# Run with custom config path
yarn dev --config=/path/to/configs --simulation-name=my_simulation

Production Mode

# Build TypeScript
yarn build

# Run compiled code
yarn start

# Run in daemon mode (keeps server alive after simulation)
node dist/index.js --daemon --simulation-name=summer_vacation

Code Quality

# Run linter
yarn lint

# Auto-fix linting issues
yarn lint:fix

# Format code with Prettier
yarn format

# Run tests (not yet implemented)
yarn test

Docker

# Build images
yarn docker:build              # Production image
yarn docker:build:dev          # Development image

# Run containers (requires OPENAI_API_KEY)
export OPENAI_API_KEY=your-key
yarn docker:run                # Production container
yarn docker:run:dev            # Dev container with hot-reload
yarn docker:run:exit           # Run and exit on completion

# Clean up
yarn docker:clean              # Remove latest image
yarn docker:clean:all          # Remove all images including dev

For detailed Docker usage, configuration, and troubleshooting, see DOCKER.md.

API Endpoints

Health & Information

GET /health - Health check
GET /ping - Simple ping endpoint
GET /v1/info - Get agent information (names and IDs)

Simulation Control

GET /v1/status - Get current simulation status
GET /v1/metrics - Get simulation metrics
POST /v1/instructions/agents/:agent_id - Send instruction to specific agent
POST /v1/abort - Abort running simulation

Documentation

GET / - OpenAPI specification (JSON)
GET /docs - Interactive Swagger UI

Example API Calls

# Check simulation status
curl http://localhost:3000/v1/status

# Get simulation metrics
curl http://localhost:3000/v1/metrics

# Get agent info
curl http://localhost:3000/v1/info

# Send instruction to agent
curl -X POST http://localhost:3000/v1/instructions/agents/{agent_id} \
  -H "Content-Type: application/json" \
  -d '{"instruction": "Focus on budget-friendly options"}'

# Abort simulation
curl -X POST http://localhost:3000/v1/abort

Creating Custom Simulations

1. Create Simulation Config

Create a new file in examples/simulations/my_simulation.json:

{
  "name": "My Simulation",
  "max_steps": 150,
  "timeout_seconds": 600,
  "shutdown_grace_period_seconds": 5,
  "task": "Your simulation task description",
  "description": "Detailed simulation description",
  "orchestrator": {
    "name": "ORCHESTRATOR",
    "mailbox": { "max_size": 400 },
    "llm": { "model": "gpt-4o-mini" }
  },
  "planner": {
    "name": "PLANNER",
    "mailbox": { "max_size": 400 },
    "llm": { "model": "gpt-5-nano" }
  },
  "evaluator": {
    "name": "EVALUATOR",
    "mailbox": { "max_size": 400 },
    "llm": { "model": "gpt-4o-mini" }
  },
  "reporter": {
    "name": "REPORTER",
    "mailbox": { "max_size": 400 },
    "llm": { "model": "gpt-5-nano" }
  },
  "workers": [
    {
      "name": "AGENT1",
      "description": "First agent description",
      "context": "Role: ... Backstory: ... Personality: ...",
      "mailbox": { "max_size": 100 },
      "llm": { "model": "gpt-4o-mini" }
    }
  ]
}

2. Create Metrics Config

Create examples/metrics/my_simulation.json:

[
  {
    "name": "decision_made",
    "description": "Whether agents reached a decision",
    "type": "GAUGE",
    "unit": "boolean",
    "tags": ["outcome"]
  }
]

3. Run Your Simulation

yarn dev --simulation-name=my_simulation

Configuration Options

Agent Configuration Fields

name: Agent identifier (uppercase recommended)
description: Human-readable agent description
context: Role, backstory, and personality details
instruction: Optional specific instructions
mailbox.max_size: Queue capacity (100-400 recommended)
llm.model: OpenAI model (e.g., gpt-4o-mini, o4-mini)

Simulation Configuration Fields

max_steps: Maximum conversation turns
timeout_seconds: Simulation timeout
shutdown_grace_period_seconds: Graceful shutdown wait time
task: High-level simulation goal
description: Detailed scenario description

Development

Project Structure

autobox-engine-ts/
├── src/
│   ├── api/               # API routes and handlers
│   ├── core/              # Core simulation logic
│   │   ├── agents/        # Agent creation and handlers
│   │   ├── llm/           # LLM integration and prompts
│   │   ├── memory/        # Conversation memory
│   │   └── simulation/    # Simulation orchestration
│   ├── messaging/         # BullMQ message broker
│   ├── schemas/           # Zod validation schemas
│   ├── config/            # Configuration loaders
│   ├── middlewares/       # Express middlewares
│   └── index.ts           # Entry point
├── examples/
│   ├── simulations/       # Simulation configs
│   ├── metrics/           # Metrics definitions
│   └── server/            # Server configs
├── dist/                  # Compiled JavaScript
└── package.json

Adding New Agent Types

Create handler: src/core/agents/handlers/createMyAgentHandler.ts
Create factory: src/core/agents/createMyAgent.ts
Add prompts: src/core/llm/prompts/myagent/v0.0.1/
Update createSimulation() in src/core/simulation/createSimulation.ts
Add to config schema: src/schemas/internal/simulationConfig.ts

Extending Message Types

Extend MessageSchema in src/schemas/internal/message.ts
Add type guard function (e.g., isMyMessageType())
Update agent handlers to process new type

Docker Deployment

The engine includes complete Docker support for both development and production environments. Docker provides isolation, reproducibility, and easy deployment.

Quick Docker Start

# Build production image
yarn docker:build

# Set environment variables
export OPENAI_API_KEY=your-key-here

# Run with default simulation
yarn docker:run

# Run specific simulation
./bin/docker-run --simulation-name crime_detective

Docker Features

Multi-stage Production Build: Optimized image size (~200MB)
Development Image: Hot-reload support with source mounting
Auto Port Detection: Automatically finds free ports
Volume Mounting: Persists logs and configuration
Health Checks: Built-in HTTP health endpoint
Redis Integration: Configured for BullMQ connectivity

Docker Commands

Command	Description
`yarn docker:build`	Build production image
`yarn docker:build:dev`	Build development image
`yarn docker:run`	Run production container
`yarn docker:run:dev`	Run dev container with hot-reload
`yarn docker:run:exit`	Run and exit on completion
`yarn docker:clean`	Remove latest image
`yarn docker:clean:all`	Remove all images

Docker with Redis

If Redis is running in another Docker container:

# Start Redis
docker run -d --name redis -p 6379:6379 redis:alpine

# Run engine (use host.docker.internal on macOS/Windows)
./bin/docker-run --redis-host host.docker.internal

For complete Docker documentation including:

Detailed script options
Volume mounting configuration
Multi-platform builds
Troubleshooting guide
Comparison with Python engine

See DOCKER.md

Troubleshooting

Redis Connection Issues

# Check if Redis is running
redis-cli ping
# Should return: PONG

# Start Redis (macOS with Homebrew)
brew services start redis

# Start Redis (Docker)
docker run -d -p 6379:6379 redis:alpine

OpenAI API Errors

Verify your API key is set: echo $OPENAI_API_KEY
Check API key has sufficient credits
Ensure model names are correct (e.g., gpt-4o-mini, not gpt-4o)

Simulation Not Starting

Check logs for errors: simulation logs show in console
Verify all config files exist in examples/ directories
Ensure Redis is accessible at configured host:port

Performance Considerations

Message Throttling: 200ms delay between messages prevents queue flooding
Queue Sizes: Configure mailbox.max_size based on expected conversation length
Model Selection: Use gpt-4o-mini for cost-effective performance
Timeout Values: Set timeout_seconds appropriately for simulation complexity

Roadmap

Implement comprehensive test suite
Docker support with production and development images
Add Docker Compose setup for Redis + Engine orchestration
Support for multiple concurrent simulations
Persistent storage for simulation history
Real-time WebSocket updates
Advanced metrics visualization
Plugin system for custom agents

Contributing

Contributions are welcome! Please follow these guidelines:

Fork the repository
Create a feature branch (git checkout -b feature/amazing-feature)
Commit your changes (git commit -m 'Add amazing feature')
Push to the branch (git push origin feature/amazing-feature)
Open a Pull Request

License

ISC License - see LICENSE file for details

Related Projects

autobox-api - REST API for simulation management
autobox-ui - Web interface for monitoring simulations
autobox-cli - Command-line tool for simulation control
autobox-mcp - MCP server for Claude integration

Support

For questions and support:

Open an issue on GitHub
Check the CLAUDE.md file for detailed development guidance

Built with ❤️ using TypeScript, BullMQ, and OpenAI

Name		Name	Last commit message	Last commit date
Latest commit History 45 Commits
.github/workflows		.github/workflows
bin		bin
examples		examples
src		src
tests		tests
.codecov.yml		.codecov.yml
.cursorignore		.cursorignore
.dockerignore		.dockerignore
.env.example		.env.example
.gitignore		.gitignore
.prettierrc		.prettierrc
.yarnrc.yml		.yarnrc.yml
CLAUDE.md		CLAUDE.md
DOCKER.md		DOCKER.md
Dockerfile		Dockerfile
Dockerfile.dev		Dockerfile.dev
LICENSE		LICENSE
LLM_PROVIDERS.md		LLM_PROVIDERS.md
README.md		README.md
docker-compose.yml		docker-compose.yml
eslint.config.mjs		eslint.config.mjs
jest.config.js		jest.config.js
package.json		package.json
tsconfig.json		tsconfig.json
yarn.lock		yarn.lock

Folders and files

Latest commit

History

Repository files navigation

Autobox Engine

Overview

Key Features

Architecture

Agent Types

Quick Start

Prerequisites

Installation

Configuration

Running Your First Simulation

Available Simulations

1. Summer Vacation Planning

2. Crime Detective

3. Gift Choice

4. Nordic Team Planning

Usage

Development Mode

Production Mode

Code Quality

Docker

API Endpoints

Health & Information

Simulation Control

Documentation

Example API Calls

Creating Custom Simulations

1. Create Simulation Config

2. Create Metrics Config

3. Run Your Simulation

Configuration Options

Agent Configuration Fields

Simulation Configuration Fields

Development

Project Structure

Adding New Agent Types

Extending Message Types

Docker Deployment

Quick Docker Start

Docker Features

Docker Commands

Docker with Redis

Troubleshooting

Redis Connection Issues

OpenAI API Errors

Simulation Not Starting

Performance Considerations

Roadmap

Contributing

License

Related Projects

Support

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages