ShellMonster · ShellMonster · Apr 21, 2026 · Apr 21, 2026 · Apr 21, 2026 · Apr 21, 2026
diff --git a/backend/internal/api/handlers.go b/backend/internal/api/handlers.go
@@ -101,6 +101,12 @@ func buildConfigSnapshot(providerName, modelID string, params map[string]interfa
 	} else if v, ok := params["image_size"].(string); ok && v != "" {
 		snapshot["imageSize"] = v
 	}
+	if v, ok := params["size"].(string); ok && strings.TrimSpace(v) != "" {
+		snapshot["size"] = strings.TrimSpace(v)
+	}
+	if v, ok := params["quality"].(string); ok && strings.TrimSpace(v) != "" {
+		snapshot["quality"] = strings.TrimSpace(v)
+	}
 
 	// count 可能是 float64（JSON 解析）或 int（服务内部）
 	if v, ok := params["count"].(int); ok && v > 0 {
@@ -132,7 +138,7 @@ func fetchProviderConfig(providerName string) *model.ProviderConfig {
 
 func defaultTimeoutSecondsForProvider(providerName string) int {
 	switch providerName {
-	case "gemini", "openai":
+	case "gemini", "openai", "openai-image":
 		return 500
 	default:
 		return 150
@@ -141,7 +147,7 @@ func defaultTimeoutSecondsForProvider(providerName string) int {
 
 func providerDefaultMaxRetries(providerName string) int {
 	switch providerName {
-	case "gemini", "openai":
+	case "gemini", "openai", "openai-image":
 		return 1
 	default:
 		return 1

diff --git a/backend/internal/model/db.go b/backend/internal/model/db.go
@@ -49,12 +49,12 @@ func InitDB(dbPath string) {
 
 	// 兼容旧版本默认超时（0/60s）记录：按 Provider 类型修复到对应默认值
 	if err := DB.Model(&ProviderConfig{}).
-		Where("provider_name IN ? AND (timeout_seconds <= 0 OR timeout_seconds = ?)", []string{"gemini", "openai"}, 60).
+		Where("provider_name IN ? AND (timeout_seconds <= 0 OR timeout_seconds = ?)", []string{"gemini", "openai", "openai-image"}, 60).
 		Update("timeout_seconds", 500).Error; err != nil {
 		log.Printf("更新生图默认超时失败: %v", err)
 	}
 	if err := DB.Model(&ProviderConfig{}).
-		Where("provider_name NOT IN ? AND (timeout_seconds <= 0 OR timeout_seconds = ?)", []string{"gemini", "openai"}, 60).
+		Where("provider_name NOT IN ? AND (timeout_seconds <= 0 OR timeout_seconds = ?)", []string{"gemini", "openai", "openai-image"}, 60).
 		Update("timeout_seconds", 150).Error; err != nil {
 		log.Printf("更新对话默认超时失败: %v", err)
 	}
@@ -75,7 +75,7 @@ func InitDB(dbPath string) {
 
 func defaultTimeoutForProvider(providerName string) time.Duration {
 	switch providerName {
-	case "gemini", "openai":
+	case "gemini", "openai", "openai-image":
 		return 500 * time.Second
 	default:
 		return 150 * time.Second

diff --git a/backend/internal/provider/gemini.go b/backend/internal/provider/gemini.go
@@ -94,7 +94,7 @@ func NewGeminiProvider(config *model.ProviderConfig) (*GeminiProvider, error) {
 func (p *GeminiProvider) newHTTPClient() *http.Client {
 	return &http.Client{
 		Transport: &http.Transport{
-			ForceAttemptHTTP2:   false,
+			ForceAttemptHTTP2: false,
 			TLSClientConfig: &tls.Config{
 				InsecureSkipVerify: false,
 				MinVersion:         tls.VersionTLS12,

diff --git a/backend/internal/provider/model_resolver.go b/backend/internal/provider/model_resolver.go
@@ -87,5 +87,11 @@ func defaultModelForProvider(providerName string, purpose ModelPurpose) string {
 	if purpose == PurposeChat || name == "openai-chat" {
 		return "gemini-3-flash-preview"
 	}
+	if name == "openai-image" {
+		return "gpt-image-1"
+	}
+	if name == "openai" {
+		return "gemini-3-pro-image-preview"
+	}
 	return "gemini-3-pro-image-preview"
 }
diff --git a/backend/internal/provider/openai_image.go b/backend/internal/provider/openai_image.go
@@ -0,0 +1,233 @@
+package provider
+
+import (
+	"bytes"
+	"context"
+	"encoding/json"
+	"fmt"
+	"image-gen-service/internal/diagnostic"
+	"image-gen-service/internal/model"
+	"io"
+	"net/http"
+	"strings"
+	"time"
+)
+
+type OpenAIImageProvider struct {
+	*OpenAIProvider
+}
+
+type openAIImagesGenerationRequest struct {
+	Model   string `json:"model"`
+	Prompt  string `json:"prompt"`
+	Size    string `json:"size"`
+	Quality string `json:"quality,omitempty"`
+	N       int    `json:"n,omitempty"`
+}
+
+func NewOpenAIImageProvider(config *model.ProviderConfig) (*OpenAIImageProvider, error) {
+	base, err := NewOpenAIProvider(config)
+	if err != nil {
+		return nil, err
+	}
+	return &OpenAIImageProvider{OpenAIProvider: base}, nil
+}
+
+func (p *OpenAIImageProvider) Name() string {
+	return "openai-image"
+}
+
+func (p *OpenAIImageProvider) ValidateParams(params map[string]interface{}) error {
+	prompt, _ := params["prompt"].(string)
+	if strings.TrimSpace(prompt) == "" {
+		return fmt.Errorf("prompt 不能为空")
+	}
+	if raw, ok := params["reference_images"].([]interface{}); ok && len(raw) > 0 {
+		return fmt.Errorf("OpenAI Images 当前仅支持文本生图")
+	}
+
+	count, ok := toInt(params["count"])
+	if !ok {
+		count = 1
+	}
+	if count < 1 || count > 10 {
+		return fmt.Errorf("count/n 必须介于 1 和 10 之间")
+	}
+
+	size, _ := params["size"].(string)
+	switch strings.TrimSpace(strings.ToLower(size)) {
+	case "", "auto", "1024x1024", "1024x1536", "1536x1024":
+	default:
+		return fmt.Errorf("size 仅支持 auto、1024x1024、1024x1536、1536x1024")
+	}
+
+	quality, _ := params["quality"].(string)
+	switch strings.TrimSpace(strings.ToLower(quality)) {
+	case "", "auto", "low", "medium", "high":
+	default:
+		return fmt.Errorf("quality 仅支持 auto、low、medium、high")
+	}
+
+	return nil
+}
+
+func (p *OpenAIImageProvider) Generate(ctx context.Context, params map[string]interface{}) (*ProviderResult, error) {
+	modelID := ResolveModelID(ModelResolveOptions{
+		ProviderName: p.Name(),
+		Purpose:      PurposeImage,
+		Params:       params,
+		Config:       p.config,
+	}).ID
+	if modelID == "" {
+		return nil, fmt.Errorf("缺少 model_id 参数")
+	}
+
+	reqBody, promptPreview, err := p.buildImagesGenerationRequestBody(modelID, params)
+	if err != nil {
+		return nil, err
+	}
+
+	diagnostic.Logf(params, "request_prepare",
+		"provider=%s model=%s size=%q quality=%q count=%d prompt_hash=%s prompt_preview=%q",
+		p.Name(),
+		modelID,
+		reqBody.Size,
+		reqBody.Quality,
+		reqBody.N,
+		diagnostic.PromptHash(promptPreview),
+		diagnostic.Preview(promptPreview, 160),
+	)
+
+	respBytes, headers, err := p.doImagesGenerationRequest(ctx, reqBody, params)
+	if err != nil {
+		return nil, err
+	}
+
+	images, summary, err := p.extractImages(ctx, respBytes)
+	if err != nil {
+		return nil, err
+	}
+
+	requestID := extractRequestIDFromHeaders(headers)
+	diagnostic.Logf(params, "response_summary",
+		"provider=%s model=%s data_count=%d choice_count=%d image_count=%d request_id=%s",
+		p.Name(),
+		modelID,
+		summary.DataCount,
+		summary.ChoiceCount,
+		len(images),
+		requestID,
+	)
+
+	return &ProviderResult{
+		Images: images,
+		Metadata: map[string]interface{}{
+			"provider":       p.Name(),
+			"model":          modelID,
+			"type":           "image",
+			"request_id":     requestID,
+			"oneapi_request": strings.TrimSpace(headers.Get("X-Oneapi-Request-Id")),
+		},
+	}, nil
+}
+
+func (p *OpenAIImageProvider) buildImagesGenerationRequestBody(modelID string, params map[string]interface{}) (*openAIImagesGenerationRequest, string, error) {
+	prompt, _ := params["prompt"].(string)
+	prompt = strings.TrimSpace(prompt)
+	if prompt == "" {
+		return nil, "", fmt.Errorf("缺少 prompt 参数")
+	}
+
+	body := &openAIImagesGenerationRequest{
+		Model:  modelID,
+		Prompt: prompt,
+		Size:   "auto",
+		N:      1,
+	}
+	if size, _ := params["size"].(string); strings.TrimSpace(size) != "" {
+		body.Size = strings.TrimSpace(strings.ToLower(size))
+	}
+	if quality, _ := params["quality"].(string); strings.TrimSpace(quality) != "" {
+		body.Quality = strings.TrimSpace(strings.ToLower(quality))
+	}
+	if count, ok := toInt(params["count"]); ok && count >= 1 && count <= 10 {
+		body.N = count
+	}
+
+	return body, prompt, nil
+}
+
+func (p *OpenAIImageProvider) doImagesGenerationRequest(ctx context.Context, body *openAIImagesGenerationRequest, params map[string]interface{}) ([]byte, http.Header, error) {
+	payloadBytes, err := json.Marshal(body)
+	if err != nil {
+		return nil, nil, fmt.Errorf("序列化 OpenAI Images 请求失败: %w", err)
+	}
+
+	requestURL := strings.TrimRight(strings.TrimSpace(p.apiBase), "/") + "/images/generations"
+	diagnostic.Logf(params, "request_payload",
+		"url=%s body=%q",
+		diagnostic.RedactSensitive(requestURL),
+		diagnostic.RedactSensitive(string(payloadBytes)),
+	)
+
+	maxRetries := providerMaxRetries(p.config)
+	var elapsed time.Duration
+	resp, _, err := doRequestWithRetry(ctx, params, p.Name(), maxRetries, func(attempt int) (*http.Response, error) {
+		req, buildErr := http.NewRequestWithContext(ctx, http.MethodPost, requestURL, bytes.NewReader(payloadBytes))
+		if buildErr != nil {
+			return nil, fmt.Errorf("构建 OpenAI Images 请求失败: %w", buildErr)
+		}
+
+		req.Header.Set("Content-Type", "application/json")
+		req.Header.Set("Accept", "application/json")
+		req.Header.Set("Authorization", "Bearer "+strings.TrimSpace(p.config.APIKey))
+		req.Header.Set("Connection", "close")
+		if strings.TrimSpace(p.userAgent) != "" {
+			req.Header.Set("User-Agent", p.userAgent)
+		}
+
+		startedAt := time.Now()
+		resp, doErr := p.httpClient.Do(req)
+		elapsed = time.Since(startedAt)
+		return resp, doErr
+	})
+	if err != nil {
+		return nil, nil, fmt.Errorf("doRequest: error sending request: %w", err)
+	}
+	defer resp.Body.Close()
+
+	respBody, err := io.ReadAll(resp.Body)
+	if err != nil {
+		return nil, resp.Header.Clone(), fmt.Errorf("读取 OpenAI Images 响应失败: %w", err)
+	}
+
+	requestID := extractRequestIDFromHeaders(resp.Header)
+	diagnostic.Logf(params, "response_headers",
+		"status=%s elapsed=%s request_id=%s headers=%q",
+		resp.Status,
+		elapsed,
+		requestID,
+		diagnostic.Preview(strings.Join(headerLines(resp.Header), " | "), 1000),
+	)
+	diagnostic.Logf(params, "response_body",
+		"status=%s elapsed=%s request_id=%s body=%q",
+		resp.Status,
+		elapsed,
+		requestID,
+		diagnostic.RedactSensitive(string(respBody)),
+	)
+
+	if resp.StatusCode < 200 || resp.StatusCode >= 300 {
+		bodyPreview := diagnostic.Preview(parseOpenAIError(respBody), 1200)
+		if requestID == "" {
+			requestID = diagnostic.ExtractRequestID(string(respBody))
+		}
+		return nil, resp.Header.Clone(), fmt.Errorf("OpenAI HTTP %d request_id=%s body=%s", resp.StatusCode, requestID, bodyPreview)
+	}
+
+	if len(respBody) == 0 {
+		return nil, resp.Header.Clone(), fmt.Errorf("接口未返回内容")
+	}
+
+	return respBody, resp.Header.Clone(), nil
+}
diff --git a/backend/internal/provider/provider.go b/backend/internal/provider/provider.go
@@ -30,7 +30,7 @@ var (
 
 func defaultTimeoutSeconds(providerName string) int {
 	switch providerName {
-	case "gemini", "openai":
+	case "gemini", "openai", "openai-image":
 		return 500
 	default:
 		return 150
@@ -66,7 +66,7 @@ func InitProviders() error {
 	defer initMu.Unlock()
 
 	// 0. 确保基础 Provider 至少存在于数据库中（即使没有配置文件）
-	defaultProviders := []string{"gemini", "openai"}
+	defaultProviders := []string{"gemini", "openai", "openai-image"}
 	for _, name := range defaultProviders {
 		var count int64
 		model.DB.Model(&model.ProviderConfig{}).Where("provider_name = ?", name).Count(&count)
@@ -135,6 +135,8 @@ func InitProviders() error {
 			p, err = NewGeminiProvider(&cfg)
 		case "openai":
 			p, err = NewOpenAIProvider(&cfg)
+		case "openai-image":
+			p, err = NewOpenAIImageProvider(&cfg)
 		default:
 			log.Printf("未知的 Provider 类型: %s", cfg.ProviderName)
 			continue

diff --git a/backend/internal/worker/pool.go b/backend/internal/worker/pool.go
@@ -199,19 +199,19 @@ func (wp *WorkerPool) processTask(task *Task) {
 		len([]rune(task.TaskModel.Prompt)),
 	)
 
-		if err := wp.optimizePromptForTask(ctx, task); err != nil {
-			log.Printf("任务 %s 自动优化提示词失败，终止生图: %v", task.TaskModel.TaskID, err)
-			diagnostic.Logf(task.Params, "prompt_optimize_failed",
-				"mode=%s provider=%s model=%s err=%q fallback=%t",
-				task.TaskModel.PromptOptimizeMode,
-				promptopt.ExtractProvider(task.Params),
-				promptopt.ExtractModel(task.Params),
-				err.Error(),
-				false,
-			)
-			wp.failTask(task, fmt.Errorf("提示词优化失败: %w", err))
-			return
-		}
+	if err := wp.optimizePromptForTask(ctx, task); err != nil {
+		log.Printf("任务 %s 自动优化提示词失败，终止生图: %v", task.TaskModel.TaskID, err)
+		diagnostic.Logf(task.Params, "prompt_optimize_failed",
+			"mode=%s provider=%s model=%s err=%q fallback=%t",
+			task.TaskModel.PromptOptimizeMode,
+			promptopt.ExtractProvider(task.Params),
+			promptopt.ExtractModel(task.Params),
+			err.Error(),
+			false,
+		)
+		wp.failTask(task, fmt.Errorf("提示词优化失败: %w", err))
+		return
+	}
 
 	done := make(chan generateResult, 1)
 	go func() {