教程指南

AI 图像生成 API 入门:DALL-E 3、Midjourney 和 Stable Diffusion 实战教程

AI API Playbook · · 3 分钟阅读

教程内容概述

AI 图像生成已成为现代应用的关键能力。本教程将带你集成三个最流行的图像生成 API,并提供可以直接使用的实际代码示例。

前置条件

  • Python 3.9+ 或 Node.js 18+
  • 相应服务的 API 密钥
  • REST API 基础知识

DALL-E 3 集成

如果你已经在使用 OpenAI 的 API,DALL-E 3 是最简单的集成方式。

基本图像生成

from openai import OpenAI

client = OpenAI(api_key="your-key")

response = client.images.generate(
    model="dall-e-3",
    prompt="夕阳下的未来城市天际线,赛博朋克风格,精细的建筑设计",
    size="1024x1024",
    quality="hd",
    n=1
)

image_url = response.data[0].url
print(f"生成的图像: {image_url}")

关键参数

参数选项说明
size1024x1024, 1792x1024, 1024x1792图像尺寸
qualitystandard, hd图像质量级别
stylevivid, natural生成风格

Stable Diffusion API

Stable Diffusion 提供更多的生成控制选项,且可以自托管。

使用 Stability AI 的 API

import requests
import base64

response = requests.post(
    "https://api.stability.ai/v2beta/stable-image/generate/sd3",
    headers={
        "Authorization": "Bearer your-key",
        "Accept": "image/*"
    },
    files={"none": ""},
    data={
        "prompt": "宁静的山景与清澈的湖泊",
        "output_format": "png",
        "aspect_ratio": "16:9"
    }
)

if response.status_code == 200:
    with open("output.png", "wb") as f:
        f.write(response.content)

最佳实践

1. 提示词工程

编写描述性的提示词,包含:

  • 主题:你想要生成的内容
  • 风格:艺术风格或美学
  • 细节:灯光、颜色、构图
  • 质量修饰词:“detailed”、“high quality”、“professional”

2. 错误处理

import time

def generate_with_retry(prompt, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = client.images.generate(
                model="dall-e-3",
                prompt=prompt,
                size="1024x1024"
            )
            return response.data[0].url
        except Exception as e:
            if attempt < max_retries - 1:
                time.sleep(2 ** attempt)
            else:
                raise e

3. 成本优化

  • 缓存已生成的图像,避免重复生成
  • 预览时使用较低质量设置
  • 尽可能批量处理请求

价格对比

服务分辨率每张图价格
DALL-E 3 HD1024x1024$0.080
DALL-E 3 Standard1024x1024$0.040
Stable Diffusion 31024x1024$0.065
Midjourney1024x1024~$0.01-0.02(订阅制)

通过 AtlasCloud 使用多个 API

无需管理多个 API 密钥和集成方案,你可以通过 AtlasCloud 统一平台 访问所有主流图像生成 API。在不同模型间对比结果,优化你的图像生成管线。

总结

每个图像生成 API 都有其优势。DALL-E 3 在提示词跟随方面表现出色,Stable Diffusion 提供最大的灵活性,Midjourney 则能生成最具美感的结果。根据你的具体需求进行选择,或者通过 AtlasCloud 等聚合平台同时使用三者。

在 AtlasCloud 上试用此 API

AtlasCloud

常见问题

哪个 AI 图像生成 API 最便宜?

Midjourney 通过订阅制提供最低的单张图像成本,约 $0.01-0.02 每张。按使用量付费的方案中,DALL-E 3 Standard 以每张 $0.040 成为最实惠的选择。

可以自己部署 AI 图像生成模型吗?

可以,Stable Diffusion 是完全开源的,可以在你自己的 GPU 服务器上自托管部署。这样可以省去按张计费的 API 费用,但需要自行管理基础设施。DALL-E 3 和 Midjourney 仅以云端 API 形式提供。

DALL-E 3 支持哪些图片尺寸?

DALL-E 3 支持三种尺寸:1024x1024(正方形)、1792x1024(横版)和 1024x1792(竖版)。所有尺寸均支持 standard 和 hd 两种质量模式。

标签

图像生成 DALL-E 3 Stable Diffusion API 教程 AI 绘画

相关文章