home / skills / openclaw / skills / image-prompt-generator
image-prompt-generator skill

safe
/skills/349840432m-dev/image-prompt-generator
npx playbooks add skill openclaw/skills --skill image-prompt-generator
Review the files below or copy the command above to add this skill to your agents.
Files (6)
SKILL.md
6.0 KB
---
name: image-prompt-generator
description: 基于五层拆解法的AI图片提示词生成器。将模糊的创意想法转化为结构严谨、可执行的图像生成规格书，支持多种风格预设和目标工具适配。
version: 2.0.0
license: MIT
acceptLicenseTerms: true
metadata:
  clawdbot:
    emoji: "✏️"
    files: ["app/*"]
---

# Image Prompt Generator - 图片提示词生成器

基于"五层拆解法"，将创意想法转化为专业的 AI 图像生成规格书，并输出可直接使用的多工具提示词。

## 核心功能

### 五层拆解法（画面先行）
0. **画面介绍** → 用自然语言概括画面主题、场景、主体
1. **整体基调** → 风格、氛围
2. **质感材质** → 介质感、工艺、肌理
3. **笔触细节** → 线条、色彩分布逻辑
4. **构图规则** → 版式、布局、视觉动线
5. **文字系统**（按需） → 仅在画面含文字时输出

### 目标工具适配
- **Midjourney** — 结构化关键词 + 参数（--ar, --s, --v 等）
- **DALL-E** — 纯自然语言描述
- **Stable Diffusion** — 正向/反向提示词分离

### 风格预设
- 🖍️ 童趣涂鸦 - 儿童手绘涂鸦风格，彩色铅笔质感
- 📐 极简现代 - 极简主义，现代设计感，大量留白
- 🎞️ 复古胶片 - 复古胶片风格，1970s色调，颗粒感
- 🌸 日系插画 - 日系小清新插画，柔和色彩，扁平风
- ⚙️ 赛博朋克 - 赛博朋克风格，霓虹色彩，科技感
- 📚 学术信息图 - 专业信息图，学术风格，数据可视化

## 使用方法

### 方式1：快速生成
```
用户: 生成图片提示词：一张介绍深度学习的信息图，面向初学者
系统: 基于五层拆解法生成完整的提示词规格书
```

### 方式2：选择风格预设
```
用户: 用童趣涂鸦风格生成：一只可爱的小猫在看书
系统: 生成带有彩色铅笔质感的儿童风格提示词
```

### 方式3：自定义详细描述
```
用户: 生成提示词：[详细描述需求]
系统: 根据描述智能分析并生成五层规格书
```

## 输出格式

生成的提示词包含以下模块：

```markdown
# 🎨 图片提示词

## 画面介绍
[2-3句自然语言描述画面整体]

## 整体基调
- 风格：[具体风格]
- 氛围：[情绪词]

## 质感材质
- 介质感：[描述]

## 笔触细节
- 线条：[特征]
- 色彩：[主色调、辅助色、点缀色]

## 构图规则
- 版式：[比例]
- 布局：[分布逻辑、视觉动线]

## 文字系统（仅在画面含文字时输出）
- 字体感：[风格]
- 层级：[视觉差异]

## 参照物
- 风格参照：[具体参照 + 参照理由]
- 反向排除：[不想要的风格]

---

## 💡 可执行提示词

**通用中文提示词：**
[完整中文描述，适用于国产AI绘图工具]

**Midjourney：**
[结构化英文关键词 + 参数]

**DALL-E：**
[纯自然语言英文描述]

**Stable Diffusion：**
prompt: [正向提示词]
negative prompt: [反向提示词]
```

## 技术实现

### 前端界面
- React 单页应用
- 支持风格预设快速选择
- 目标生成工具选择（Midjourney / DALL-E / SD / 全部）
- 实时字数统计
- Markdown 渲染结果
- 一键复制功能

### AI 模型
- 通过 OpenClaw Gateway 本地端点调用（`/v1/chat/completions`）
- 使用 OpenClaw 配置的默认模型，无需额外配置 API 密钥
- SYSTEM_PROMPT 包含完整的五层拆解法方法论
- 自动将模糊需求转化为具体视觉规格

## 触发指令

| 指令 | 说明 |
|------|------|
| `生成图片提示词` | 基础触发指令 |
| `图片提示词` | 简写形式 |
| `生成提示词` | 通用形式 |
| `用[风格]风格生成` | 带风格预设 |

## 文件位置

- **技能目录**: `skills/image-prompt-generator/`
- **前端代码**: `skills/image-prompt-generator/app/`
- **入口文件**: `skills/image-prompt-generator/app/App.jsx`

## 使用示例

**示例 1：信息图**
```
输入：一张介绍「光合作用原理」的信息图，面向中学生，风格清新易懂
输出：五层拆解法生成的完整提示词，包含日系插画风格、柔和色彩、扁平化设计等
```

**示例 2：插画**
```
输入：用赛博朋克风格生成：未来城市的夜景
输出：霓虹色彩、科技感、暗黑背景的详细规格书
```

**示例 3：儿童内容**
```
输入：用童趣涂鸦风格生成：小动物们在森林里开派对
输出：彩色铅笔质感、活泼热闹、手绘风格的提示词
```

## 注意事项

1. **描述越详细，生成越精准** - 提供目标受众、使用场景、情绪基调等信息
2. **善用风格预设** - 快速锁定整体方向，再微调细节
3. **选择目标工具** - 不同工具的提示词语法差异很大，选对工具获得最佳结果
4. **参照物很重要** - 可以提供喜欢的风格参考或不想要的风格排除

## 可执行提示词使用

生成结果中的"可执行提示词"根据目标工具输出对应格式：
- **Midjourney** — 直接复制到 /imagine 命令
- **DALL-E** — 直接粘贴到 ChatGPT 或 DALL-E API
- **Stable Diffusion** — 分别复制 prompt 和 negative prompt

## External Endpoints

| 端点 | 说明 | 发送的数据 |
|------|------|-----------|
| `http://127.0.0.1:18789/v1/chat/completions` | OpenClaw Gateway 本地端点 | 用户输入的图片描述需求 + 系统提示词 |

所有请求仅发往本地 OpenClaw Gateway，不直接连接任何外部 API。实际的模型调用由 Gateway 根据你的 `openclaw.json` 配置路由。

## Security & Privacy

- 所有 AI 模型调用通过本地 OpenClaw Gateway 中转，不直接暴露 API 密钥
- 用户输入的图片描述会作为 prompt 发送给 Gateway 配置的模型
- 不存储任何用户数据，所有处理在本地完成
- 无持久化操作，无文件写入，无后台进程

## Trust Statement

本技能通过 OpenClaw Gateway 调用 AI 模型生成图片提示词。你的输入内容会发送到 Gateway 配置的模型提供商（取决于你的 `openclaw.json` 配置）。请确保你信任所配置的模型提供商后再使用。