AI 驱动的学术论文配图生成工具(个人本地版)。上传论文 → AI 分析内容生成 Prompt → 一键生成高质量科研配图。
一句话:把"写完论文还要画图"的痛点,变成「上传 → 确认 → 下载」三步流程。
以下均为本平台实际生成的学术配图示例:
PMST 预测网络架构图 |
时频域信号处理流程图 |
深度学习模块详解图 |
带标注的解剖结构图 |
| 功能 | 说明 |
|---|---|
| 🤖 智能 Prompt 生成 | 上传 PDF/DOCX/TXT 论文,Claude AI 自动分析内容并生成配图描述 |
| 🖼️ 高质量配图 | 支持 1K/2K/4K 多分辨率,16:9/4:3/1:1 等多种比例 |
| 🎨 配色方案 | 50+ 预设学术配色(含色盲友好方案),支持自定义配色 |
| ✏️ 图生图编辑 | 基于已有图片 + 文字指令进行二次编辑 |
| ⚡ 实时状态 | SSE 流式推送生成进度,无需手动刷新 |
| 📁 项目管理 | 按项目组织论文、Prompt 和配图 |
| 层级 | 技术 |
|---|---|
| 后端 | FastAPI · SQLAlchemy (Async) · Python 3.12+ |
| 前端 | React 19 · TypeScript · Vite · Tailwind CSS · Radix UI |
| 数据库 | SQLite (自动创建,零配置) |
| 存储 | 本地文件系统 (backend/data/) |
| AI (Prompt) | Claude Agent SDK (claude-agent-sdk) |
| AI (配图) | NanoBanana / Gemini API |
academic-figure-generator/
├── backend/ # FastAPI 后端
│ ├── app/
│ │ ├── api/v1/ # API 路由 (projects, documents, prompts, images, color_schemes)
│ │ ├── models/ # SQLAlchemy ORM 模型 (SQLite)
│ │ ├── schemas/ # Pydantic 请求/响应 Schema
│ │ ├── services/ # 业务逻辑层
│ │ │ ├── claude_code_service.py # Claude Agent SDK 集成
│ │ │ ├── local_storage_service.py # 本地文件存储
│ │ │ ├── image_service.py # NanoBanana 图片生成
│ │ │ ├── document_service.py # PDF/DOCX/TXT 解析
│ │ │ └── prompt_service.py # Prompt CRUD
│ │ ├── core/ # 中间件、异常处理、Prompt 模板/配色
│ │ ├── config.py # 环境变量配置
│ │ └── main.py # FastAPI 应用工厂
│ ├── data/ # 运行时数据 (SQLite DB, 上传文件, 生成图片)
│ └── pyproject.toml
├── frontend/ # React SPA 前端
│ ├── src/
│ │ ├── pages/ # 页面组件 (Projects, ProjectWorkspace, Generate, ColorSchemes, Settings)
│ │ ├── components/ui/ # Radix UI 组件库
│ │ ├── store/ # Zustand 状态管理
│ │ └── lib/ # API 客户端
│ ├── package.json
│ └── vite.config.ts
├── academic-figure-prompt/ # AI Coding Agent Skill (SKILL.md)
├── .env # 环境变量
└── README.md
- Python 3.12+
- Node.js 18+
- Claude Agent SDK:本机已安装 Claude Code CLI 并登录
- API Key:NanoBanana / Gemini 图片生成 API Key
git clone https://github.com/LigphiDonk/academic-figure-generator.git
cd academic-figure-generator编辑项目根目录的 .env 文件:
# Claude Agent SDK (用于 Prompt 生成)
ANTHROPIC_API_KEY=your-anthropic-api-key
# NanoBanana / Gemini API (用于图片生成)
NANOBANANA_API_KEY=your-nanobanana-api-key
NANOBANANA_API_BASE=https://api.keepgo.icu
NANOBANANA_MODEL=gemini-3-pro-image-previewcd backend
# 创建虚拟环境 (推荐)
python -m venv .venv
source .venv/bin/activate # macOS/Linux
# 安装依赖
pip install -e .
# 启动开发服务器
uvicorn app.main:app --host 0.0.0.0 --port 8000 --reload首次启动时会自动创建 SQLite 数据库 (backend/data/app.db) 和数据目录。
cd frontend
npm install
npm run dev| 服务 | 地址 |
|---|---|
| 应用首页 | http://localhost:5173 |
| API 文档 (Swagger) | http://localhost:8000/docs |
上传论文 (PDF/DOCX/TXT)
│
▼
后端解析 → 提取文本和章节结构
│
▼
Claude Agent SDK → 分析论文 → 生成配图 Prompt
│
▼
确认/编辑 Prompt → 选择分辨率和比例
│
▼
NanoBanana API → 生成高质量配图
│
▼
下载图片 / 图生图编辑
除了项目工作流,还支持快捷生成模式:直接输入 Prompt 文本,跳过论文上传步骤,快速生成配图。
浏览器 (React SPA)
│
▼
FastAPI 后端 (localhost:8000)
│
├── SQLite (项目、文档、Prompt、图片元数据)
├── 本地文件系统 (上传文件、生成图片)
│
├── Claude Agent SDK → Prompt 生成 (同步)
└── NanoBanana API → 图片生成 (异步后台任务)
| 变量 | 必填 | 默认值 | 说明 |
|---|---|---|---|
ANTHROPIC_API_KEY |
是 | — | Claude Agent SDK API Key |
NANOBANANA_API_KEY |
是 | — | NanoBanana / Gemini API Key |
NANOBANANA_API_BASE |
否 | https://api.keepgo.icu |
NanoBanana API 地址 |
NANOBANANA_MODEL |
否 | gemini-3-pro-image-preview |
图片生成模型 |
DATABASE_PATH |
否 | ./data/app.db |
SQLite 数据库路径 |
DATA_DIR |
否 | ./data |
数据存储目录 |
DEBUG |
否 | true |
调试模式 (启用 API 文档) |
CORS_ORIGINS |
否 | ["http://localhost:3000","http://localhost:5173"] |
CORS 允许来源 |
MAX_UPLOAD_SIZE_MB |
否 | 50 |
最大上传文件大小 (MB) |
本项目附带了一个独立的 AI Coding Agent Skill——academic-figure-prompt,兼容多种 AI 编程助手(Claude Code / Gemini CLI / Cursor 等),无需部署完整平台即可获得顶会级学术论文配图提示词生成能力。
academic-figure-prompt 是一个专为学术论文设计的 AI 提示词生成器,能够:
- 📄 阅读并分析论文内容(PDF / LaTeX / Word)
- 🎨 提供 8 种预设学术配色方案(Okabe-Ito、Blue 单色系、Teal+Amber 等),含色盲友好选项
- 🖼️ 生成极其详细的英文提示词,用于 AI 图片工具生成顶会级别的专业配图
- 📐 覆盖多种图表类型:框架图、网络架构图、模块详解图、对比/消融图、数据模板图
npx skills add LigphiDonk/academic-figure-generatorgit clone https://github.com/LigphiDonk/academic-figure-generator.git
# Gemini CLI
cp -r academic-figure-generator/academic-figure-prompt .gemini/skills/
# Claude Code
cp -r academic-figure-generator/academic-figure-prompt .claude/skills/安装后,在 AI 编程助手对话中直接触发即可:
You: 帮我看一下这篇论文,生成论文配图提示词
AI: [分析论文内容 → 展示配色方案选择 → 生成详细英文提示词]
You: 用 Teal+Amber 配色,帮我画一个网络架构图的提示词
AI: [直接使用方案C生成网络架构图提示词]
cd backend
source .venv/bin/activate
# 运行测试
pytest -v
# 代码检查
ruff check app/
ruff format app/cd frontend
npm run dev # 启动开发服务器 (localhost:5173)
npm run build # 生产构建
npm run lint # ESLint 检查前端开发服务器会自动将 /api 请求代理到 localhost:8000。
感谢 Linux DO 社区的支持与帮助 🙏
本项目基于 MIT License 开源。




