当前位置：首页 > draw.io文章

我关掉 draw.io 的那一刻，突然觉得画图这件事，AI 真该接手了

drawio1天前draw.io文章7

我关掉 draw.io 的那一刻，突然觉得画图这件事，AI 真该接手了

昨晚十一点，我打开 draw.io，开始拖第一个矩形。

拖到一半，产品经理发来消息："那个架构图能不能改一下，把认证服务单独拆出来？"

我看着那个还没画完的图，默默关掉了 draw.io。

可能你也懂这种感觉。不是不会画，是画图这件事本身就挺反人类的。你明明脑子里逻辑清晰，但非得被拖拽、对齐、调颜色、挪位置这些事情打断，等你把所有节点摆好，思路早不知道飞哪儿去了。

从手动拖拽到 AI 生成的转变，有那么难吗？

然后今天早上，我刷到了 GitHub trending。

draw.io 官方发了一个开源项目，叫 drawio-mcp。3200 多个 Star，官方团队自己维护的，不是第三方野路子。

我当时的反应是——卧槽，draw.io 终于想通了？

画图的痛，画过的人都懂

先说一句，draw.io 这个工具本身没什么问题。免费开源，功能齐全，据说是 99% 的财富 500 强公司都在用。不用登录，不用付费，导出不加水印，文件格式是开放的 XML，放十年都能打开。

说它是绘图工具里的瑞士军刀，不为过。

但这个工具再好，也解决不了一个根本问题——画图这件事，本质上是个体力活。

你想画一个时序图，得先拖出几个对象，然后一条一条连线，每条线还得标注调用关系。画完发现布局不对，又得调整位置。产品经理说逻辑要改，你可能整个图都得重新排版。

我之前帮一个创业公司做技术文档，光是一个业务流程图就改了七个版本。每改一次都得重新调整节点位置、连线走向、标注文字。前后花了三个多小时，真正花在"想清楚业务逻辑"上的时间可能不到二十分钟。

这种经历，我估计屏幕前的你也不陌生。

画图占用的不只是时间，还有注意力。你本来在思考业务逻辑，结果被拖拽、对齐、调色这些操作打断，思路就断了。等你好不容易把图画完，刚才想到的那个绝妙的设计思路可能早就忘了一半。

所以当我知道 draw.io 官方出了个 AI 工具的时候，我第一反应是——这东西早就该有了。

MCP 协议：让 AI 从"参谋"变成"助理"

drawio-mcp 这个项目，核心靠的是 MCP 协议。

MCP 全称 Model Context Protocol，是 Anthropic 推出的一套标准，定义了 AI 模型怎么调用外部工具。翻译成人话就是，给 AI 接了一套接口，让它能操作真实的工具。

这句话听起来好像没什么，但它的含义非常深。

以前的 AI 能干什么？生成文字。生成图片。生成代码。它给你一个结果，你自己去用。AI 是个"参谋"，不是"执行者"。

MCP 协议出现之后，AI 开始能调用工具了。它可以帮你发邮件、管理日历、操作数据库、现在还能帮你画图。AI 从"给你建议"变成了"帮你做事"。

这是一个质的飞跃。

你想啊，以前你让 AI 帮你画个图，它给你描述一下："你可以在 draw.io 里创建一个矩形，然后拖一条线连过去，标注上 API Gateway……"

你听完还是得自己动手。

现在不一样了。现在你跟 AI 说"画个微服务架构图"，它直接给你生成 draw.io 的 XML 文件，打开就能编辑。图准不准、布局好不好，AI 一次性搞定，你只需要微调细节。

这就不是参谋了，这是给你配了一个不用发工资的助理。

drawio-mcp 就是在这个框架下诞生的。它让 Claude 这类 AI 能直接调用 draw.io 的能力，生成可编辑的图表文件。整个流程变成了——你说话，AI 画图，你改细节。

省掉的那一步"自己动手拖拽"，听起来不多，但体验过就知道，完全是两种东西。

四种玩法，我推荐第三种

drawio-mcp 提供了四种接入方式，各有各的适用场景。我测试了一圈，发现这个项目在兼容性上是真的下了功夫的。

方式一：聊天窗口直接渲染

这种方式用的是 MCP Apps 协议，图表能直接显示在聊天界面里，不用跳转网址。官方提供了一个托管地址，配置到 Claude.ai 的远程 MCP 服务器里就行，不需要安装任何东西。

它提供两个核心工具：create_diagram，传入 draw.io XML，直接渲染成图表，支持缩放、平移、图层切换，还有一个"在 draw.io 中打开"的按钮，方便你后续继续编辑。search_shapes，搜索 draw.io 内置的 10000+ 个形状，覆盖 AWS、Azure、GCP、Kubernetes、UML、BPMN 等各类图形库。

用起来很简单，你直接在 Claude 里说："帮我画个用户注册流程图，包括邮箱验证和手机验证两个分支。"然后图就出来了。

说实话我当时试的时候还有点不敢相信——就这么一句话，图就出来了？结果还真是。

方式二：浏览器打开编辑器

这是最早发布的版本，已经发布到了 npm，一行命令就能启动：

npx @drawio/mcp

生成图表后，会在浏览器里自动打开 draw.io 编辑器。支持 XML、CSV、Mermaid.js 三种格式，还有灯箱模式和深色模式。

比如你在 Claude Desktop 里说："画个微服务架构图，包括 API Gateway、三个服务、Redis 缓存和 MySQL 数据库。"Claude 生成完之后，浏览器直接弹出 draw.io 编辑器，你可以在里面直接调整细节。

这种适合用 Claude Desktop 或者其他本地 MCP 客户端的人。

方式三：Claude Code Skill（我推荐这个）

如果你日常在写代码，顺便要画个图，这种方式是最顺滑的。它不需要单独运行 MCP 服务器，只需要复制一个技能文件到本地就行。

全局安装：

mkdir -p ~/.claude/skills/drawio
cp drawio/SKILL.md ~/.claude/skills/drawio/SKILL.md

装好之后，在 Claude Code 里直接用 /drawio 命令就能画图：

/drawio create a flowchart for user login
/drawio sequence diagram for API auth
/drawio png class diagram for the models in src/

Claude Code 会生成 draw.io 的原生 XML，写到 .drawio 文件里，然后自动打开。不依赖任何外部服务，也没有网络请求，纯本地运行。

我自己用的是这种方式。原因很简单——我日常就是在 Claude Code 里写代码的，现在画图不需要切换工具，直接一个命令搞定，效率提升非常明显。

改图也很方便。你说"/drawio add phone verification branch"，AI 直接更新文件，再打开的时候图就变了。产品经理让你改七版，每版五分钟搞定，剩下的时间你可以喝杯咖啡。

方式四：零安装的 Project Instructions

如果你是临时需要，不想折腾安装，也有办法。只要把一段预设说明粘贴到 Claude.ai 的项目指令里，Claude 就会按照规范生成 draw.io 的 URL，直接能用。

适合临时使用、不想折腾安装的场景。

一个细节，让 AI 生成的图真正能用

我测试了好几种 AI 画图工具，发现一个问题——AI 画出来的图，图标经常是不对的。

比如你说"AWS Lambda"，AI 可能给你画个普通方块，配色也不对。你说"Kubernetes Pod"，它可能给你画个圆形。你说"S3 存储桶"，出来的可能就是个文件夹图标。

这种图，你敢给客户看吗？给你老板看？

drawio-mcp 解决这个问题的方案挺聪明的。它内置了 search_shapes 工具，可以搜索 draw.io 官方的 10400+ 个图形，包括 AWS、Azure、GCP、Kubernetes、UML、BPMN、网络拓扑、电气图等等。

AI 生成图表的时候，如果你提到这些专业图标，它会先调用 search_shapes 找到对应的图标样式，然后生成带正确图标的 XML。你拿到的图，图标是对的，不需要自己再去改。

举个例子，你说"画个 AWS 架构图，包括 Lambda、API Gateway、DynamoDB 和 S3"。AI 会先搜索这些服务的官方图标，然后用正确的图标生成架构图。

不会出现 Lambda 被画成普通方块、S3 被画成文件夹这种情况。

这个设计让 AI 生成的图从"能用"变成了"能看"。专业度这块，拿出来汇报不丢人。

导出的文件，还能继续编辑

还有一个细节我觉得值得单独说一下——drawio-mcp 导出的 PNG、SVG、PDF 文件里，都内嵌了原始的 XML 数据。

也就是说，哪怕你导出的是一张图片，把这个图片拖回 draw.io，依然可以继续编辑所有元素。线条、节点、文字、布局，完整保留。

这个设计太重要了。

以前用其他 AI 画图工具，导出是什么就是什么，想要修改？对不起，重新生成。drawio-mcp 相当于给你留了个后悔药。AI 生成之后你觉得某个地方不太对，改就是了，不需要重新让 AI 跑一遍。

你还可以先让 AI 生成一个基础版本，然后自己在 draw.io 里微调。AI 负责 80% 的框架工作，你负责 20% 的精细调整。

这个分工比例，才是最高效的。

这件事背后的意义，比工具本身更大

说了这么多功能层面的东西，我想聊点更深的东西。

drawio-mcp 这件事，不只是一个 AI 画图工具的诞生。它代表了一个更大的趋势——AI 正在从"对话界面"迁移到"操作界面"。

什么叫对话界面？就是你现在跟 AI 交互的主要方式——你说话，它回答。你问，它答。你让它写文章，它给你一篇文章。你让它写代码，它给你一段代码。结果都是"文本"，你拿着文本自己去用。

什么叫操作界面？就是你告诉 AI 一个目标，AI 直接帮你做完一件事。画图、发邮件、管日历、调工具——AI 直接操作真实世界里的工具，把结果放到你手里，你只需要审核和微调。

MCP 协议就是干这个的。它定义了 AI 怎么调用工具的接口标准。有了这套标准，任何工具都可以被 AI 操作，不只是 draw.io，不只是 Claude，未来会有越来越多的工具接入 MCP，形成一个 AI 操作工具的生态系统。

这个趋势用一个类比可能会更清晰。

早期的计算机，需要专业人士用命令行操作。后来图形界面（GUI）出现，普通人也能用电脑了。计算机的受众从"专业人士"扩展到了"所有人"。

AI 现在的阶段，有点像早期的命令行——普通人不知道怎么跟 AI 高效交互，得学习 Prompt 技巧、得理解 AI 的能力边界、得自己把 AI 的输出落地到具体场景。

MCP 协议的出现，相当于 AI 领域的"图形界面时刻"。你不需要学习怎么跟 AI 说话，你只需要说"帮我画个图"，AI 直接帮你做了。门槛大幅降低，受众大幅扩展。

drawio-mcp 可能只是这个大趋势里的一个小例子。但小例子往往最能说明问题。

说真的，这几年我用过不少 AI 工具。有些确实能提效，有些就是噱头。drawio-mcp 这个东西，我觉得是那种真正能进日常流水线的。

不是什么颠覆性的大变革，就是把"拖拽画图"这个琐碎的体力活接走了。你原来得花半小时搞的事情，现在五分钟搞定，剩下的时间去想真正重要的事。

这就够了。

有时候，最好的技术进步不是让你"哇"一声，而是让你用着用着就回不去了，根本不想再碰以前那套落后的方式。

drawio-mcp，就是这种。

项目地址： https://github.com/jgraph/drawio-mcp

好了，聊到这儿。

你有没有发现过自己每天在用、但不知道背后是什么的工具？

我关掉 draw.io 的那一刻，突然觉得画图这件事，AI 真该接手了

我关掉 draw.io 的那一刻，突然觉得画图这件事，AI 真该接手了

画图的痛，画过的人都懂

MCP 协议：让 AI 从"参谋"变成"助理"

四种玩法，我推荐第三种

一个细节，让 AI 生成的图真正能用

导出的文件，还能继续编辑

这件事背后的意义，比工具本身更大

Copyright Drawio.com.cn Some Rights Reserved.

Powered By Z-BlogPHP. Theme by TOYEAN.