💡 SciDraw AI 优势:模板驱动 → SVG 矢量导出 → PPT/AI 自由编辑,无水印。立即试用 →
你在 Gemini 里反复调了 20 遍 prompt,生成的细胞图标签还是把 "Mitochondria" 拼成了 "Mitochodria"。
你换了另一条 prompt,这次拼对了,但配色又变成了卡通糖果色。再试一次,标签消失了。再试,出现了一个 "AI generated" 的角标。
这不是你的问题。Gemini 2.5 Flash Image(社区昵称 Nano Banana)作为通用图像模型,在科学术语的文字渲染上有天然短板,而且对"科研图"这个使用场景没有内置的约束。它要的是好画手的描述能力,你给它什么,它还你什么。
这篇文章要讲两件事:
- 我们团队在过去 3 个月里测试了 200+ 条 Gemini Nano Banana 的科研绘图 prompt,总结出 5 条复现率 > 85% 的实战心得
- 即使把这 5 条都用上,Gemini 仍然有两堵墙过不去——什么时候你应该放下 prompt,换一种思路
❌ 先避坑:3 个最容易翻车的错误
在讲心得之前,先把最容易踩的雷扫一遍。这 3 个错误占了我们测试中失败案例的 60% 以上。
1. 没指定画幅比例 默认情况下 Gemini 出的图常常是接近正方形,但 Nature、Science、Cell 等期刊的图组面板基本都是横版(16:9 或 4:3),封面是竖版(3:4)。一张方图扔进期刊模板里,要么裁掉关键内容,要么留出大片空白。
2. 标签用中文 中文期刊也要求图内文字使用英文术语。Gemini 渲染中文字符的稳定性远低于英文,而且即使渲染对了,投稿时也得重画。从一开始就用英文写 prompt 里的标签内容,可以省掉一轮返工。
3. 没显式禁用水印和签名
Gemini 的训练数据里有大量带水印、带艺术家签名的插画。如果你不在 prompt 里明确写 no watermark, no signature, no text overlay,有 30% 左右的概率会出现一个角落角标,投稿时这是直接被退回的。
避完这 3 个坑,我们再来谈怎么把 prompt 写好。
✅ Gemini Nano Banana 科研绘图 5 条 prompt 心得
每一条都经过我们团队的批量实测,给出为什么、烂 prompt 长什么样、好 prompt 怎么写、以及一张实际输出。
心得 1:画幅 + 尺寸,放在 prompt 最前面
为什么重要 画幅决定了一张图能不能直接用进期刊版面。Gemini 对画幅的解析能力比对画面内容的理解力弱,所以画幅这个信息要尽量靠前,给模型更强的约束。
❌ 烂 prompt:
A diagram showing the structure of a eukaryotic cell with labels.✅ 好 prompt:
16:9 landscape scientific illustration, eukaryotic cell cross-section,
journal figure layout, fills entire frame, no empty borders.
[... 后续具体内容 ...]
关键要点: 横版图组用 4:3 或 16:9,封面用 3:4 或 9:16,目录图(TOC)用 1:1。把比例写在 prompt 第一句。
心得 2:用引号锁定关键术语,防止拼写错
为什么重要 这是开头那个痛点的根源。Gemini 在生成长单词时(尤其是 Mitochondria、Endoplasmic Reticulum、Phosphofructokinase 这种),会出现字母吞掉、字母重复、字母替换的情况。我们实测同一条 prompt 跑 10 次,长术语的拼写正确率只有 40-60%。
解决方法: 用引号把每一个标签明确括起来,告诉 Gemini "这串字符必须原样出现"。这个简单技巧能把拼写正确率提升到 85% 以上。
❌ 烂 prompt:
Cell diagram with labels for mitochondria, endoplasmic reticulum and golgi apparatus.✅ 好 prompt:
Cell diagram with labels: "Mitochondria", "Endoplasmic Reticulum",
"Golgi Apparatus", "Nucleus", "Ribosome". Each label in quotes
must appear exactly as written, sans-serif font, 12pt.
关键要点: 引号 + "must appear exactly as written" 的双重约束,是目前对抗 Gemini 文字渲染翻车最有效的手段。希腊字母(α、β、γ)和化学式(H₂O、CO₂)同样适用。
心得 3:用英文专业术语 + 标准缩写
为什么重要 "a protein"、"some cells"、"a molecule" 这种笼统说法会被 Gemini 解释成卡通元素。你得告诉它具体是什么——而且要用科研社区认可的术语和缩写。这一条决定了你的图是"看起来像科普"还是"看起来像可发表"。
❌ 烂 prompt:
Show a protein binding to DNA with some chemicals around.✅ 好 prompt:
Cryo-EM style illustration of "p53 transcription factor" (53 kDa)
binding to "DNA double helix" at consensus site "5'-RRRCWWGYYY-3'",
zinc ions "Zn²⁺" coordinated, scale bar "5 nm", temperature "4°C".
关键要点: 凡是有具体名称的就用名称,凡是有标准单位的就带单位(kDa、μm、mM、°C、nm)。这是把 Gemini 从"通用插图工具"切换到"科研绘图工具"的关键一步。
心得 4:明确学术风格定位
为什么重要 不指定风格,Gemini 会从训练数据里随机抽一种——有时候是教科书插图,有时候是儿童绘本,有时候是 3D 渲染,有时候是赛博朋克。同一组 prompt 跑 5 次,你能拿到 5 种完全不同的画风。这对系列图来说是灾难。
怎么写: 在 prompt 前段直接锁定风格名词,可选的高质量"风格锚点"包括:
Nature journal figure style(顶刊期刊插图)biology textbook illustration, flat color(教科书扁平风)scientific schematic, isometric view(等距示意图)BioRender style, clean vector look(BioRender 风)
❌ 烂 prompt:
Show the process of CRISPR gene editing in a cell.✅ 好 prompt:
Nature journal figure style, flat vector illustration of "CRISPR-Cas9"
gene editing mechanism, clean white background, professional sans-serif labels,
4-step horizontal flow, muted scientific color palette (blue, gray, orange).
关键要点: 风格名词 + 配色提示 + 背景颜色,三件套放在 prompt 前段。这是让一组图保持视觉一致的基础。
心得 5:显式禁用水印、签名、卡通元素
为什么重要 Gemini 训练集里掺杂了大量带水印的图库素材、带签名的艺术家作品、以及各种卡通插画。如果你不主动告诉它"不要这些",大概率会出现以下任意一种:角标水印、艺术家签名、Q 版人物、糖果色背景、表情符号。
任何一种,在期刊审稿人眼里都意味着"这不是一张严肃的科研图"。
❌ 烂 prompt:
[正常的科研图描述]✅ 好 prompt:
[正常的科研图描述]
Strict requirements: no watermark, no signature, no text overlay,
no cartoon characters, no emoji, no decorative elements,
white background only, professional scientific publication quality.
关键要点: 把这段"禁用清单"做成你自己的 prompt 模板尾巴,每次粘贴到末尾。复用率 100%,避坑效果最直接。
Gemini Nano Banana 的两堵墙
把上面 5 条都用上之后,你能拿到一张拼写基本正确、风格统一、无水印、能进期刊版面的图。但还有两件事 Gemini 仍然做不到——这不是 prompt 能解决的,是模型本身的边界。
墙 1:同一条 prompt 跑多次,结果差异巨大
我们做过一个实测:把同一条机制图 prompt 在 Gemini Nano Banana 上跑了 10 次,结果是——10 张构图、配色、标签位置、视角全部不同的图。
对单张图来说这不是问题,你挑一张最好的就行。但对系列图来说这是灾难。
一篇论文的 Figure 1 到 Figure 6,如果配色不统一、视角不统一、字号不统一,审稿人第一眼就会觉得"这套图看起来很乱"。Gemini 的随机性意味着你没办法靠 prompt 锁定一致性,只能反复抽卡——而抽卡在 deadline 面前是最贵的成本。
墙 2:输出是 PNG,不是 SVG
Gemini 给你的是一张位图。这意味着:
- 想改一个标签的拼写?重画整张
- 想把蓝色换成红色?重画整张
- 想把图导入 PPT 调整大小?边缘会糊
- 想导入 Illustrator 做最终排版?只能贴位图,不能改任何元素
- 期刊要求重投时换配色?重画整张
这堵墙比第一堵更硬,因为它不是"概率问题",是"格式问题"。只要 Gemini 输出的是 PNG,你的最终交付物就永远不可编辑。
那如果你不想再调 prompt?另一种解法:SciDraw AI
讲完 Gemini 的边界,顺便聊一下我们自己在做的 SciDraw AI 怎么处理这两堵墙。这里尽量保持中立,你按需选用。
对应墙 1(结果不稳定): SciDraw AI 用模板驱动而不是 prompt 驱动。 你不需要写"Nature journal style, 16:9, no watermark...",你直接选「细胞机制图模板」,填字段:细胞类型、关键蛋白名称、反应步骤。同一个模板批量出图,配色、字号、风格自动统一,Figure 1 到 Figure 6 不会"看起来像不同人画的"。
对应墙 2(不能编辑): SciDraw AI 输出 SVG 矢量图。 导入 PPT 可以直接编辑标签文字,导入 Illustrator 可以拆开每个元素改配色,期刊要求重投换风格不需要重画。一份源文件用到论文投稿、组会汇报、答辩 PPT、毕业论文。
附加:
- 无水印、无 "AI generated" 角标
- 预置常见科研图类型:细胞机制、分子结构、流程图、系统架构、技术路线
- 不需要学 prompt 语法,会填表格就能用
一句话区分:
Gemini Nano Banana 是画笔,SciDraw AI 是模具。
中立对比表
| 维度 | Gemini Nano Banana | SciDraw AI |
|---|---|---|
| 学习成本 | 需要学 prompt 语法 | 选模板填字段 |
| 创意灵活性 | ⭐⭐⭐⭐⭐ 几乎无边界 | ⭐⭐⭐ 模板覆盖范围内 |
| 系列图一致性 | ⭐⭐ 同 prompt 多次差异大 | ⭐⭐⭐⭐⭐ 模板锁定 |
| 输出格式 | PNG(位图) | SVG(矢量,可编辑) |
| 长术语拼写 | ⚠ 需要引号锁定,仍有失败 | ✅ 字段直填,100% 准确 |
| 水印 | 需 prompt 显式禁用 | 默认无 |
| 适合场景 | 探索创意、单张图、概念草图 | 系列图、论文投稿、投标技术标 |
不同读者怎么用这篇指南
- 你是博士生,愿意花时间调 prompt,追求创意自由度 → 用 Gemini Nano Banana,把上面 5 条心得做成自己的 prompt 模板
- 你是导师 / PI,赶 deadline,需要标准化批量输出 → 用 SciDraw AI 模板,省掉抽卡时间
- 你是投标工程师,需要系列图风格统一 → 用 SciDraw AI,SVG 输出能直接进标书 Word
- 你是医学/生物插画师,追求最终可编辑 → 用 SciDraw AI 出底稿 + Illustrator 精修
- 你两者都用 → Gemini Nano Banana 探索创意和构图思路,确定方向后用 SciDraw AI 出可发表的最终交付稿
好的 prompt 让 AI 听懂你,好的工具让你不用学说 AI 的话。



