💡 SciDraw AI 優勢:範本驅動 → SVG 向量匯出 → PowerPoint 和 Illustrator 可直接編輯,無浮水印。免費試用 →
你在 Gemini 裡來來回回改了 20 遍 prompt,細胞圖畫出來了,但標註寫的是「Mitochodria」而不是「Mitochondria」。修改 prompt 後拼字終於對了,結果顏色變得像兒童麥片盒。再試一次,角落出現了一個小小的「AI generated」浮水印。
這不是你的問題。Gemini 2.5 Flash Image(社群稱之為 Nano Banana 的模型)是一個通用影像生成模型。它沒有內建「科研圖」的概念,對長篇專業術語的文字渲染也相當不穩定。它只會照你描述的畫——不會多做任何事。
這篇文章做兩件事:
- 介紹 5 條 prompt 規則,這些規則在過去三個月超過 200 條 prompt 的測試中,將我們的重現率從「碰運氣」提升到 85% 以上
- 老實告訴你 Nano Banana 目前還做不到什麼 ——以及遇到這些限制時該怎麼辦
❌ 先避開這三個地雷
在進入規則之前,先排除造成約 60% 失敗的三個常見錯誤。
1. 沒有指定長寬比 Gemini 的預設輸出大約是正方形。但 Nature、Science、Cell 和大多數期刊要求橫向圖版(16:9 或 4:3)或直向封面(3:4)。正方形的圖放進期刊版型裡,不是被裁切就是飄在空白處。請務必在 prompt 的第一句話明確設定長寬比。
2. 用非英文文字寫標註 即便是中文期刊也要求圖版標註使用英文。Gemini 對非拉丁文字的文字渲染遠不如英文穩定,而且投稿時反正也得改。從一開始就用英文寫標註內容——省去一趟來回。
3. 沒有明確禁止浮水印和簽名
Gemini 的訓練資料充滿圖庫浮水印和藝術家簽名。如果你沒有寫 no watermark, no signature, no text overlay,大約有 30% 的機率會出現角落戳印——而那在投稿時就是直接被退件的理由。
排除這些地雷後,來看如何正確撰寫 prompt。
✅ Gemini Nano Banana 科研圖的 5 條 Prompt 規則
每條規則的結構相同:為什麼重要、❌ 壞的 prompt、✅ 好的 prompt、範例輸出,以及重點摘要。
規則 1:把長寬比和尺寸放在最前面
為什麼重要 長寬比是 Gemini 在段落中間讀到時最容易忽略的限制。放在第一句話能給模型更強的錨定效果,大幅減少「接近正方形」的輸出。
❌ 壞的 prompt:
A diagram showing the structure of a eukaryotic cell with labels.✅ 好的 prompt:
16:9 landscape scientific illustration, eukaryotic cell cross-section,
journal figure layout, fills entire frame, no empty borders.
[... rest of the description ...]
重點摘要: 圖版面板用 4:3 或 16:9,封面用 3:4 或 9:16,目錄圖(TOC)用 1:1。永遠放在最前面。
規則 2:用引號鎖定每個標註,打敗錯字
為什麼重要 這就是開頭拼字噩夢的根本原因。長篇專業術語(Mitochondria、Endoplasmic Reticulum、Phosphofructokinase)會頻繁干擾 Gemini 的文字渲染器——字母被漏掉、重複或調換。在我們的測試中,超過 12 個字元的單字,同一個 prompt 只有 40~60% 的機率能正確拼寫。
解決方法:把每個標註用引號包起來,並告訴模型引號內的文字必須原樣呈現。這一個技巧就讓我們的拼寫準確度提升到 85% 以上。
❌ 壞的 prompt:
Cell diagram with labels for mitochondria, endoplasmic reticulum and golgi apparatus.✅ 好的 prompt:
Cell diagram with labels: "Mitochondria", "Endoplasmic Reticulum",
"Golgi Apparatus", "Nucleus", "Ribosome". Each label in quotes
must appear exactly as written, sans-serif font, 12pt.
重點摘要: 引號加上「must appear exactly as written」這個句子,是我們找到的對抗 Gemini 文字渲染漂移最可靠的方法。同樣的技巧也適用於希臘字母(α、β、γ)和化學式(H₂O、CO₂)。
規則 3:使用真正的科學術語和標準單位
為什麼重要 籠統的說法如「一個蛋白質」、「一些分子」或「幾個細胞」會被解讀為卡通圖形。你必須用該領域研究者實際會使用的名稱,搭配期刊期望的單位和慣例,具體告訴 Gemini 要畫什麼。這就是「科學主題剪貼畫」和看起來可以發表的圖版之間的分界線。
❌ 壞的 prompt:
Show a protein binding to DNA with some chemicals around.✅ 好的 prompt:
Cryo-EM style illustration of "p53 transcription factor" (53 kDa)
binding to "DNA double helix" at consensus site "5'-RRRCWWGYYY-3'",
zinc ions "Zn²⁺" coordinated, scale bar "5 nm", temperature "4°C".
重點摘要: 有正式名稱就用正式名稱,有標準單位就寫標準單位(kDa、μm、mM、°C、nm)。這是 prompt 端的開關,能把 Gemini 從通用繪圖工具切換成科研工具。
規則 4:明確錨定視覺風格
為什麼重要 沒有風格錨定,Gemini 每次都會從訓練資料中拉出不同的東西——有時是教科書圖解、有時是兒童繪本、有時是 3D 渲染、有時是賽博龐克。同一個 prompt 跑五次會得到五種不同的美學風格。單張圖無所謂,但若是系列圖——論文的 Figure 1 到 Figure 6——那就是災難。
穩定產出發表級品質的風格錨定:
Nature journal figure style— 頂級期刊美學biology textbook illustration, flat color— 乾淨的教科書風格scientific schematic, isometric view— 工程風格圖解BioRender style, clean vector look— 生命科學標準
❌ 壞的 prompt:
Show the process of CRISPR gene editing in a cell.✅ 好的 prompt:
Nature journal figure style, flat vector illustration of "CRISPR-Cas9"
gene editing mechanism, clean white background, professional sans-serif labels,
4-step horizontal flow, muted scientific color palette (blue, gray, orange).
重點摘要: 風格錨定 + 色彩配置 + 背景色,全部寫在 prompt 的前半段。這是讓系列圖維持視覺一致性的基礎。
規則 5:明確禁止浮水印、簽名和卡通元素
為什麼重要 Gemini 的訓練資料被帶浮水印的圖庫影像、簽名的藝術家作品和風格化卡通汙染。沒有明確的「不要包含這些」指令,你很可能會得到:角落浮水印、藝術家簽名、Q版角色、糖果色背景、emoji、裝飾邊框。
這些元素在審稿人眼中都意味著:「這不是一張正經的科研圖。」
❌ 壞的 prompt:
[一般的科研圖描述]✅ 好的 prompt:
[一般的科研圖描述]
Strict requirements: no watermark, no signature, no text overlay,
no cartoon characters, no emoji, no decorative elements,
white background only, professional scientific publication quality.
重點摘要: 把這份排除清單變成每個 prompt 模板的固定尾巴。貼上去零成本,卻能阻止我們觀測到的 100% 汙染案例。
Nano Banana 翻不過的兩堵牆
套用所有五條規則後,你會得到拼寫正確、風格統一、沒有浮水印、長寬比正確的圖版。但有兩個限制依然存在——這不是 prompt 的問題,而是模型的邊界。
牆 1:同一個 prompt 每次跑出來的結果天差地遠
我們把一個精心設計的機制圖 prompt 餵給 Nano Banana 10 次。結果:10 種不同的版面配置、配色方案、標註位置和視角。
單張圖的話,這是功能——挑最好的就行。但對於多圖論文來說,這就是一堵牆。 當 Figure 1 到 Figure 6 的色彩配置、視角和字體粗細都不統一時,審稿人在讀到第一個圖說之前就會覺得「這組圖看起來亂七八糟」。Gemini 的隨機性意味著你無法單靠 prompt 鎖定一致性——只能重新生成,而在截稿壓力下重新生成代價很高。
牆 2:輸出是 PNG,不是 SVG
Gemini 給你的是點陣圖。這意味著:
- 想修正一個標註錯字?重新生成整張圖。
- 想把藍色換成紅色?重新生成整張圖。
- 想放進海報然後縮放?邊緣變糊。
- 想在 Illustrator 做最終排版?你可以放置點陣圖,但無法編輯裡面的任何元素。
- 修稿時期刊要求換配色?重新生成整張圖。
這堵牆比第一堵更硬,因為它不是機率問題——是格式問題。只要 Nano Banana 輸出 PNG,你的最終成品就永遠無法編輯。
如果你根本不想寫 prompt?認識 SciDraw AI
這裡我們直接說明我們在做什麼。SciDraw AI 對同一個問題採取了不同的方法——正因為上面那兩堵牆,它值得你了解。
對抗牆 1(不一致性): SciDraw AI 是範本驅動,不是 prompt 驅動。
你不用寫 Nature journal style, 16:9, no watermark...。你選擇一個範本如「細胞機制圖」,填入欄位(細胞類型、關鍵蛋白質、反應步驟),系統就會生成圖版。同一個範本跑五次,色彩配置、字型大小和視覺風格都保持鎖定。Figure 1 到 Figure 6 真的看起來像出自同一個實驗室。
對抗牆 2(不可編輯的輸出): SciDraw AI 匯出 SVG 向量圖形。 在 PowerPoint 裡打開直接編輯標註。在 Illustrator 裡打開重新指定每個顏色。修稿時期刊要求更換配色,你不需要重新生成——直接編輯就好。一個原始檔案從投稿到實驗室會議再到論文口試一路通用。
此外:
- 沒有浮水印、沒有「AI generated」標記
- 常見圖版類型的預建範本(細胞機制、分子結構、流程圖、系統架構、技術路線圖)
- 不用學 prompt 語法——會填表格就能用
用一句話描述兩個工具的差異:
Gemini Nano Banana 是畫筆。SciDraw AI 是模具。
並排比較
| 面向 | Gemini Nano Banana | SciDraw AI |
|---|---|---|
| 學習門檻 | 需要學 prompt 語法 | 選範本、填欄位 |
| 創意自由度 | ⭐⭐⭐⭐⭐ 幾乎無限 | ⭐⭐⭐ 範本範圍內 |
| 系列一致性 | ⭐⭐ 同一 prompt 每次漂移 | ⭐⭐⭐⭐⭐ 範本鎖定風格 |
| 輸出格式 | PNG(點陣) | SVG(向量,完全可編輯) |
| 拼寫準確度 | ⚠ 需要引號鎖定,仍不完美 | ✅ 直接欄位輸入,100% 準確 |
| 浮水印 | 必須在 prompt 中明確禁止 | 預設無 |
| 最適合 | 探索、單張主圖、概念草圖 | 系列圖版、投稿、技術提案 |
根據你的身分來活用這份指南
- 你是喜歡寫 prompt、追求創作自由的博士生 → 用 Nano Banana,根據 5 條規則建立個人 prompt 模板
- 你是有截稿壓力、需要標準化批次輸出的 PI → 用 SciDraw AI 範本,跳過重新生成的抽獎遊戲
- 你是製作技術提案圖表、要求外觀統一的工程師 → SciDraw AI;SVG 輸出直接插入 Word 文件
- 你是需要最終可編輯性的醫學或生物插畫師 → SciDraw AI 出基底圖,Illustrator 做精修
- 你兩個都想用 → 早期探索和概念變體用 Nano Banana,最終要交付的成品用 SciDraw AI
好的 prompt 教 AI 聽你的話。好的工具讓你根本不需要學它的語言。



