30 天完稿衝刺計畫 — 僅剩 10 個名額。 立即申請 →
深度洞察

AI 讓你更有創意,卻讓所有人寫出同一個故事

10 分鐘閱讀 T Tim
可用語言: 繁體中文 English العربية Español

AI 讓你更有創意,卻讓所有人寫出同一個故事

每個人都寫得更好了。但打開來一看,怎麼每篇都長一個樣?

這不是某個寫作社群的抱怨,而是一項發表在《Science Advances》上的實驗結論。Anil Doshi 與 Oliver Hauser 兩位研究者找來約 300 名寫作者,隨機分成三組:一組自己寫短篇故事,一組可以從 GPT-4 獲得一個故事點子,第三組可以拿到五個。寫完後,600 名評審獨立評分。

結果很漂亮,也很刺眼。

拿到 AI 點子的寫作者,故事被評為更有創意、更好讀、更有趣。原本表現較弱的寫作者受益最大,創意評分提升了 10% 到 11%,可讀性提升高達 22% 到 26%。聽起來像是皆大歡喜的結局。

但研究者接著做了一件事:把所有 AI 輔助的故事放在一起比較。

它們彼此之間的相似度,顯著高於純人類寫的故事。個人變好了,集體卻變窄了。每個人的作品都升級了,但升級的方向是同一個方向。


一場關於創意的社會困境

Doshi 和 Hauser 用了一個精準的類比:這是一個社會困境

社會困境的經典範例是公共牧場。每個牧羊人多放一隻羊,對自己有利。但如果所有人都多放一隻,牧場就垮了。AI 輔助寫作的邏輯一模一樣:每個寫作者用 AI 提升自己的作品,理性上完全合理;但當所有人都這樣做,整個創作生態的多樣性就開始萎縮。

這跟我們平常聽到的 AI 敘事完全相反。主流的故事是:AI 降低了創作門檻,讓更多人能說出自己的故事,世界會因此更多元。

數據說的是另一回事。

問題出在 AI 生成點子的方式。大型語言模型從海量文本中學習統計模式,輸出的是最「可能」的結果,而非最「獨特」的結果。當一百個人向同一個模型要「一個關於失去的故事點子」,他們拿到的素材會自然地聚攏在某個審美中心點附近。也許是一封未寄出的信,也許是一個雨天的回憶,也許是一段童年場景。每個點子單獨看都不錯,放在一起看就會發現:它們共享某種氣質,某種敘事直覺,某種對「好故事」的定義。

這個現象有個技術名詞,叫模式坍縮(mode collapse)。在機器學習領域,它指的是生成模型逐漸喪失輸出的多樣性,開始重複產出類似的結果。原本用來描述模型訓練退化的術語,現在精確地預言了人類集體創作的走向。

「創意疤痕」:撤走 AI 之後會怎樣?

如果同質化只發生在使用 AI 的當下,那至少還有解法:少用就好。

但事情沒那麼簡單。

一項由周奕雍等人進行的七天實驗追蹤了 61 名大學生的創意表現。前五天,實驗組使用 ChatGPT 輔助完成創意任務;第七天,所有人在沒有 AI 的情況下獨立完成同樣的任務。三十天後,再測一次。

結果有兩層。第一層不意外:撤走 AI 後,實驗組的創意分數回落到基線水準。五天的 AI 輔助沒有讓他們「學會」更有創意。這像是一種拐杖效應,拄著走路的時候姿勢很好看,拐杖拿掉,你還是原來的走法。

第二層才令人不安:同質化沒有消退。即使不再使用 AI,實驗組寫出的內容之間的相似度依然在攀升。研究者稱之為「創意疤痕」(creative scar)。AI 走了,但它留下的審美印記還在。那些被 AI 塑造過的思考路徑,似乎已經內化成了寫作者自己的習慣。

這比「AI 會讓作品變平庸」嚴重得多。它暗示的是:即使你只是短暫使用 AI,它對你創作直覺的影響可能是持久的。你不會注意到這種影響,因為你寫出來的東西感覺「很好」。問題在於,你鄰桌的寫作者,也覺得自己寫出來的東西「很好」。而你們的「很好」,正在變得越來越像。

那些被拉平的,到底是什麼?

說「AI 讓故事變相似」是一回事,搞清楚「相似在哪裡」是另一回事。

Doshi 和 Hauser 的研究指出,AI 輔助的故事在結構、轉折點、甚至情感弧線上都呈現出趨同的傾向。這不是說每篇都一樣(那太容易被發現了),而是說它們共享了一種更隱蔽的共性:節奏的預期感。

讀一篇好的 AI 輔助故事,你會覺得流暢、有節奏、在對的時機出現了對的轉折。讀十篇,你會開始覺得每篇的「對的時機」好像都在差不多的地方。到了第二十篇,你已經能猜到轉折在哪裡了。不是因為故事雷同,而是因為背後的敘事邏輯遵循了同一套「什麼構成好故事」的隱含模板。

語言模型學到的是群體偏好的統計分布。它知道讀者通常在什麼節點會被打動,什麼樣的結局會獲得高評價。它給出的建議自然會傾向這些「安全區」。

結果就是:AI 擅長幫你避開「差」,但它同時也在幫你避開「怪」。

而「怪」,恰恰是文學最珍貴的東西之一。卡夫卡的《變形記》開場就把主角變成了蟲子,編輯收到這份稿子的時候大概不會覺得這是個「好」的開頭。乙一用冷到接近殘忍的語調寫溫柔,在任何「讓故事更吸引人」的評估標準中都會被扣分。這些作品之所以重要,正是因為它們偏離了統計上的最佳路徑。

AI 不會建議你把主角變成蟲子。

(好吧,如果你反覆要求,它可能會。但它會在蟲子身上加一段充滿希望的內心獨白,因為那是統計上更「好」的處理方式。)

誰受影響最大?答案可能讓你意外

Doshi 和 Hauser 的研究中有個容易被忽略的細節:AI 對原本就具有高創意的寫作者幾乎沒有提升效果

換句話說,已經知道自己要說什麼、怎麼說的人,AI 的點子對他們用處不大。受益最大的是那些原本在創意上掙扎的寫作者。AI 把他們的表現拉到了接近高創意寫作者的水準。

表面上看,這是民主化。寫作能力的差距被抹平了。

但仔細想一下:被抹平的到底是差距,還是差異?

高創意寫作者之所以表現好,是因為他們有獨特的視角、不走尋常路的直覺、敢於做出反常規的敘事決策。低創意寫作者借助 AI 提升的,是結構的完整性、敘事的流暢性、轉折的精準度。這些是「技藝」層面的提升,很有價值,但它們是朝著同一個方向的提升。

結果是:底部被拉高了,頂部沒有被推高,中間變得更擁擠了。所有人都寫出了「還不錯」的故事,但「不一樣」的故事並沒有變多。

這像是一所學校把所有學生的考試成績都提到了 80 分以上。家長很高興,平均分很好看,但你再也找不到那些考 40 分的怪才了(他們之所以考 40 分,可能是因為他們在考卷背面畫了一整幅漫畫)。

在 AI 時代刻意「寫歪」

如果你已經在使用 AI 輔助寫作,或者正在考慮使用,這些研究結果不應該讓你完全放棄 AI。那太反應過度了。AI 在初稿整理、邏輯檢查、語言潤飾上的價值是真實的。

但你需要意識到一個風險:AI 給你的每一個建議,都在把你往中間推。每一次你接受 AI 的修改建議而沒有質疑,你的作品就離那個統計上的「甜蜜點」更近一步。近一步不會怎樣。近二十步,你就和其他二十個接受了同樣建議的寫作者站在了同一個位置。

那麼,具體怎麼辦?

先寫完再問 AI。 最關鍵的一條。如果你在構思階段就向 AI 要點子,你的故事 DNA 從受精卵階段就被汙染了(抱歉,這個比喻有點噁心,但它精確)。先讓你自己的直覺走完全程,寫出那個可能很糟、很混亂、但完全是你的初稿。然後再把 AI 當編輯用,處理語言和結構層面的問題。

拒絕 AI 的第一個建議。 養成習慣。AI 給你的第一個選項,幾乎一定是統計上最「主流」的選項。看看它,理解它為什麼有吸引力,然後要求不同的方向。或者更好:從 AI 的建議中提取你覺得有意思的碎片,用你自己的方式重新組合。

定期在完全沒有 AI 的環境下寫作。 「創意疤痕」研究的警示在這裡。如果你的創作習慣已經被 AI 塑造了一段時間,你需要有意識地回到純人工狀態,哪怕寫出來的東西粗糙很多。那份粗糙裡可能藏著你已經快要忘記的聲音。

讓 AI 來找你的毛病,但別讓它替你做決定。 Slima 的 AI Beta Reader 設計背後有個原則:AI 擅長發現問題(節奏拖沓、角色動機模糊、場景缺乏感官細節),但解決問題的方式應該由寫作者自己決定。如果你把問題的診斷和處方都交給 AI,你得到的就是一個標準化的治療方案。有時候,你的「毛病」恰好是你的風格。

回到那個令人不安的數字

Doshi 和 Hauser 的研究裡有一個容易被樂觀敘事淹沒的事實:AI 對高創意寫作者的作品品質沒有顯著提升。

這意味著什麼?可能意味著,真正的創意有一個 AI 觸及不到的核心。那個核心不在語言的流暢度,不在結構的精巧度,不在轉折的意外性。它在更深的地方,在一個寫作者如何看待世界、選擇注意什麼、決定什麼值得被寫下來的地方。

AI 可以幫你把一個 B 級的故事打磨成 B+ 或 A-。但它無法把一個 B 級的視角升級成 A 級的視角,因為視角不是語言問題,是生命經驗問題。

回到開頭的研究:每個人都寫得更好了。所有故事都更流暢、更有結構、更「專業」。但 600 名評審在讀完之後,在那些 AI 輔助的故事之間感受到了一種微妙的雷同。

那種雷同不在詞彙層面,不在情節層面,甚至不在風格層面。它在更隱蔽的地方。在故事對「什麼構成一個好結尾」的共識裡。在角色面對衝突時「應該有什麼反應」的默認值裡。在一種不容易察覺但確實存在的,對「好故事」的標準化想像裡。

老實說,對於寫作者而言,這份研究最殘酷的啟示不是「AI 會讓你變平庸」。它是「AI 會讓你變好,但那個『好』是批量生產的」。你需要自己決定:你要的是「好」,還是「你的」。

這兩者有時候重疊,有時候不。而知道它們什麼時候不重疊,可能就是 AI 時代寫作者最需要培養的判斷力。

相關文章

11 分鐘閱讀

自出版逆襲:2026 年獨立作家的黃金時代來了嗎? 每年收入的中位數,獨立出版作家是 13,500 美元,傳統出版作家是 6,000 到 8,000 美元。 這個數字來自 ALLi(獨立作家聯盟)2025 年的調查報告,樣本橫跨全球數千名作家。幾年前,這種比較結果會被當成統計誤差或自我選...

8 分鐘閱讀

「重混」的本質抄襲這個詞,用錯了地方。 2024 年初,日本作家九段理江以《東京都同情塔》拿下芥川獎。記者會上她說了一句話,整個文壇炸開——大約 5% 的文字直接來自 ChatGPT。評審們回頭翻稿子,逐段比對,沒有任何人找得出是哪 5%。AI 寫的和人寫的,混在一起,完全無法區分。 奇怪...

9 分鐘閱讀

創造與批評的時間悖論一個事實,幾乎沒有例外:完美主義者的硬碟裡,未完成的檔案數量遠遠超過已完成的。 這不是偶然的觀察。研究拖延行為的心理學家反覆發現同一件事——對作品品質要求最高的人,往往是交出最少成品的人。Anne Lamott 在《Bird by Bird》裡花了一整章講「Shitty ...