AI 讓你更有創意,卻讓所有人寫出同一個故事
每個人都寫得更好了。但打開來一看,怎麼每篇都長一個樣?
這不是某個寫作社群的抱怨,而是一項發表在《Science Advances》上的實驗結論。Anil Doshi 與 Oliver Hauser 兩位研究者找來約 300 名寫作者,隨機分成三組:一組自己寫短篇故事,一組可以從 GPT-4 獲得一個故事點子,第三組可以拿到五個。寫完後,600 名評審獨立評分。
結果很漂亮,也很刺眼。
拿到 AI 點子的寫作者,故事被評為更有創意、更好讀、更有趣。原本表現較弱的寫作者受益最大,創意評分提升了 10% 到 11%,可讀性提升高達 22% 到 26%。聽起來像是皆大歡喜的結局。
但研究者接著做了一件事:把所有 AI 輔助的故事放在一起比較。
它們彼此之間的相似度,顯著高於純人類寫的故事。個人變好了,集體卻變窄了。每個人的作品都升級了,但升級的方向是同一個方向。
一場關於創意的社會困境
Doshi 和 Hauser 用了一個精準的類比:這是一個社會困境。
社會困境的經典範例是公共牧場。每個牧羊人多放一隻羊,對自己有利。但如果所有人都多放一隻,牧場就垮了。AI 輔助寫作的邏輯一模一樣:每個寫作者用 AI 提升自己的作品,理性上完全合理;但當所有人都這樣做,整個創作生態的多樣性就開始萎縮。
這跟我們平常聽到的 AI 敘事完全相反。主流的故事是:AI 降低了創作門檻,讓更多人能說出自己的故事,世界會因此更多元。
數據說的是另一回事。
問題出在 AI 生成點子的方式。大型語言模型從海量文本中學習統計模式,輸出的是最「可能」的結果,而非最「獨特」的結果。當一百個人向同一個模型要「一個關於失去的故事點子」,他們拿到的素材會自然地聚攏在某個審美中心點附近。也許是一封未寄出的信,也許是一個雨天的回憶,也許是一段童年場景。每個點子單獨看都不錯,放在一起看就會發現:它們共享某種氣質,某種敘事直覺,某種對「好故事」的定義。
這個現象有個技術名詞,叫模式坍縮(mode collapse)。在機器學習領域,它指的是生成模型逐漸喪失輸出的多樣性,開始重複產出類似的結果。原本用來描述模型訓練退化的術語,現在精確地預言了人類集體創作的走向。
「創意疤痕」:撤走 AI 之後會怎樣?
如果同質化只發生在使用 AI 的當下,那至少還有解法:少用就好。
但事情沒那麼簡單。
一項由周奕雍等人進行的七天實驗追蹤了 61 名大學生的創意表現。前五天,實驗組使用 ChatGPT 輔助完成創意任務;第七天,所有人在沒有 AI 的情況下獨立完成同樣的任務。三十天後,再測一次。
結果有兩層。第一層不意外:撤走 AI 後,實驗組的創意分數回落到基線水準。五天的 AI 輔助沒有讓他們「學會」更有創意。這像是一種拐杖效應,拄著走路的時候姿勢很好看,拐杖拿掉,你還是原來的走法。
第二層才令人不安:同質化沒有消退。即使不再使用 AI,實驗組寫出的內容之間的相似度依然在攀升。研究者稱之為「創意疤痕」(creative scar)。AI 走了,但它留下的審美印記還在。那些被 AI 塑造過的思考路徑,似乎已經內化成了寫作者自己的習慣。
這比「AI 會讓作品變平庸」嚴重得多。它暗示的是:即使你只是短暫使用 AI,它對你創作直覺的影響可能是持久的。你不會注意到這種影響,因為你寫出來的東西感覺「很好」。問題在於,你鄰桌的寫作者,也覺得自己寫出來的東西「很好」。而你們的「很好」,正在變得越來越像。
那些被拉平的,到底是什麼?
說「AI 讓故事變相似」是一回事,搞清楚「相似在哪裡」是另一回事。
Doshi 和 Hauser 的研究指出,AI 輔助的故事在結構、轉折點、甚至情感弧線上都呈現出趨同的傾向。這不是說每篇都一樣(那太容易被發現了),而是說它們共享了一種更隱蔽的共性:節奏的預期感。
讀一篇好的 AI 輔助故事,你會覺得流暢、有節奏、在對的時機出現了對的轉折。讀十篇,你會開始覺得每篇的「對的時機」好像都在差不多的地方。到了第二十篇,你已經能猜到轉折在哪裡了。不是因為故事雷同,而是因為背後的敘事邏輯遵循了同一套「什麼構成好故事」的隱含模板。
語言模型學到的是群體偏好的統計分布。它知道讀者通常在什麼節點會被打動,什麼樣的結局會獲得高評價。它給出的建議自然會傾向這些「安全區」。
結果就是:AI 擅長幫你避開「差」,但它同時也在幫你避開「怪」。
而「怪」,恰恰是文學最珍貴的東西之一。卡夫卡的《變形記》開場就把主角變成了蟲子,編輯收到這份稿子的時候大概不會覺得這是個「好」的開頭。乙一用冷到接近殘忍的語調寫溫柔,在任何「讓故事更吸引人」的評估標準中都會被扣分。這些作品之所以重要,正是因為它們偏離了統計上的最佳路徑。
AI 不會建議你把主角變成蟲子。
(好吧,如果你反覆要求,它可能會。但它會在蟲子身上加一段充滿希望的內心獨白,因為那是統計上更「好」的處理方式。)
誰受影響最大?答案可能讓你意外
Doshi 和 Hauser 的研究中有個容易被忽略的細節:AI 對原本就具有高創意的寫作者幾乎沒有提升效果。
換句話說,已經知道自己要說什麼、怎麼說的人,AI 的點子對他們用處不大。受益最大的是那些原本在創意上掙扎的寫作者。AI 把他們的表現拉到了接近高創意寫作者的水準。
表面上看,這是民主化。寫作能力的差距被抹平了。
但仔細想一下:被抹平的到底是差距,還是差異?
高創意寫作者之所以表現好,是因為他們有獨特的視角、不走尋常路的直覺、敢於做出反常規的敘事決策。低創意寫作者借助 AI 提升的,是結構的完整性、敘事的流暢性、轉折的精準度。這些是「技藝」層面的提升,很有價值,但它們是朝著同一個方向的提升。
結果是:底部被拉高了,頂部沒有被推高,中間變得更擁擠了。所有人都寫出了「還不錯」的故事,但「不一樣」的故事並沒有變多。
這像是一所學校把所有學生的考試成績都提到了 80 分以上。家長很高興,平均分很好看,但你再也找不到那些考 40 分的怪才了(他們之所以考 40 分,可能是因為他們在考卷背面畫了一整幅漫畫)。
在 AI 時代刻意「寫歪」
如果你已經在使用 AI 輔助寫作,或者正在考慮使用,這些研究結果不應該讓你完全放棄 AI。那太反應過度了。AI 在初稿整理、邏輯檢查、語言潤飾上的價值是真實的。
但你需要意識到一個風險:AI 給你的每一個建議,都在把你往中間推。每一次你接受 AI 的修改建議而沒有質疑,你的作品就離那個統計上的「甜蜜點」更近一步。近一步不會怎樣。近二十步,你就和其他二十個接受了同樣建議的寫作者站在了同一個位置。
那麼,具體怎麼辦?
先寫完再問 AI。 最關鍵的一條。如果你在構思階段就向 AI 要點子,你的故事 DNA 從受精卵階段就被汙染了(抱歉,這個比喻有點噁心,但它精確)。先讓你自己的直覺走完全程,寫出那個可能很糟、很混亂、但完全是你的初稿。然後再把 AI 當編輯用,處理語言和結構層面的問題。
拒絕 AI 的第一個建議。 養成習慣。AI 給你的第一個選項,幾乎一定是統計上最「主流」的選項。看看它,理解它為什麼有吸引力,然後要求不同的方向。或者更好:從 AI 的建議中提取你覺得有意思的碎片,用你自己的方式重新組合。
定期在完全沒有 AI 的環境下寫作。 「創意疤痕」研究的警示在這裡。如果你的創作習慣已經被 AI 塑造了一段時間,你需要有意識地回到純人工狀態,哪怕寫出來的東西粗糙很多。那份粗糙裡可能藏著你已經快要忘記的聲音。
讓 AI 來找你的毛病,但別讓它替你做決定。 Slima 的 AI Beta Reader 設計背後有個原則:AI 擅長發現問題(節奏拖沓、角色動機模糊、場景缺乏感官細節),但解決問題的方式應該由寫作者自己決定。如果你把問題的診斷和處方都交給 AI,你得到的就是一個標準化的治療方案。有時候,你的「毛病」恰好是你的風格。
回到那個令人不安的數字
Doshi 和 Hauser 的研究裡有一個容易被樂觀敘事淹沒的事實:AI 對高創意寫作者的作品品質沒有顯著提升。
這意味著什麼?可能意味著,真正的創意有一個 AI 觸及不到的核心。那個核心不在語言的流暢度,不在結構的精巧度,不在轉折的意外性。它在更深的地方,在一個寫作者如何看待世界、選擇注意什麼、決定什麼值得被寫下來的地方。
AI 可以幫你把一個 B 級的故事打磨成 B+ 或 A-。但它無法把一個 B 級的視角升級成 A 級的視角,因為視角不是語言問題,是生命經驗問題。
回到開頭的研究:每個人都寫得更好了。所有故事都更流暢、更有結構、更「專業」。但 600 名評審在讀完之後,在那些 AI 輔助的故事之間感受到了一種微妙的雷同。
那種雷同不在詞彙層面,不在情節層面,甚至不在風格層面。它在更隱蔽的地方。在故事對「什麼構成一個好結尾」的共識裡。在角色面對衝突時「應該有什麼反應」的默認值裡。在一種不容易察覺但確實存在的,對「好故事」的標準化想像裡。
老實說,對於寫作者而言,這份研究最殘酷的啟示不是「AI 會讓你變平庸」。它是「AI 會讓你變好,但那個『好』是批量生產的」。你需要自己決定:你要的是「好」,還是「你的」。
這兩者有時候重疊,有時候不。而知道它們什麼時候不重疊,可能就是 AI 時代寫作者最需要培養的判斷力。