進階:串流取消、長對話自動壓縮、書內 vs 跨書記憶
閱讀約 4 分鐘
用一陣子就會遇到的進階行為——串流取消、長對話壓縮、跨書記憶。這篇解釋它們怎麼運作。

1 · 串流取消(中斷正在打的 AI)
AI 回覆時是 streaming(一個字一個字打出來)的——你可以中途叫停。
| 怎麼停 | 何時 |
|---|---|
Esc |
AI 正在寫、你發現方向錯了 |
| 點訊息旁 ⏸ 按鈕 | 滑鼠在手邊時 |
| 開始打新訊息 | 自動取消當前 stream |
取消後:
- 已經產出的內容保留(譬如 AI 寫了 3 段,第 4 段被你停了 → 留 3 段)
- 不消耗剩餘的額度(被取消的 token 不算)
2 · 長對話自動壓縮
當一個對話對話訊息累積到一定數量 / 或 token 量超過模型 context window 上限的某個比例 時,Slima 會自動壓縮舊訊息:
- 早期訊息 → AI 自動寫一份「對話摘要」放到對話頂端
- 摘要保留關鍵結論、決定、上下文
- 原訊息不刪、被收起——可以展開看
壓縮觸發提示
對話面板會跳通知:「對話已自動壓縮 — 早期 12 條訊息已摘要」+ 「展開原訊息」按鈕。
不要被壓縮:手動 summarize
如果你知道對話即將很長、希望保留某段重要:
- 對重要訊息右鍵 → 釘住 → 不會被壓縮(具體上限依版本而異)
- 或對話末按「Summarize so far」 → AI 主動寫摘要、放到對話頂端
3 · 書內 vs 跨書記憶
預設教練的記憶只看當前書:
- 你在小說 A 跟教練講「主角喜歡海」 → 教練在小說 B 不知道這件事
- 隱私 / 上下文清晰
開「跨書記憶」
對話設定(齒輪 icon)→ 「跨書記憶」 → 選來源書。
開啟後:
- 教練在當前對話可以讀其他書的內容
- 適合:寫劇本改編、想引用原小說
- 或:寫續集,想保持跟前作一致
AI Memory(帳號級記憶)
更進階的「AI Memory」:
- 不只跨書、而是跨對話——你的偏好、寫作風格、慣用語
- 設定在 Account → AI Memory
4 · 速率限制 / Reasoning timeouts
少數時候會看到:
- 「請稍等再試」 → vendor 端速率限制,等 5-10 秒
- 「超時」 → AI 思考時間超過 60 秒沒回應、自動中斷
這時:
- 內容沒丟(你的問題還在)
- 點「重試」可以重發
相關
這篇有幫助嗎?