瞭解AI運作的原因,
才能理解怎麼與它相處,
並且知道它現有的極限。
生成式AI生成的內容基本上分成兩大類:
1. 資料庫裡有的:
如果你貼一段資料庫有的文字,
AI就會「背出」後續的文字,
例如給它維基某頁面的第一段,
它就能背出第二段。
這種類型的內容你問它10次20次,
基本上都是穩定的。
現在的生成式AI有許多都是註記員預先寫好的問答集,
你問它它就背出來(例如問它它是誰創造的),
藉此產生不會錯謬的答案。
2. 資料庫裡沒有的:
它會「模仿」資料庫裡有的資料,
依機率生成「可能」的內容(這個機率就是所謂的「權重」),
你問它兩次三次十次,
每次都可能產生不同的答案。
說好聽一點叫「幻覺」,
實際上就是亂數,
但它不是完全的隨機,
因為它有受過大量的網路資料訓練,
所以輸出的是「高機率」的。
就像「退貨須知」,
100個店家的須知都不一樣,
但原則上大同小異,
所以它可以寫得煞有介事,
卻可能摻進奇怪的東西。
(例如你問它各家公司的電信方案,它就不見得答得精確)
瞭解這個基本原理後,
我們就能理解,
為什麼生成式AI會非常擅長「回答問題」,
能夠寫「知識型文章」,
但要創作卻會面對挑戰。
因為你今天問它中藥的問題,
100個網路資料中對同一個藥材的答案都相似,
它自然能講得相當精確。
同理,物理、心理學、某本書的書摘,
因為多數人分享的都大同小異,
所以它也自然能好好回答你。
原則上,它做的事跟我們人類專家很像,
在訓練過程中背誦大量的知識和準則,
遇到沒背過的,
就模仿腦中類似的案例,
經驗案例越多,就會形成越可靠的知識。
但「創作」是一個全然不同的任務,
有用過生成式AI寫故事的人,
通常會發現AI寫的故事,
大多有幾個特點:
1. 過度模板化。
2. 文字有種單調與囉唆感。
3. 細節沒有意義。
4. 前後邏輯經常跑掉。
從上面AI生成內容的原理來看,
我們不難發現為什麼會變這樣,
因為首先它不可能有現成的東西可以背,
所以它一定是靠模仿,
並且是模仿「數量最多的那種」。
因此情節模板、老套就難以避免,
而亂數生成的角色與情節,
也自然容易出現無用的細節和錯誤的邏輯,
就像一個模仿龜兔賽跑的故事,
僅僅只是把賽跑換成舉重,
這個故事就明顯走樣了。
角色、情節與主題的一致性是一個關卡,
對內容新鮮感的要求又是另一個關卡,
在現有生成式AI的訓練與LLM模型運作的邏輯下,
AI創意寫作要表現得像技術寫作那麼優秀,
有本質上的困難。
這不是在說生成式AI未來一定做不到,
AI日新月異,科學家們總會想到一個妙招,
破解創意寫作的學習方法。
畢竟人能學會,沒道理AI學不會。
我們反而應該從這點回頭看,
做為創作者,
如果我們創作的方式也跟AI一樣,
要嘛背出看過的熟悉情節,
要嘛模仿看過的熟悉情節,
那我們自然要被AI取代。
學習創作,其實就是在學AI無可取代的部分,
好好理解什麼是有意義的細節,
什麼是角色、情節與主題的一致性,
什麼又是別人沒寫過的,
讓自己成為可以為訓練集注入新意的人,
去探索沒有人去與關心的領域,
才是永遠不被取代的關鍵。