【出版業不說的秘密】暢銷書關鍵元素居然包括「我、他、!、?」出現的次數

1124-暢銷書密碼-立體書封_定稿

【為什麼我們推薦這本書】

一本書之所以能暢銷,是因為他的行銷做的好,還是作者的名聲夠響亮?如果說一本暢銷書是有跡可循,那說暢銷書能被預測你覺得是不是唬人?每個人都有自己的寫作風格,如果說一本書能打動讀者,那關鍵就在寫作風格上。

暢銷書密碼:人工智慧帶我們重新理解小說創作》這本書作者為茱蒂.亞契(Jodie Archer),及馬修.賈克斯(Matthew L. Jockers),他們來自史丹佛大學的文學實驗室,用了五年訓練電腦「閱讀」兩萬部小說,分析暢銷書的題材、文字使用和角色塑造等,讓你找到打開暢銷書就停步下來的秘密。(責任編輯:張瑋倫)

讓電腦閱讀小說的技術一點也不反傳統,並沒有違背我們慣用的文評方法。事實上,電腦可以「觀察入微」,對各種寫作特徵進行擷取分析,這和傳統研究所使用的方法大同小異。只不過,電腦讓我們有機會從文本當中挖掘出前所未見的深入洞見。

教電腦閱讀與擷取資訊的方法很多。我們寫了各種程式和演算法,可以從書裡擷取詳細資訊,包括每一本書的風格、主題、人物、情緒起伏、場景設定,還有各式各樣看似無關緊要又難以歸類的語言資訊。

寫作書和小說課都經常到小說的幾個重要元素,如主題、情節、寫作風格等,若要從這些面向來分析暢銷書,電腦就需要數百種原始資料,比方說,作者用了多少次的「a」、「the」、「in」和「she」?句號和驚嘆號出現的頻率為何?作者多常用到副詞,使用得是否準確?

這些微小細節其實對讀者影響頗大。想想夏綠蒂.勃朗特在《簡愛》裡的這句話,就可以看出代名詞有多重要:

讀者,我嫁給他了。

電腦偵測到「他」這個字,也注意到「他」和敘事者「我」在句子裡靠得很近。此外,電腦也發現「我」和「他」在愈來愈多句子裡同時出現,而且彼此間的距離愈來愈近。

當然,讀者也會注意到這件事。許多故事的重點不就是要讓「我」和「他」在一起嗎?要把兩者連在一起的最佳動詞不就是「嫁給」嗎?往往,這就是讓我們一頁又一頁不停讀下去的理由。

問號和驚嘆號也提供我們很多資訊。但你可能記得高中老師教過,驚嘆號用得愈少愈好。如果每個句子都在尖叫(我的天!),或每句對話都是命令(不准動!),或嘶喊(啊!),或一直發現夜裡不寧靜(砰!),那你的讀者可能會心臟無力。 驚嘆號的使用可以讓我們看出一本小說的聳動程度以及作者的寫作功力

同樣道理,出現問號常常表示有對話發生 ,如果一連串的敘述文字好幾頁都沒有出現問號,會讓讀者閱讀的速度和興致都降下來。

我們剛開始研究的時候,擷取了超過 20,000 種寫作特徵,驚嘆號和「他」只是其中的兩個。我們每一種都認真研究,有些特徵讓我們看出風格,有些讓我們更理解情節和故事設定,還有一些讓我們瞭解小說的題材。

但並非所有特徵都可以用來判斷小說的暢銷指數。我們發現,數字的使用不太會影響銷售成績,例如 911、1984、867-5309、$1,000,000。作者在小說裡有沒有用到數字,或使用數字的頻率高低,都不會造成影響。

同樣地,我們花了很多時間,訓練電腦準確判斷《穿著 Prada 的惡魔》場景設在紐約,《控制》則是從紐約開始,最後到了密蘇里。但其實地理場景設定對銷量的影響也不大。

到最後,我們去蕪存菁,從 20,000 種寫作特徵中篩選出 2,800 種,這些特徵對於小說暢銷程度有較顯著的影響。我們在訓練電腦閱讀並擷取寫作特徵之後,又用另一套電腦程式來分析暢銷小說潛在的共通模式。

我們在分析階段所使用的方法稱做「機器學習」。在文字探勘的領域裡,我們往往利用文本之間的相似處來做分類。舉例來說,我們想分辨垃圾郵件和一般郵件,而通常垃圾郵件都有些共同點,像錯別字、商品名稱不斷出現等,我們便可依此寫出一套程式來檢測一封電子郵件是不是垃圾信。

我們將小說分類的方法其實和過濾電子郵件很類似。假設我們想預測一本沒有看過的新書會不會暢銷,而我們已經握有很多暢銷書(非垃圾郵件)和冷門書(垃圾郵件),我們就可以把這些書都匯入電腦,並訓練電腦根據顯著的寫作特徵去辨識這兩種書籍。 我們在做的就是這些事。

我們用了三種不同的分類方法,最後把結果平均起來,發現 電腦不但可以預測一本新書能否暢銷,準確度還高達八成

《暢銷書密碼》本週五(12/09)將舉辦新書發表座談會,有興趣的讀者請踴躍參加!以下為座談會相關資訊:

 日期 :12/09(五)
 時間 :19:30-21:00
 地點 :青鳥書店(華山文創園區 玻璃屋 2F)

此次座談會邀請到 TechOrange 總編輯張育寧、雲夢千里(同時也是本書出版社)選書人馮勃翰教授,以及本書譯者葉妍伶,一起來聊聊這本用新科技說故事的先驅《暢銷書密碼》。(詳細活動資訊  請點我

(本文書摘內容出自《暢銷書密碼:人工智慧帶我們重新理解小說創作》由合作夥伴雲夢千里出版社授權轉載,並同意 TechOrange 編寫導讀與修訂標題。)

延伸閱讀

【出版業不說的秘密】從 J. K. 羅琳、史蒂芬金的寫作習慣,找到晉升暢銷作家的密碼
【出版業不說的秘密】暢銷書之所以賣,跟作家名氣、行銷預算、隨書小禮物都無關!
讀完 2865 篇「情色小說」還不夠?Google 培養人工智慧寫詩創作!


點關鍵字看更多相關文章: