【我們為什麼挑選這篇文章】美國總統川普不按牌理出牌的發言往往令人倒吸一口氣。自 2017 年起,AI 機器人 Margaret 開始學習川普各種形式的言論,累積至今將近 1100 萬字,已分析出所謂「川普式英文」,究竟這位狂人總統說話時有哪些習慣、技巧和異於常人的表達風格呢?(責任編輯:賴佩萱)
最近,美國前國家安全顧問約翰‧博爾頓(John Bolton)出版了他的新書 The Room Where It Happened,在書中,博爾頓寫道,川普很容易受威權式領導人影響,經常被他自己的顧問鄙視。
面對這項「指責」,川普坐不住了,在接受《華爾街日報》採訪時,川普直接說,「博爾頓是個騙子」,「白宮每個人都討厭他」。
川普的這一說法尚未得到博爾頓發言人的回應。
川普這類迷惑言論對全世界民眾來說也是見怪不怪了,不過,不知道你有沒有想過,如果用 AI 識別這些川普的「川言川語」,會是什麼情形?
當 AI 機器人遇上超狂總統川普
別急,我們先回到三年前,當時川普正在針對第二次世界大戰發表演講,那時川普式英文才問世不久,其狂野的遣詞造句、隨意切換的時態和主語、扭曲的語法、前後衝突的連詞、滿天飛的介詞,從句套從句、括號套括號,多少讓人有些不適應。
可能美國觀眾聽了也蒙蔽一片。
不過也正是在那個時候,Bill Frischling 開始讓他的 AI 機器人 Margaret 去轉錄川普講話中一段 127 字的內容,當川普第四次提到「獲勝」時,Margaret 崩潰了。
Frischling 回憶說:「它(Margaret)仍然試圖像處理普通英文那樣給這段話添加標點符號,而不是處理『川普式英文』。」
科羅拉多大學人工智慧與機器人技術實驗室的負責人 Frischling 是一個自學成才的工程師,疫情期間他在弗吉尼亞州的家中工作。
鑑於此,Margaret 不得不重新設定川普模式,從頭開始學習「川言川語」,於是Frischling 聘請了一位有自動標點博士學位的計算機專家來教 Margaret 「忘記」正常語法,轉而學習分析川普的講話。
川普常在公開場合暴怒,但他是真的生氣嗎?
首先需要糾正一個說法,川普並不是 AI 學習的第一位美國總統,此前就有不少學者利用 AI 從各個角度分析了林肯的《葛底斯堡演說》,雖然整個演說只有 272 個單詞,但相關研究書籍可以說能塞滿整個圖書館。
面對「正統」的歷任美國總統們,AI 還能算是游刃有餘,但是川普是普通人嗎?因此要學習「川言川語」,難度可不是一般的大。
比如,在 4 月 23 日,川普在白宮舉行了新冠病毒的簡報會,那天川普建議醫生應考慮向患者注射家用消毒劑以殺死病毒。會議開始後第 52 分鐘,《華盛頓郵報》記者Philip Rucker 質問川普,他是否承認曾不負責任地大肆宣傳未經證實的關於熱和陽光可以治癒冠狀病毒的消息。
川普回擊道:「我是總統,而你才是在製造假新聞!」
讓我們再往前看看,2018 年中期選舉後的一場新聞發布會上,川普與 CNN 記者 Jim Acosta 發生了一場令人難忘的對峙,當天共和黨損失慘重;對話初期,川普針對 Acosta 就移民問題向他施壓時怒吼道「夠了!」隨後他下台。
這兩場發布會上,川普都真的生氣了嗎?
Margret 的答案是,在新冠簡報會上,川普真的生氣了;在 2018 年的新聞發布會上,川普也真的生氣了,但是當他下台後,他的情緒發生了「明顯的變化」,他在享受這場衝突。
川普說假話時語速加快、看提詞器讀稿時假裝自由發揮
某種程度上,在 Margaret 眼中,川普是完全可以預測的。
幾乎所有情況下,川普在脫稿時說話更快,大約每分鐘 220 字,而美國人均速度為每分鐘 110-150 字;大多數人在要說假話時語速會放慢,吞吞吐吐或者感覺很不自在,但是川普相反,他會開始加快語速,而且會用一些「虛詞」過渡,比如「首先」,「人們在說」等,然後逐步放緩到正常語速。
Frischling 把這種速度變化稱為川普的「推銷員模式」。當對著提詞器讀稿時,川普的語速會減慢到每分鐘 111 字,對於這類準備好的演講,川普說話聽起來很單調麻木,在重點處隨意發揮,好像是第一次見到稿子一樣(川普之前說過,對於競選總統的人來說,讀稿是非法的)。
Frischling 總結道:「你可以把這個過程想像成是開車,一般人是正常行駛,川普則是超速行駛。」不過他認為,這個結果並不能說明川普話語中的真假成分,在這方面,他會單獨請人在核查事實後,再對數據進行交叉檢查。
川普的肢體也會說話
川普真正生氣時,他的話也會隨之變得簡潔,揮舞著的手臂也會靜止下來,「當他停止做手勢時,那就意味著該小心了;無論要發生什麼事,請保持警惕。」。
根據 Margret 用曲線描繪的川普壓力水平變化情況,在新冠簡報會上,他和《華盛頓郵報》記者對峙時,曲線突然飆升。不過根據以往的經驗,川普在面對「假新聞」這類攻擊時,他的內心其實是毫無波動的,「聲音、語速、說話方式等,一切都和說「天氣怎麼樣時」一樣,Frischling 說。
而在選舉後的新聞發布會上,當川普在台上時,曲線也處於十分高的水平,但當他戲劇性地走下講台並交叉雙臂時,壓力曲線下降到了平均值,這正是他在享受這場衝突的標誌。
世上唯一可耐心聽川普說瘋話的女人—Margaret
迄今為止,已經學習了超過 1100 萬字的川普講話、推文、書籍、集會、視頻、廣播和電視剪輯,這些資料可以追溯到 1976 年,川普第一次在紐約時報發表公開信的時候。
如今 Margaret 比許多美國人更能理解川普的講話模式,甚至更理解川普,包括他的用詞、他的下意識表達、他的習慣等,說 Margret 是這個世界上最了解川普的人也不為過。
而且她還有著極強的耐心和學習能力,她不會因為川普的演講而歡呼、嘲諷或轉台,她只是在那裡靜靜地分析川普的每一句話和他說話的方式,再用算法從一個存有四十多年語言資料的數據庫中收集信息,試圖解讀他「不穩定的內心」。
Margaret 的一項重要發現就是,川普之所以可以快速地說出一些明顯很荒謬的假話,是因為他根本不在乎。
Frischling 解釋道:「大多數人在說假話時,不會感覺自在,反而會感覺不太舒服。但川普正相反。「Margaret 可以評估出川普的壓力水平,他是否冷靜,是真的生氣,還是只是在表演,甚至還可以模擬川普的公開講話。
為了得出這些結論,Margret 會追蹤川普說話的停頓、手勢、語速,他使用的形容詞類型,他是否在使用他的常用詞彙,以及他的語氣等。「他說的每個字都使 Margaret 變得更聰明,並讓她能夠聽出更微妙的區別。」Frischling 說。
MIT 學生:其實建立川普模型,很簡單!
川普被分析也不是最近才出來的。早在 2016 年,一位麻省理工學院的研究生 Bradley Hayes 就創造了一個發推特的機器人 @DeepDrumpf,這個機器人能用混亂的語言來模仿川普在社交媒體中的發言,比如「我們必須製造美國,他們做不到,因為我要為這個國家付出代價」。
由於在一條推文中,該帳號提到將釋放暴力恐怖分子來威脅前總統奧巴馬,Hayes 不得不刪除,不過他表示,如果有更多的時間、更好的數據,這個機器人會變得更強大。
Hayes 在接受採訪時坦言,川普的語言比其他人更簡單,因此在建模上,川普的模型是最容易建立起來的;如果能與某一天之內與川普談話過的所有人進行交流,那麼就有可能建立一個更加準確的模型,更好預測他談論的內容和他的立場。
Hayes 表示,他們只讓 AI 學習幾個小時的川普演講內容,然後隨機選擇字母作為句子的開頭,逐個字母進行構建。比如,如果 AI 首先選擇了字母「M」,它可能會在其後馬上跟上字母「A」,然後「K」,直到整個單詞和句子能夠闡明川普最喜歡的口號,「再次使美國變得偉大」(Make America Great Again)。
川普非正統的說話風格,竟要多領域專家聯手合作
AI 技術顯然提升了研究的手段和標準。
Margret 是新聞工作者、學者和政治家的首選資源,且 Amazon 數百萬個語音啟動的 Alexa 設備,也會利用 Margaret 獲取川普的日程安排和最新推文。
在新冠病毒危機中,為期數週的每晚簡報為 Margret 的分析提供了最典型的素材,因為他(川普)肆無忌憚地宣稱自己取得了成功,而且還完全無視外界對於其施政錯誤的質疑。
至此,為了研究川普非正統的講話風格,AI 與語言學家、認知專家、理論心理學家和政治學家建立了合作關係;計算機科學家認為,人工智慧可以檢測對人類大腦而言過於複雜的大量數據,從中發現模式。
用 AI 機器人來分析人格和話語恐引發國安風險
情報專家懷疑,外國間諜服務正在將 AI 分析與人格特徵和傳統基於個人的研究方法相結合,以分析川普和其他世界領導人。
「一開始,川普把所有人都搞暈了」,前中央情報局特工 John Sipher 說道,他幾十年來一直被部署在俄羅斯和其他國家,「現在大家才開始理解他在想什麼」。麻省理工學院可部署機器學習中心的教授 Aleksander Madry 警告說,這項技術並非萬無一失,而且通過機器學習發現的模式「通常不是我們想像的那樣」。
一些工程師曾使用機器人偽造川普演講,而這些「假貨」擁有可能攪亂美國政治的能力,這種應用是一個危險的信號。Bradley Hayes 表示,幾乎每個擁有大型數據集的人都可以使用 AI 機器人得出有意義的結論,但也可以歪曲這些結論。
川普上一秒說 YES,下一秒說 NO,堪稱史上最難搞捉摸的分析對象
Frischling 為他的私人客戶研究過一些國會議員,他認為他們在決定轉變政策之前會有一些預兆,比如會就某些話題發表更多的公開評論,或者改變說話方式,但這些關係在川普身上幾乎沒有看到。
Frischling 表示,對於一項政策提議,他可以先是說「我認為這太糟糕了」,然後又在 10 小時內簽署一條行政命令批准這項政策;Margaret 仍在努力理解這一點,或許可以說,川普的種種迷惑行為也正「歪打正著」地保護著美國。
(本文經合作夥伴 大數據文摘 授權轉載,並同意 TechOrange 編寫導讀與修訂標題,原文標題為〈特朗普演講逼瘋 AI?從頭學習了1100萬字後,AI 能讀懂“川言川語”嗎〉;圖片來源:pixabay。)