我們都為訓練 AI 模型做出了貢獻,為什麼無法獲得報酬?

近期 OpenAI 和其他公司已經面臨眾多廣泛的版權侵權訴訟,涉及他們是否有權抓取網路資料來餵養他們的 AI 模型。例如美國社群媒體網站 Reddit 收集了大量的使用者文本與相關數據,對於想要訓練 AI 模型的公司極有價值,因此 Reddit 也不想用自己的數據白白替這些公司養 AI ,近期決定開始向使用他們數據的大公司收費。

究竟這些被拿來訓練 AI 模型的數據到底歸誰,誰該得到報酬,誰又該付錢?

被譽為「網路思想大師」的美國電腦科學家 Jaron Lanier 近日再次提倡了「數據尊嚴」這個概念。

數據所有權之戰已經開打了!

隨著各大企業爭相開發 AI 模型,數據所有權逐漸成為爭奪的戰場,數據擁有人開始阻止外部訪問數據,或對其收費。Reddit 上週開始對透過訪問 API 訓練 AI 的企業收費。而在一首以 Drake、The Weeknd 聲音為原型的 AI 生成歌曲走紅之後,環球音樂集團(UMG)也表示,利用旗下創作者的音樂訓練,將違反商業協議和著作權。

此外,圖庫業者 Getty Image 已向 Stable Diffusion 提告,指控後者複製自己的內容,以訓練 AI 圖像生成工具。

想知道最新「AI 人工智慧」話題嗎?留下你的 Email,TO 給你精選科技好文與產業觀察!→→ 點我留 Email

為什麼說「人工智慧不存在」?

美國電腦科學家 Jaron Lanier 近日在《紐約客》上發表標題為「人工智慧不存在」(There Is No AI)的文章,提出應停止對人工智慧的神化,而將其作為一種創新的社會協作形式來看待。

Jaron Lanier 對於近期馬斯克等名人呼籲停止訓練更高級人工智慧這件事有不同的看法,並再次提倡「數據尊嚴」這個概念:這個想法是讓人們為自己所創作的東西獲得報酬,即使他們的作品(經過人工智慧)被過濾和重新組合成無法辨認的東西。

目前,我們大多免費提供數據以換取免費服務。Jaron Lanier 認為,在人工智慧時代,我們必須停止這樣做,目前正在進入社會的強大模型需要「與人類聯繫起來」,首先人類給予 AI 模型如此多的東西來攝取和學習,那麼當一個大模型提供有價值的輸出時,數據尊嚴的方法將追蹤最獨特和有影響力的貢獻者。

也就是說,如果攝影師所拍攝出來的照片被拿去訓練 AI 模型,AI 模型所產出的新圖像與這位攝影師的作品相似度高,那麼攝影師應該獲得該有的報酬。

Jaron Lanier 認為,每一個新的人工智慧或機器人應用的成功引入,都可能涉及一種新的創造性工作的開始。他呼籲結束我們當前人工智慧模型的黑箱性質,使人們的貢獻更容易被計算,這將使人們更傾向於保持參與並繼續做出貢獻。

Jaron Lanier 被認為是虛擬現實領域的開創者,2014 年,他被 Prospect 雜誌評為世界前 50 名思想家之一。2018 年,他被《連線》評為過去 25 年技術史上最具影響力的 25 人之一。想要深入了解 Jaron Lanier 對於人工智慧時代的看法,可以深入閱讀他的文章:《紐約客》。

*本文開放夥伴轉載,參考資料:TechCrunch鉅亨網紐約客圖片來源: Getty Images for The New Yorker、unsplash

AD