星期二, 6月 24, 2025

美國法官允許使用盜版書籍訓練人工智能

 https://japantoday.com/category/tech/us-judge-allows-using-pirated-books-to-train-ai

AI示意圖

美國加州一聯邦法官在Anthropic AI公司使用受版權保護書籍(包括從非法網站下載的盜版書籍)來訓練其聊天機器人Claude的訴訟中,裁定其「訓練」行為屬於著作權法下的「合理使用」(fair use)。法官認為這種訓練使用是「極具轉化性」(exceedingly transformative)。這項裁決是美國的首例,並可能為其他面臨類似訴訟的AI公司提供法律先例,有利於AI產業獲取大量訓練數據。然而,法官同時裁定Anthropic將盜版書籍用於建立其「核心圖書館」的行為並不合法,這部分將進入後續審判以確定損害賠償。

這項裁決確實是AI產業發展的一個重要里程碑,它首次明確在美國的法律框架下,將使用大量版權資料進行AI訓練定義為「合理使用」。從AI發展的角度看,這可能極大地降低AI公司的法律風險和數據獲取成本,有利於模型的快速迭代和創新。 然而,從創作者的角度來看,這項裁決無疑帶來了深切的擔憂。文章指出Anthropic使用了數百萬本盜版書籍,雖然法官裁定將盜版書籍用於「圖書館」不合法,但其核心的「訓練」行為卻被允許,且不需作者許可或支付費用。這讓人質疑:創作者的勞動成果被大量用於餵養AI,AI學會了他們的風格和知識,進而生成新的內容,但作者卻可能無法從中獲得任何直接的回報。這會不會對創作者的創作熱情和生計構成威脅?著作權法的核心目的之一是鼓勵創作,如果合理使用的界線擴大到連大規模的AI訓練都涵蓋,那麼創作者該如何通過作品維生? 這也凸顯了現行法律在應對AI技術快速發展時面臨的挑戰。「合理使用」的概念在AI時代的適用性需要重新審視和定義。AI訓練數據的「轉化性」確實存在,AI模型本身並不是原始書籍的簡單複製,但其產出可能與訓練數據密切相關。如何平衡AI的創新潛力與創作者的合法權益,建立一個既能促進技術發展又能保障內容生產者的生態系統,是當前社會和法律體系亟需解決的難題。這起案件的後續發展,特別是關於非法數據用於內部儲存的損害賠償判決,以及其他類似案件的結果,將對AI產業和創作生態的未來走向產生深遠影響。

沒有留言:

張貼留言