雞蛋雞蛋不漏閤: 美國法官允許使用盜版書籍訓練人工智能

星期二, 6月 24, 2025

美國法官允許使用盜版書籍訓練人工智能

https://japantoday.com/category/tech/us-judge-allows-using-pirated-books-to-train-ai

AI示意圖

美國加州一聯邦法官在Anthropic AI公司使用受版權保護書籍（包括從非法網站下載的盜版書籍）來訓練其聊天機器人Claude的訴訟中，裁定其「訓練」行為屬於著作權法下的「合理使用」（fair use）。法官認為這種訓練使用是「極具轉化性」（exceedingly transformative）。這項裁決是美國的首例，並可能為其他面臨類似訴訟的AI公司提供法律先例，有利於AI產業獲取大量訓練數據。然而，法官同時裁定Anthropic將盜版書籍用於建立其「核心圖書館」的行為並不合法，這部分將進入後續審判以確定損害賠償。

這項裁決確實是AI產業發展的一個重要里程碑，它首次明確在美國的法律框架下，將使用大量版權資料進行AI訓練定義為「合理使用」。從AI發展的角度看，這可能極大地降低AI公司的法律風險和數據獲取成本，有利於模型的快速迭代和創新。然而，從創作者的角度來看，這項裁決無疑帶來了深切的擔憂。文章指出Anthropic使用了數百萬本盜版書籍，雖然法官裁定將盜版書籍用於「圖書館」不合法，但其核心的「訓練」行為卻被允許，且不需作者許可或支付費用。這讓人質疑：創作者的勞動成果被大量用於餵養AI，AI學會了他們的風格和知識，進而生成新的內容，但作者卻可能無法從中獲得任何直接的回報。這會不會對創作者的創作熱情和生計構成威脅？著作權法的核心目的之一是鼓勵創作，如果合理使用的界線擴大到連大規模的AI訓練都涵蓋，那麼創作者該如何通過作品維生？這也凸顯了現行法律在應對AI技術快速發展時面臨的挑戰。「合理使用」的概念在AI時代的適用性需要重新審視和定義。AI訓練數據的「轉化性」確實存在，AI模型本身並不是原始書籍的簡單複製，但其產出可能與訓練數據密切相關。如何平衡AI的創新潛力與創作者的合法權益，建立一個既能促進技術發展又能保障內容生產者的生態系統，是當前社會和法律體系亟需解決的難題。這起案件的後續發展，特別是關於非法數據用於內部儲存的損害賠償判決，以及其他類似案件的結果，將對AI產業和創作生態的未來走向產生深遠影響。

雞蛋雞蛋不漏閤

星期二, 6月 24, 2025

美國法官允許使用盜版書籍訓練人工智能

沒有留言:

張貼留言