竊取數(shù)億北美用戶數(shù)據(jù)訓(xùn)練 AI,谷歌被公訴
據(jù)業(yè)內(nèi)消息,因涉嫌在北美用戶不知情的情況下竊取其上網(wǎng)隱私數(shù)據(jù)來(lái)訓(xùn)練其 AI 產(chǎn)品(包括但不限于 Bard),谷歌上周被提起集體公訴,指控其“秘密地竊取了數(shù)億美國(guó)人在互聯(lián)網(wǎng)上創(chuàng)作和分享的一切”。
據(jù)悉,這項(xiàng)集體訴訟由克拉克森律師事務(wù)所(Clarkson Law Firm)在加利福尼亞北區(qū)聯(lián)邦法院提起,指控谷歌及其 AI 子公司 DeepMind 和母公司 Alphabet 非法竊取了用戶數(shù)據(jù)。這家律所前不久曾對(duì) ChatGPT 開(kāi)發(fā)商 OpenAI 提起類似訴訟,指控該公司竊取了大量個(gè)人數(shù)據(jù)用它來(lái)訓(xùn)練 ChatGPT,包括醫(yī)療記錄和關(guān)于兒童的信息。
本次訴訟聲稱“谷歌拿走了我們所有的個(gè)人和專業(yè)信息、我們的創(chuàng)意和版權(quán)作品、我們的照片,甚至我們的電子郵件 —— 幾乎是我們數(shù)字足跡的全部”用來(lái)構(gòu)建其 AI 產(chǎn)品?!岸嗄陙?lái),谷歌秘密地收集了這些數(shù)據(jù),沒(méi)有向任何人通知或征得同意?!?
此外,谷歌從基于訂閱的網(wǎng)站和以盜版書(shū)籍和創(chuàng)意作品而聞名的網(wǎng)站竊取了數(shù)據(jù),谷歌 7 月 1 日對(duì)其隱私政策的更新,新隱私政策稱谷歌可能會(huì)收集公開(kāi)在線可用的信息用來(lái)訓(xùn)練其 AI 模型,并構(gòu)建谷歌翻譯(Google Translate)、Bard 和云端 AI(Cloud AI)等產(chǎn)品。
訴訟稱:“谷歌必須明白它并不擁有互聯(lián)網(wǎng),它也不擁有我們的創(chuàng)意作品、我們的個(gè)性表達(dá)、我們的家庭和孩子的照片,或者任何其他因?yàn)槲覀冊(cè)诰W(wǎng)上分享而屬于我們的東西?!_(kāi)可用’從來(lái)不意味著可以為任何目的免費(fèi)使用?!?
谷歌這起訴訟中的一名原告是一名住在得克薩斯州的《紐約時(shí)報(bào)》暢銷書(shū)作者和調(diào)查記者,她聲稱谷歌使用了她的書(shū)的盜版 PDF 來(lái)訓(xùn)練 Bard。訴訟稱,她的作品現(xiàn)在在 Bard 上廣泛免費(fèi)提供,該機(jī)器人給出了書(shū)的章節(jié)摘要,甚至逐字分享了書(shū)中的片段。
然而谷歌在一份聲明中稱,訴訟中的指控毫無(wú)根據(jù)。谷歌總法律顧問(wèn) Halimah DeLaine Prado在一份聲明中聲稱該公司多年來(lái)一直明確表示,使用來(lái)自公共來(lái)源的數(shù)據(jù),如發(fā)布到開(kāi)放網(wǎng)絡(luò)和公共數(shù)據(jù)集上的數(shù)據(jù),來(lái)訓(xùn)練谷歌翻譯等服務(wù)背后的人工智能模型符合我們的 AI 原則,美國(guó)法律支持使用公開(kāi)信息來(lái)創(chuàng)造新的有益用途,我們期待駁回這些毫無(wú)根據(jù)的指控。