當前位置:首頁(yè) > 百科 > 正文內容

互聯(lián)網(wǎng)巨頭,如何合法地「偷」你的數據訓練 AI?

隨州海報印刷4個(gè)月前 (07-02)百科7
印刷廠(chǎng)直印●彩頁(yè)1000張只需要69元●名片5元每盒-更多報價(jià)?聯(lián)系電話(huà):138-1621-1622(微信同號)

導讀:蒼蠅再小也是肉,聚沙成塔。

作者:芯芯

編輯:靖宇

文章來(lái)源:極客公園(geekpark)

你知道嗎,自己的數據,現在已經(jīng)開(kāi)始合法地被互聯(lián)網(wǎng)大廠(chǎng)們用作 AI 訓練了。

在新一波的 AI 競賽中,由于訓練模型需要大量數據,當互聯(lián)網(wǎng)的普通數據挖掘殆盡,平臺上大量用戶(hù)個(gè)人內容,便成了充滿(mǎn)誘惑的礦藏。

一些硅谷的科技公司如此渴望新數據,開(kāi)始偷偷摸摸把 AI 訓練加入到數據使用政策中,賦予自己使用人們數據的權利。

在過(guò)去一年多里,包括谷歌、Meta、Adobe、Zoom 和 X 等大公司紛紛更新其服務(wù)條款或隱私政策,允許自己利用用戶(hù)數據來(lái)訓練生成式 AI 模型。

這些互聯(lián)網(wǎng)大廠(chǎng),都偷偷在「服務(wù)條款」里塞進(jìn)了什么貨?

01

硅谷巨頭的「小動(dòng)作」

隨著(zhù)科技巨頭對數據的渴望越來(lái)越大,它們正在仔細重寫(xiě)其條款和條件,以包含「人工智能」、「機器學(xué)習」和「生成式人工智能」等詞語(yǔ)。

為了避免用戶(hù)對隱私問(wèn)題的反感,公司有時(shí)悄悄地進(jìn)行這些更改。在許多情況下,用戶(hù)會(huì )在未閱讀一字的情況下點(diǎn)擊同意,毫無(wú)警覺(jué)地接受協(xié)議。

下面是硅谷大廠(chǎng)們在用戶(hù)服務(wù)條款中各自「夾帶私貨」的細節:

谷 歌

在 2022 年末,當 OpenAI 發(fā)布了 ChatGPT 并引發(fā)了全行業(yè)的追趕競賽后,谷歌的研究人員和工程師開(kāi)始討論如何利用其他用戶(hù)數據。數十億字的內容存儲在人們的 Google 文檔和其他免費 Google 應用中,但是公司的隱私政策限制了他們如何使用這些數據。

當時(shí),谷歌的隱私政策規定公司只能使用公開(kāi)可用信息來(lái)「幫助訓練谷歌的語(yǔ)言模型和構建像 Google 翻譯這樣的功能」。

去年 6 月,據紐約時(shí)報報道,谷歌的法律部門(mén)要求隱私團隊起草語(yǔ)言,以擴展公司可以使用消費者數據的范圍。

去年 7 月,谷歌對其隱私政策進(jìn)行了修改,增加了公共信息可用于訓練其 AI 聊天機器人和其他服務(wù)的內容。

歌將 Bard 和云端 AI 加入到用戶(hù)條款中|NYT

「我們使用公開(kāi)可用的信息來(lái)幫助訓練谷歌的 AI 模型,并構建諸如谷歌翻譯、Bard 和云 AI 功能等產(chǎn)品和功能?!?/p>

為了安撫用戶(hù),谷歌聲明稱(chēng),其隱私政策的變更「只是澄清了像 Bard(現為 Gemini)這樣的新服務(wù)也包括在內。我們并沒(méi)有因為這種語(yǔ)言變化而開(kāi)始在其他類(lèi)型的數據上訓練模型?!?/p>

谷歌的 AI 訓練當然也有用最私人化的數據,如給朋友和家人的信息。谷歌發(fā)言人表示,在得到一小群用戶(hù)許可的情況下,谷歌被允許在某些方面使用他們的個(gè)人電子郵件訓練其人工智能。

Meta

去年 Meta 就更新了相關(guān)隱私政策,用戶(hù)「在我們的產(chǎn)品和服務(wù)上提供的活動(dòng)和信息」將被用來(lái)訓練其 AI,包括在使用像其 AI 工具時(shí)所寫(xiě)或所說(shuō)的一切。

Meta 表示,其 AI 不會(huì )讀取用戶(hù)在 Messenger 和 WhatsApp 等應用上與朋友和家人之間發(fā)送的消息,除非用戶(hù)在消息中 @ 了其 AI 聊天機器人。Meta 將與 AI 互動(dòng)的責任推給用戶(hù),表示人們應該「注意」他們在提示中所說(shuō)的話(huà),比如不要包括任何個(gè)人信息,如家庭地址或電話(huà)號碼。

Meta 聲明表示:「我發(fā)送給生成式 AI 功能的信息會(huì )發(fā)生什么?AI 可能會(huì )保留并使用您在聊天中分享的信息,以提供更個(gè)性化的響應或相關(guān)信息,我們可能會(huì )與可信賴(lài)的合作伙伴(如搜索提供商)共享您提出的某些問(wèn)題,以提供更相關(guān)、準確和最新的響應?!?/p>

「使用公開(kāi)可用的信息訓練人工智能模型是整個(gè)行業(yè)的慣例,并非我們服務(wù)獨有?!筂eta 發(fā)言人在聲明中說(shuō)。

X

在條款后方補了一句對于人工智能模型訓練的事項|NYT

馬斯克一直在構建一個(gè) AI 項目。去年 9 月,X 在其隱私政策中添加了一句話(huà),關(guān)于機器學(xué)習和人工智能。

「我們使用收集到的信息來(lái)提供和運營(yíng) X 產(chǎn)品和服務(wù)。我們還使用收集到的信息來(lái)改進(jìn)和個(gè)性化我們的產(chǎn)品和服務(wù),以便您在 X 上獲得更好的體驗,包括向您展示更相關(guān)的內容和廣告、建議您關(guān)注的人和主題、啟用和幫助您發(fā)現關(guān)聯(lián)公司、第三方應用和服務(wù)。我們可能會(huì )使用收集到的信息和公開(kāi)可用的信息來(lái)幫助訓練我們的機器學(xué)習或人工智能模型,以實(shí)現本政策中概述的目的?!?/p>

Snap

Snap 有些服務(wù)條款的變更只有幾個(gè)字。另一些則新增了整段內容來(lái)解釋生成式人工智能模型的工作原理,以及它們對用戶(hù)數據的訪(fǎng)問(wèn)類(lèi)型。

例如,今年,Snap 更新了其聊天機器人 My AI 的數據收集的隱私政策。Snap 提醒用戶(hù)不要與其人工智能聊天機器人分享機密信息,因為這些信息將用于訓練。

Snap 對于 My AI 聊天機器人的條款改動(dòng)較多|NYT

「My AI 是一個(gè)基于生成式 AI 技術(shù)構建的聊天機器人,設計理念確保安全。生成式 AI 是一種正在開(kāi)發(fā)的技術(shù),它可能會(huì )提供有偏見(jiàn)、不正確、有害或誤導性的答案。所以,你不應該依賴(lài)它的建議。您也不應該分享任何機密或敏感信息——如果您這樣做,My AI 會(huì )使用它?!?/p>

「當您與 My AI 互動(dòng)時(shí),我們會(huì )使用您分享的內容和您的位置(如果您已啟用 Snapchat 的位置共享)以改進(jìn) Snap 的產(chǎn)品,包括增強 My AI 的安全性,并個(gè)性化您的體驗,包括廣告?!?/p>

Zoom

Zoom 去年 7 月開(kāi)始更新其服務(wù)條款,說(shuō)明會(huì )將用戶(hù)數據用于訓練 AI,但遭遇用戶(hù)和隱私提倡者的大量批評。在面臨社交媒體上的強烈反對聲音后,Zoom 去年 8 月又再次更新了服務(wù)條款,澄清未經(jīng)同意不會(huì )使用視頻、音頻或聊天內容。

更新后的服務(wù)條款仍然要求用戶(hù)「在此授予 Zoom 永久性、全球性的、非獨占性的、免版稅的、可轉許可和可轉讓的許可及所有其他權利」使用客戶(hù)內容。

這些權利包括「重新分發(fā)、發(fā)布、導入、訪(fǎng)問(wèn)、使用、存儲、傳輸、審查、披露、保存、提取、修改、復制、共享、展示、復制、分發(fā)、翻譯、轉錄、創(chuàng )作衍生作品和處理」客戶(hù)內容。

條款不再具體提及 Zoom 有權就客戶(hù)內容進(jìn)行「AI 和 ML 訓練」,而是更模糊地提到「服務(wù)開(kāi)發(fā)、營(yíng)銷(xiāo)、分析、質(zhì)量保證、機器學(xué)習、人工智能、培訓、測試、服務(wù)、軟件或 Zoom 其他產(chǎn)品、服務(wù)和軟件的改進(jìn),或以上任何組合?!?/p>

Adobe

今年 6 月初,Adobe 因在其隱私政策中加入了一句關(guān)于自動(dòng)化的短語(yǔ),激怒了不少創(chuàng )作者,許多用戶(hù)將其解讀為與 AI 數據抓取有關(guān)。

「我們訪(fǎng)問(wèn)您的內容:我們可能會(huì )通過(guò)自動(dòng)和手動(dòng)方法訪(fǎng)問(wèn)、查看或聆聽(tīng)您的內容,但僅在有限的方式下,并且僅在法律允許的情況下?!?/p>

Adobe 公司的用戶(hù)對于數據被拿來(lái)用 AI 訓練比較敏感|NYT

這些條款影響了 Adobe 創(chuàng )意云套件的超過(guò) 2000 萬(wàn)用戶(hù),一些用戶(hù)認為這允許 Adobe 訪(fǎng)問(wèn)、查看他們的內容,包括受保密協(xié)議保護的作品。一些人認為 Adobe 正在監視他們的工作,吸收用戶(hù)的藝術(shù)作品,并可能將其用于訓練 AI 模型。

在用戶(hù)強烈反對后,Adobe 更新了服務(wù)條款,明確表示不會(huì )使用客戶(hù)作品訓練 AI。

Adobe 通過(guò)博客文章澄清,這些變更是為了檢測和刪除非法內容,例如兒童色情材料(CSAM),以及濫用內容或行為,包括垃圾郵件和網(wǎng)絡(luò )釣魚(yú)。Adobe 不會(huì )使用存儲在 Adobe 云上的文件來(lái)訓練其 Firefly AI。

02

提前占好「免責」的坑

不過(guò),巨頭們的小動(dòng)作,還是有監管在看著(zhù)的。

美國聯(lián)邦貿易委員會(huì )(FTC)長(cháng)期以來(lái)一直盯著(zhù)與公司隱私政策有關(guān)的欺騙性和不公平行為。過(guò)去曾起訴過(guò)那些以偷偷摸摸的方式更改隱私政策、破壞對消費者的現有承諾的公司。

今年 2 月,美國聯(lián)邦貿易委員會(huì )警告科技公司,改變隱私政策以追溯性地抓取舊數據可能是不公平或欺騙性的,將追究「悄悄」更改隱私政策以挖掘用戶(hù)數據用于 AI 的公司。

FTC 指出,公司可能會(huì )被誘惑從其用戶(hù)群中挖掘現有數據以供 AI 模型使用,有「強大的商業(yè)動(dòng)機」。FTC 稱(chēng)公司潛在的困境是利益沖突?!甘袌?chǎng)參與者應注意,任何背棄其用戶(hù)隱私承諾的公司都可能觸犯法律?!?/p>

不過(guò),就在上周,微軟 AI CEO Mustafa Suleyman 公開(kāi)稱(chēng)互聯(lián)網(wǎng)的公開(kāi)內容可以被免費拿來(lái)訓練 AI,如此直白的發(fā)言引起了強勢的輿論反彈。

從硅谷巨頭們在用戶(hù)使用條款中的改動(dòng)可以看出,各家確實(shí)都在利用產(chǎn)品優(yōu)勢,將用戶(hù)數據用于 AI 訓練之中。不過(guò),具體哪些數據會(huì )拿來(lái)訓練,哪些不能,行業(yè)內仍未達成一個(gè)共識——一項技術(shù)出現的早期,肯定會(huì )出現這種規則缺乏的「狂野西部」的階段。

而上述被動(dòng)作手腳的使用條款,無(wú)疑是巨頭們?yōu)橹竺庳熖崆罢嫉目?。不出意外的?huà),國內一種大廠(chǎng)和 AI 公司,應該也已經(jīng)在用戶(hù)條款中修改、添加了 AI 訓練的內容。

對于普通用戶(hù)而言,對于長(cháng)達數十頁(yè)的用戶(hù)使用條款,99% 都會(huì )直接無(wú)視。但是,如果這個(gè)產(chǎn)品,能通過(guò)有限的數據復制出一個(gè)「你」的時(shí)候,用戶(hù)是不是該更謹慎一些?(本文作者芯芯,來(lái)源于極客公園,Web3大佬已獲得作者授權、經(jīng)Web3大佬編輯發(fā)布,文中觀(guān)點(diǎn)為作者觀(guān)點(diǎn)、不代表Web3大佬觀(guān)點(diǎn)。)

收藏0

發(fā)表評論

訪(fǎng)客

看不清,換一張

◎歡迎參與討論,請在這里發(fā)表您的看法和觀(guān)點(diǎn)。
亚洲午夜av天堂_亚洲产国久久无码_亚洲欧美制服丝袜精品久久_91精品成人国产在线不卡