轉載》Google 更新隱私政策，明確指出：將蒐集公開資訊訓練 AI！

文章出處：Google 更新隱私政策，明確指出：將蒐集公開資訊訓練 AI！ – INSIDE

Google 在 7/1 公布了新的隱私政策，明確表示蒐集網路公開資訊用來訓練 AI。

在「可公開存取的來源」這一項，Google 是這麼寫的：

「舉例來說，我們可能會蒐集網路上的公開資訊或其他公開來源中的資訊，⽤於訓練 Google 的 AI 模型及開發 Google 翻譯、Bard 和 Cloud AI 等功能。或者，如果您的商家資訊出現在某個網站上，我們也可能會將該資訊編⼊索引，並顯⽰在各項 Google 服務中。」

之前在 2022 年 12 月的版本中，這一段還僅是「用於訓練 Google 的語言模型」，這次則是把語氣加強，直接使用「AI」人工智慧一詞。眾所皆知，大型語言模型需要非常大量的文本資料訓練而成，像 OpenAI 之前就透過 API 取得 Twitter 與其他社群的大量對話來訓練出 ChatGPT；如果 Google 真有心要讓 Bard 或其他 AI 模型超越 GPT-3、GPT-4，那麼資料量是必要更龐大、多元。

通常一般網路公司的隱私政策只會表明這間公司會用上經過使用者同意後直接提供的資料；雖說 Google 已經把「可公開存取的來源」這條列出行之有年，但這條政策也有另一層意味：儘管任何人都可以看到網路公開發布的任何內容，但資料的使用方式本身也正在變化，重點已經從誰可以看到資料，變成如何利用資料。

而能極大量地吞吐、分析資料的，大概也只有像 Google、微軟、Meta 這一類大型科技公司。對一般使用者來說，似乎也得更深思熟慮決定他們在網路上公開分享的內容，並意識到這些公開發文可能會被難以想像的方式利用。

- ads -