成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI 現允許網站阻止其網絡爬蟲抓取數據,避免數據被用于訓練 AI 模型

人工智能
網絡爬蟲是一種自動化的程序,可以在互聯網上搜索和獲取信息。OpenAI 的網絡爬蟲名為 GPTBot,其會以一定的頻率訪問各種網站,并將網頁內容保存下來,用于訓練 GPT 模型。

8 月 8 日消息,OpenAI 旗下 GPT 模型的訓練需要大量的網絡數據,這可能涉及到數據隱私和版權等問題。為了解決這些問題,OpenAI 最近推出了一個新功能,讓網站可以阻止其網絡爬蟲(web crawler)從其網站上抓取數據訓練 GPT 模型。

據IT之家了解,網絡爬蟲是一種自動化的程序,可以在互聯網上搜索和獲取信息。OpenAI 的網絡爬蟲名為 GPTBot,其會以一定的頻率訪問各種網站,并將網頁內容保存下來,用于訓練 GPT 模型。

OpenAI 在其博客文章中表示,網站運營者可以通過在其網站的 Robots.txt 文件中禁止 GPTBot 的訪問,或者通過屏蔽其 IP 地址,來阻止 GPTBot 從其網站上抓取數據。OpenAI 還表示,“使用 GPTBot 用戶代理(user agent)抓取的網頁可能會被用于改進未來的模型,并且會過濾掉那些需要付費訪問、已知收集個人身份信息(PII)、或者有違反我們政策的文本的來源。”對于不符合排除標準的來源,“允許 GPTBot 訪問您的網站可以幫助 AI 模型變得更加準確,并提高它們的通用能力和安全性。”

但是,這并不會追溯性地從 ChatGPT 的訓練數據中刪除之前從網站上抓取的內容。

互聯網為大型語言模型(如 OpenAI 的 GPT 模型和谷歌的 Bard)提供了大部分的訓練數據,為 AI 訓練獲取數據已經變得越來越有爭議。一些網站,包括 Reddit 和 Twitter,已經采取措施打擊 AI 公司免費使用其用戶帖子的行為,而一些作者和其他創作者也因為涉嫌未經授權使用其作品而提起訴訟。

責任編輯:姜華 來源: IT之家
相關推薦

2023-11-10 07:11:02

OpenAIAI

2023-10-07 08:01:11

2023-08-08 14:17:58

OpenAI模型

2023-12-28 17:51:00

AI技術

2023-09-29 08:41:47

谷歌Vertex AI

2013-01-06 10:38:33

網絡管理信息數據

2023-03-31 15:12:33

ChatGPTOpenAI谷歌

2023-08-20 12:16:39

人工智能OpenAI

2024-04-30 09:33:00

JavaScriptPythonexecjs

2024-01-16 10:20:30

網絡安全OpenAIAI

2023-06-05 10:05:39

谷歌AI

2023-07-25 09:55:00

AI圖像

2023-11-27 08:51:46

PythonRequests庫

2022-09-19 15:37:51

人工智能機器學習大數據

2023-07-13 23:11:43

2023-12-19 07:24:37

2024-01-17 16:10:02

OpenAIAI

2023-08-08 08:25:18

2024-05-09 10:51:44

AI 模型OpenAI人工智能

2013-03-15 10:24:30

大數據商業價值
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人日韩av | 欧美国产精品一区二区三区 | 午夜精品久久久久久不卡欧美一级 | 狠狠操狠狠操 | 91色视频在线观看 | 一区二区三区在线免费观看 | 国产精品一级 | 久久ww| 2020天天操| 古典武侠第一页久久777 | 成人网在线观看 | 欧美日韩一 | 中文字幕av在线一二三区 | 国产精品久久99 | 黄色大全免费看 | 久久国产精品免费一区二区三区 | 国产第一页在线观看 | 天天干天天草 | 玖玖免费| 性色视频在线观看 | av色站 | 色综合久久天天综合网 | 亚洲精品自在在线观看 | 美女视频一区二区三区 | 国产亚洲精品久久19p | 日本aaaa | 久久久女女女女999久久 | 国产黄色av电影 | 日韩在线观看中文字幕 | 久久免费精品 | 日本激情一区二区 | 亚洲视频一区在线 | 超碰人人人 | 欧美精品久久 | 精品国产一级 | 欧美一区二区三区日韩 | 国产免费一区二区三区 | 美女视频h| 国产成人免费视频网站高清观看视频 | 高清人人天天夜夜曰狠狠狠狠 | 国产精品久久av |