成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI:ChatGPT將遵守爬蟲協議,網站可拒絕白嫖

人工智能
UA是瀏覽器的身份標識,包含了訪問者的系統環境、瀏覽器內核版本、語言等諸多信息。通過HTML的標簽,可以阻止特定的瀏覽器對網頁內容進行訪問。

不希望網站數據被ChatGPT白嫖?現在終于有辦法了!

兩行代碼就能搞定,而且是OpenAI官方公布的那種。

剛剛,OpenAI在用戶文檔中更新了GPTBot的說明。

根據這一說明,內容擁有者將可以拒絕網站數據被ChatGPT的爬蟲抓取。

這是繼暫停網頁訪問功能之后,OpenAI在版權和隱私保護方面的又一重大舉措。

圖片圖片

不過,OpenAI還是希望能內容擁有者將訪問權限開放給GPTBot。

在這份關于GPTBot的說明中,OpenAI表示:

允許我們的爬蟲訪問你的數據有利于使AI模型更精確、更安全。

圖片

但至少,站主們擁有了選擇的權利。

不過,也有網友指出了問題:

模型早就已經訓練好了,現在提這個還有什么用?

圖片圖片

對此OpenAI尚未作出解釋,我們還是先來看看這次的措施。

三種方式阻止GPT爬蟲

那么,OpenAI都公布了哪些內容呢?

首先是GPTBot的U(ser)A(gent)信息。

User agent token: GPTBot
Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)

UA是瀏覽器的身份標識,包含了訪問者的系統環境、瀏覽器內核版本、語言等諸多信息。

通過HTML的標簽,可以阻止特定的瀏覽器對網頁內容進行訪問。

在這份說明文檔中,OpenAI還提供了更簡單的爬蟲阻止方式,即修改robots.txt。

只要在網站的robots.txt中加入如下內容:

User-agent: GPTBot
Disallow: /

這樣,GPTBot將不會訪問你的網站進行內容抓取。

如果只想禁止GPT抓取部分內容,也可以利用robots.txt進行設置。

和上面的內容相似,分別寫明允許和不允許訪問的目錄即可。

User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/

其中Allow的優先級更高,也就是說當Allow的目錄是Disallow目錄的子目錄時,會被允許訪問。

此外,OpenAI還公布了爬蟲機器人的ip地址。

如果實在是對爬蟲不放心,可以設置禁止有關ip對網站的訪問。

圖片圖片

什么是robots.txt

上面提到的robots.txt是什么,為什么它能阻止GPT的爬蟲?

這其實是一種用戶協議,站主可以在其中設置禁止訪問網站的爬蟲或禁止爬蟲抓取的內容。

根據這一協議,即使在有能力訪問的情況下,爬蟲遇到相關內容都會主動選擇避開。

ChatGPT自身也在使用robots.txt,阻止爬蟲抓取除了用戶分享之外的其他內容。

圖片圖片

其實,在AI盛行之前,這項協議就已經存在,當時主要是用于限制搜索引擎。

這也正是我們無法在搜索引擎中搜到微信公眾號文章的原因。

圖片圖片

這是一項君子協定,不過大多數廠商都會選擇遵守,因為這體現了對行業規則和用戶隱私的尊重。

如今,OpenAI也加入了這一行列。

One More Thing

與此同時,Google的爬蟲正在全網抓取內容。

不過,網友對此似乎有更高的容忍度:

至少Google是鏈接到你的網站,但ChatGPT用了你的內容之后根本不會進行說明。

圖片圖片

你認為在提高模型質量和保護創作者之間該如何找到平衡點呢?

參考鏈接:

[1]https://platform.openai.com/docs/gptbot
[2]https://www.theverge.com/2023/8/7/23823046/openai-data-scrape-block-ai
[3]https://news.ycombinator.com/item?id=37030568

責任編輯:武曉燕 來源: 量子位
相關推薦

2023-07-05 13:34:57

ChatGPTOpenAI生產者

2023-06-13 23:13:40

ChatGPT人工智能語言模型

2025-01-20 15:22:55

2023-09-29 08:41:47

谷歌Vertex AI

2023-07-05 14:13:16

ChatGPT聯網模式

2023-05-08 08:35:36

2025-03-05 11:23:44

2025-01-02 15:22:10

CertdSSL證書開發

2023-08-07 18:23:50

OpenAIChatGPT

2023-08-07 09:59:46

OpenAIGPT-5人類語音

2024-01-17 09:48:21

2023-06-13 14:05:56

ChatGPT數據

2025-01-22 12:37:21

2023-05-12 09:59:51

人工智能谷歌

2023-10-23 15:27:09

OpenAIChatGPT

2023-04-18 14:31:17

ChatGPT

2022-01-10 15:58:03

開源技術 軟件

2010-07-05 10:01:27

2023-06-21 13:21:49

2023-12-27 10:44:01

微軟Windows
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产在线www| 人人爽人人草 | 精品一区二区三区在线视频 | 国产亚洲网站 | 成人在线一区二区三区 | 国产精品爱久久久久久久 | 免费观看一级毛片视频 | 一区二区三区中文字幕 | 亚洲天堂av一区 | 欧美日韩精品久久久免费观看 | 在线亚洲人成电影网站色www | 在线日韩欧美 | 午夜影院 | 国产精品一级在线观看 | 久久中文网 | 中文字幕在线观看第一页 | 亚洲视频www| 欧美日韩成人影院 | 国产成人一区二区三区精 | 国产在线观看一区二区 | 久久99精品久久久久久国产越南 | 欧美日一区 | 欧美成人二区 | 日韩成人 | 国产精品夜夜春夜夜爽久久电影 | 中文字幕在线观看一区 | 精品亚洲一区二区三区 | 天天干天天操天天射 | 亚洲高清视频一区 | 久久久久亚洲 | 在线观看中文字幕 | 精彩视频一区二区三区 | 丁香一区二区 | 亚洲精品久久久久国产 | 高清一区二区 | 成年人视频在线免费观看 | 亚洲一区二区日韩 | 成人h视频在线观看 | 成人一级片在线观看 | 欧美一级特黄aaa大片在线观看 | 国产精品久久影院 |