GPT-3 Playground:可以為人們寫作的人工智能
譯文譯者 | 李睿
審校 | 重樓
人們如今在談到人工智能時,主要有兩種觀點:有些人認為人工智能最終將超越人類智能,而另外一些人則認為人工智能將永遠為人類服務。然而,有一件事雙方都一致認同:其發展速度越來越快。
雖然人工智能目前仍處于發展的早期階段,但它有可能徹底改變人類與技術互動的方式。
而一個簡單而籠統的描述是,人工智能是一個對計算機進行編程以自行做出決策的過程。這可以通過多種方式實現,但最常見的是通過使用人工智能算法。算法是一組可以用來解決問題的規則或指令。在人工智能的例子中,算法被用來教會計算機如何做出決策。
在過去,人工智能主要用于完成簡單的任務,例如下棋或解決數學問題。然而,人工智能現在被用于更復雜的任務,例如面部識別、自然語言處理,甚至自動駕駛。隨著人工智能技術的不斷發展,沒有人知道它在未來會有什么能力。隨著人工智能能力的迅速擴展,了解它是什么,它是如何工作的,以及它的潛在影響非常重要。
人工智能的好處是巨大的。憑借自主決策的能力,人工智能有潛力提高各行業的工作效率,并為人們提供更多的機會。本文將主要討論GPT-3。
GPT-3是什么?它從何而來?
GPT-3是由OpenAI公司創建的生成式人工智能。OpenAI公司是一家總部位于舊金山的開創性人工智能研究機構,該公司將其目標定義為“確保人工智能造福全人類”。他們創造人工智能的愿景是明確的:GPT-3是一種不局限于特定任務,而是像人類一樣執行各種任務的人工智能。
幾個月前,OpenAI公司向所有用戶發布了GPT-3這一新的語言模型。GPT-3是“Generative Pretrained Transformer 3”的簡稱,由名稱為提示符的前提生成文本組成。簡單地說,它可以被稱為高級的“自動補全”。例如,人們可以就任何給定的主題提供兩到三個句子,GPT-3將完成其余的工作,還可以生成對話,將基于前面的問題和答案的語境提供答案。
需要強調的是,GPT-3提供的每個答案都只是一種可能,因此它不會是唯一的答案。此外,如果對同一個前提進行多次測試,可能會得到不同的答案甚至相互矛盾的答案。因此,它是一個基于先前所說的內容以返回答案的模型,并將其與人們所知道的一切聯系起來,以獲得最有意義的答案。這意味著它沒有義務采用真實的數據給出答案,這是人們必須考慮到的事情。這并不意味著人們不能向它提供所做的一些工作的數據并談論它,但總是有必要對這些信息進行對比。語境越好,得到的答案就越好,反之亦然。
OpenAI公司的GPT-3語言模型之前已經進行了訓練,其訓練包括學習互聯網上的大量信息。GPT-3得到了所有公共書籍、維基百科以及互聯網上數百萬網頁和科學論文的支持。簡而言之,它吸收了人類歷史上在Web上發布的最重要的人類知識。
在閱讀和分析這些信息之后,這個語言模型在一個768GB的模型中創建了連接,該模型采用48個16GB顯存的GPU。就像人們理解的那樣,之前的OpenAI模型GPT-2的顯存總和為40GB,并且分析了4500萬個網頁。但二者之間的差異是巨大的,因為GPT-2有15億個參數,GPT-3有1750億個參數。
以下做一個測試。要求GPT-3定義它自己,其結果如下:
如何在GPT-3 Playground上使用它
為了能夠使用GPT-3并進行測試,用戶要做的唯一一件事就是訪問他們的網站,注冊并添加通常在注冊中使用的個人信息。在其中一部分,它會問用戶將使用這個GPT-3做什么,對于這些例子,選擇了個人使用選項。
專家為此指出的是,從使用經驗來看,使用英語的效果要好一些。這并不意味著它在其他語言中表現得很糟糕。事實上,在西班牙語中,GPT-3表現得很好,但有些人更喜歡它采用英語提供的結果,這就是為什么從現在開始展示的測試和結果是使用西班牙語的原因。
當用戶第一次采用GPT-3時,就會得到一份免費的贈品。一旦用戶注冊了電子郵箱和電話號碼,將會獲得18美元免費的消費額。雖然看起來不多,但事實上18美元提供的服務并不少。例如采用人工智能測試5個小時,而其費用為1美元。稍后將會解釋價格以便更好地理解這個問題。
一旦進入網站,通常會進入GPT-3 Playground部分。所有的奇跡都將在這里發生。
提示+提交
首先,在網絡上最突出的是大文本框。這是可以開始向人工智能輸入提示(這些是請求或指令)的地方。這就像輸入一些內容一樣簡單,在本例中是提出的一個問題,然后點擊下面的提交按鈕,讓GPT-3回答并寫下所要求的內容。
預設
預設是針對不同任務的現成預置。它們可以在文本框的右上角找到。如果點擊其中的幾個,“更多示例”將打開一個新屏幕,在那里將獲得整個列表。當選擇預設時,文本區域的內容將更新為默認文本。右側邊欄中的設置也會更新。例如,如果要使用“語法糾正”預設,應該遵循以下結構,以獲得最好的結果。
模型
用于訓練GPT-3的大量數據集是它如此強大的主要原因。然而,數據集更大并不總是意味著更好。出于這些原因,OpenAI提供了四種主要模型。雖然還有其他的模型,但建議使用最新的版本,現在就要討論這些模型。
這四個可用的模型稱為Davinci、Babbage、Curie和Ada。在這四個模型中,Davinci是最大和功能最強大的模型,因為它可以執行其他智能引擎可以執行的任務。
以下將概述每個模型以及可能最適合每個模型的任務類型。然而請記住,雖然較小的模型可能無法使用那么多的數據進行訓練,但它們仍然是通用模型,對于某些任務來說,它們非常可行且成本更低。
(1)Davinci
如上所述,它是最有能力的模型,可以做任何其他模型可以做的所有事情,通常需要更少的指令。Davinci能夠解決邏輯問題,確定因果關系,理解文本意圖,產生創造性的內容,解釋人物動機,并處理復雜的總結性任務。
(2)Curie
這種模型試圖平衡智能引擎的動力和速度。它可以做到Ada或Babbage可以做的任何事情,但它也能夠處理更復雜的分類任務和更細致的任務,例如總結、情感分析、聊天機器人應用程序和問答。
(3)Babbage
Babbage的能力比Ada稍強,但效率不如Ada。它可以執行與Ada相同的所有任務,但也可以處理稍微復雜一些的分類任務,并且非常適合用于對文檔與搜索查詢匹配程度進行分類的語義搜索任務。
(4)Ada
最后,Ada通常是最快和最便宜的模型。它最適合于細微差別較小的任務,例如解析文本、重新格式化文本和更簡單的分類任務。為Ada提供的語境越多,它的性能就越好。
引擎
可以調整其他參數以獲得對提示的最佳響應,這些參數低于最重要的參數之下。沒錯,就是模型。以下來解釋一些看起來最有趣的事情。
控制GPT-3引擎輸出的最重要的設置之一是溫度。這個設置控制生成文本的隨機性。值為0使引擎具有確定性,這意味著它總是為給定的文本輸入生成相同的輸出。值為1會讓引擎承擔最大的風險,并使用大量的創造力。
人們可能注意到,在能夠運行的一些測試中,GPT-3停在句子的中間。要控制允許生成的文本的最大數量,可以使用代幣中指定的“最大長度”設置。稍后會解釋這個代幣是什么。
“Top P”參數是控制GPT-3生成文本的隨機性和創造性的另一種方法,但在這種情況下,它與概率范圍內的標記(單詞)有關,這取決于將其放置在哪里(0.1將是10%)。OpenAI文檔建議在Temperature和Top P之間只使用一個函數,因此在使用其中一個函數時,請確保另一個函數設置為1。
另一方面,有兩個參數來懲罰GPT-3給出的答案。其中之一是“頻率懲罰”,它控制著模型重復預測的趨勢。它還降低了已經生成的單詞的概率,這取決于一個單詞在預測中已經出現了多少次。
第二種懲罰是“存在懲罰”。“存在懲罰”參數鼓勵模型做出新穎的預測。如果某個單詞已經出現在預測文本中,則出現懲罰會降低該單詞出現的概率。與“頻率懲罰”不同,出現次數的懲罰并不取決于單詞在過去的預測中出現的頻率。
最后,有一個“Bestof”參數,它為查詢生成幾個答案。然后Playground選擇最好的發送給用戶。GPT-3本身警告人們,這將對提示符生成多個補全,這可能導致花費比人們想象還要多的代幣。
歷史
為了完成本節,“提交”按鈕旁邊的第三個圖標將展示對GPT-3的所有請求的歷史記錄。這樣,如果用戶不記得曾經使用的提示符,將會得到非常好的響應,這讓它變得更容易。
成本和代幣
一旦免費的服務結束,GPT-3為用戶提供了一種繼續使用其平臺的方式,它不是任何形式的每月訂閱或類似的事情。其價格與它的用途直接相關。換句話說,人們將通過代幣收費。這是一個用于人工智能的術語,與產出的成本有關。標記可以是任何事物,從字母到句子。因此,很難確切地知道每次使用人工智能服務的價格。但考慮到它們通常是幾美分,只需稍微嘗試一下,很快就會看到每次使用服務的價格。
雖然OpenAI公司只展示了十幾個GPT-3的使用示例,但可以看到每個GPT-3上使用的代幣,以更好地了解其工作原理。
以下是它們各自的版本和價格:
為了了解一定數量的單詞可能會花費多少費用,或者給一個代幣如何工作的示例,使用了以下名為Tokenizer的工具。
這表明GPT模型家族使用標記處理文本,標記是文本中常見的字符序列。模型理解這些代幣之間的統計關系,并在這些代幣序列中的下一個代幣的生產中被選擇。
最后,這是一個非常低的水平,所以可以用別的例子來看看同一個例子會花費多少代幣。
結論
從專家的角度來看,它是用戶必須知道如何正確使用的一個工具。正如以上所提到的,GPT-3不必為用戶提供正確的數據。這意味著,如果想用它來開展工作、回答某些問題或做作業,就必須給人工智能一個良好的語境(提示),這樣的結果才真正接近想要的結果。
有些人可能會擔心的一件事是,這是否會改變教育行業,或者當前存在的某些與寫作有關的工作是否會消失。這是有可能發生的,因為有些工作遲早都會被人工智能取代。這個例子是關于與寫作相關的人工智能,但它們存在于編程、繪圖、音頻等領域。
另一方面,它為許多工作和項目提供了很多可能性,無論是個人的還是專業的。例如,你曾經想過寫一個恐怖故事嗎?在找到語法檢查器的例子列表中,有一個專門的語法檢查器。
綜上所述,人工智能現在正處在早期版本,這個世界仍然有很多事物可以發展和提供。人們可以學習如何使用,并對其進行訓練,以提供最佳的響應。
原文標題:GPT-3 Playground: The AI That Can Write for You,作者:Isaac Alvarez