成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AWS自動推理負責(zé)人:與其解決AI幻覺,不如證明是否正確;Rust借用檢查器實際上就是一個推理引擎

原創(chuàng) 精選
人工智能
“從某種意義上說,幻覺是一件好事,因為它是創(chuàng)造力。但在語言模型生成過程中,其中一些結(jié)果將是不正確的,“他說。“但是,根據(jù)誰的定義是錯誤的呢?事實證明,定義真理是什么,出奇地困難。即使在您認為每個人都應(yīng)該同意的領(lǐng)域。”

編輯 |  言征

出品 | 51CTO技術(shù)棧(微信號:blog51cto)

AI 的一個顯著缺陷是它會不自知地“產(chǎn)生幻覺”,編造沒有真實數(shù)據(jù)依據(jù)的合理答案。

AWS 正試圖通過解決這個問題,一個不錯的路徑是:引入 Amazon Bedrock 自動推理檢查。

Amazon Bedrock 是一項面向生成式 AI 應(yīng)用程序的托管服務(wù)。

上個月,AWS 首席執(zhí)行官 Matt Garman 在拉斯維加斯的 re:Invent 大會上發(fā)表講話時表示,這些檢查“可以防止由于模型幻覺而導(dǎo)致的事實錯誤......Bedrock 可以檢查模型所做的事實陳述是否準(zhǔn)確。

他說,這一切都基于“合理的數(shù)學(xué)驗證”。如何理解這句話?他們背后隱藏著什么?

AWS 首席執(zhí)行官 Matt Garman 介紹了 Bedrock 的自動推理AWS 首席執(zhí)行官 Matt Garman 介紹了 Bedrock 的自動推理

AWS 自動推理小組的負責(zé)人 Byron Cook 近日在采訪中透露更多詳細的思考。

1.與其解決AI幻覺,不如證明是否正確

“我一直在正式推理和工具領(lǐng)域工作。大約從 10 年前開始,我就將這種功能引入 Amazon,然后 AI 也有一些應(yīng)用。現(xiàn)在突然之間,我所在的區(qū)域,以前非常晦澀難懂,突然變得不朦朧了。

如何減輕 AI 幻覺帶來的風(fēng)險,問題是可以解決的嗎?

“從某種意義上說,幻覺是一件好事,因為它是創(chuàng)造力。但在語言模型生成過程中,其中一些結(jié)果將是不正確的,“他說。

“但是,根據(jù)誰的定義是錯誤的呢?事實證明,定義真理是什么,出奇地困難。即使在您認為每個人都應(yīng)該同意的領(lǐng)域。”

“我曾在航空航天、鐵路調(diào)車、操作系統(tǒng)、硬件、生物學(xué)等領(lǐng)域工作過,在所有這些領(lǐng)域中,我所看到的是,在構(gòu)建這類工具時,大部分時間都花在了領(lǐng)域?qū)<业臓幷撝校瑺幷撜_的答案應(yīng)該是什么,這些例子是由出現(xiàn)和打擊極端情況的具體例子驅(qū)動的。”

庫克補充道:“另一件事是,有些問題是無法決定的。例如,圖靈已經(jīng)證明了這一點。沒有程序可以始終、權(quán)威地、在有限的時間內(nèi)以 100% 的準(zhǔn)確率回答問題。”

如果你嘗試將所有陳述的領(lǐng)域分塊,有些是相對正式的,而另一些則不是。什么是好的音樂將很難正式化,人們可能對此有一些理論,但他們之間可能不同意。

其他領(lǐng)域就像生物學(xué)一樣,有生物系統(tǒng)如何運作的模型,但他們所做的部分工作是獲取這些模型,然后檢查真實的系統(tǒng)。他們正在努力改進模型,所以模型可能是錯誤的。在這些警告下,你可以做很多事情。

AWS 自動推理小組負責(zé)人 Byron CookAWS 自動推理小組負責(zé)人 Byron Cook

Cook 介紹了 Automated Reasoning 工具,并引用了示例案例,例如根據(jù)個人的損益表確定正確的稅碼。

他說,該工具“采用自然語言中的陳述并將其轉(zhuǎn)化為邏輯,然后證明或反駁該領(lǐng)域下的有效性。”

通過工具研究模型“怎么會出錯”,比如:從自然語言到邏輯的翻譯有可能出錯,此外,人們決定什么是稅法并將其正式化也可能會出錯。因此,我們?nèi)匀挥锌赡艿玫藉e誤的答案,但在假設(shè)我們翻譯正確的情況下,在我們幫助客戶正式定義 [規(guī)則] 的假設(shè)下,我們可以在數(shù)學(xué)邏輯中構(gòu)建一個被證明是正確的論點,即他們得到的答案是正確的

庫克說,幻覺“是我們必須長期忍受的問題。畢竟人類也會產(chǎn)生幻覺......作為一個社會,我們總是在逐漸研究什么是真理,我們?nèi)绾味x它,以及誰來決定它是什么。

庫克還對一個著名的 AI 幻覺案例發(fā)表評論,這位律師引用了 OpenAI 的 ChatGPT 發(fā)明的案例。庫克說,這并不完全是自動推理工具所能解決的那種幻覺。“我們可以建立一個包含所有已知 [法律案件] 結(jié)果的數(shù)據(jù)庫,并將其正式化,”他說。“我不確定這是否是最好的應(yīng)用程序。”

圖片圖片

2.不適用于編程,但有利于開發(fā)者防御性編程

開發(fā)者們的問題是:這個自動推理工具能否為幫他們檢查生成的算法代碼是否正確?

“這個產(chǎn)品不是為程序員設(shè)計的,”Cook 說。“但它并沒有逃過我們的注意。實際上我們一直在做對代碼進行推理......25 年來,我一直在證明程序是正確的。這是擁有重資產(chǎn)的巨頭企業(yè)的領(lǐng)域,因為這樣做非常具有挑戰(zhàn)性。但生成式 AI 似乎已經(jīng)準(zhǔn)備好能夠顯著降低這一進入門檻,幫助開發(fā)者正式確定想要證明的程序是什么。這非常令人興奮,但這不包括“自動推理”產(chǎn)品。

Cook 的團隊還在 Amazon 解決了其他問題,例如證明訪問控制策略按預(yù)期工作,以及類似的加密、聯(lián)網(wǎng)、存儲和虛擬化。事實證明,“證明代碼在數(shù)學(xué)上是正確的”有一個好的副作用,其中之一就是代碼效率更高。

“當(dāng)你有一個自動推理工具來檢查你的家庭作業(yè)時,你可以更積極地進行優(yōu)化。當(dāng)開發(fā)人員沒有這種能力時,他們所做的是相當(dāng)保守的,如果你愿意,可以稱之為防御性編碼。使用這些工具,他們可以執(zhí)行對他們來說非常可怕的優(yōu)化。我們給他們很多安全。

3.Rust的借用檢查器本質(zhì)上就是一個推理引擎

他補充說,Rust 是可證明編程的天作之合。“當(dāng)你用 Rust 編程時,你實際上是在用定理證明器。很多人并不清楚程序員實際上已經(jīng)開始了‘做內(nèi)存安全的證明’,而 Rust 中的借用檢查器本質(zhì)上是一個演繹定理證明器。它是一個推理引擎。開發(fā)人員正在指導(dǎo)該工具完成這一過程。

Rust 可以比 C 更快,原因是它能夠用內(nèi)存做一些他們在 C 中做不到的聰明事情,當(dāng)然在 Java 或其他語言中也做不到,因為他們已經(jīng)讓程序員去做正確性地證明

“所以 Rust 是自動推理技術(shù)、類型系統(tǒng)、編譯器的非常聰明的集成,然后它們有非常好的錯誤消息,使該工具非常有用。因此,我們已經(jīng)看到某些類型的程序遷移到 Rust 后取得了很好的結(jié)果。 

想了解更多AIGC的內(nèi)容,請訪問:

51CTO AI.x社區(qū)

http://www.ekrvqnd.cn/aigc/

責(zé)任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2020-12-01 10:56:37

Rust編程AWS

2013-02-26 09:53:19

2019-09-16 13:14:37

數(shù)據(jù)科學(xué)家模型職業(yè)

2021-05-20 08:52:59

蘋果軟件MacOS系統(tǒng)惡意軟件

2012-12-13 11:12:24

戴爾

2014-12-22 13:14:48

IE離職

2021-02-04 10:22:32

前端開發(fā)技術(shù)

2019-07-29 15:24:34

CEO技術(shù)負責(zé)人加班

2009-07-16 08:19:46

魔獸網(wǎng)易

2015-11-16 10:16:56

技術(shù)蛻變創(chuàng)業(yè)

2014-05-21 16:04:38

面試面試規(guī)則

2021-03-03 13:55:42

人工智能知識圖譜

2024-02-19 00:21:45

開源圖片

2018-10-24 17:50:42

備份

2024-03-07 09:59:00

2013-04-17 10:56:10

ONFOpenDayligh標(biāo)準(zhǔn)協(xié)議

2015-06-17 15:54:42

2011-12-28 15:16:33

Sencha開發(fā)者負責(zé)人

2012-03-11 15:35:53

Android
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 亚洲欧美第一视频 | 午夜影院 | 久久99深爱久久99精品 | 97人人澡人人爽91综合色 | 国产精品久久久久久久久免费樱桃 | 中文字幕一级毛片视频 | 四虎影院在线免费观看 | 亚洲一区二区三区视频 | 国产成人综合久久 | 欧美视频精品 | 成人福利网| 午夜精品久久久久久久久久久久 | 99re视频 | 天天射视频 | 91看片免费版 | 欧美一区二区三区在线观看视频 | 国产一区二区在线免费视频 | 精品福利一区二区三区 | 欧美高清dvd| 久久久久国产一级毛片高清网站 | 91精品国产综合久久久久久首页 | 国产福利在线 | 国产精品777一区二区 | 欧美日韩综合视频 | 欧美精品一区二区三区在线 | 久久久久久国产精品免费免费男同 | 九九色综合 | 久热电影 | 美女视频黄色的 | 亚洲欧洲一区 | 国产精品国产亚洲精品看不卡15 | 国产美女在线观看 | 一区二区久久精品 | 国产精品国产三级国产aⅴ原创 | 久久69精品久久久久久国产越南 | 国产精品久久一区二区三区 | 国产成人一区二区三区 | 国产网站在线播放 | 国内精品久久久久 | 99视频网站 | 国产精品久久久久一区二区 |