成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

看不下去AI胡說八道,英偉達出手給大模型安了個“護欄”

人工智能 新聞
這個大模型護欄工具已經開源,一起來看看它的效果和生成方法

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

大模型們胡說八道太嚴重,英偉達看不下去了。

他們正式推出了一個新工具,幫助大模型說該說的話,并回避不應該觸碰的話題。

這個新工具名叫“護欄技術”(NeMo Guardrails),相當于給大模型加上一堵安全圍墻,既能控制它的輸出、又能過濾輸入它的內容。

一方面,用戶誘導大模型生成攻擊性代碼、輸出不道德內容的時候,它就會被護欄技術“束縛”,不再輸出不安全的內容。

另一方面,護欄技術還能保護大模型不受用戶的攻擊,幫它擋住來自外界的“惡意輸入”。

圖片

現在,這個大模型護欄工具已經開源,一起來看看它的效果和生成方法。

防止大模型胡言亂語的三類“護欄”

根據英偉達介紹,目前NeMo Guardrails一共提供三種形式的護欄技術:

話題限定護欄(topical guardrails)、對話安全護欄(safety guardrails)和攻擊防御護欄(security guardrails)。

圖片

話題限定護欄,簡單來說就是“防止大模型跑題”。

大模型具備更豐富的想象力,相比其他AI更容易完成創造性的代碼和文字編寫工作。

但對于特定場景應用如寫代碼、當客服而言,至少用戶不希望它在解決問題時“脫離目標范圍”,生成一些與需求無關的內容。

這種情況下就需要用到話題限定護欄,當大模型生成超出話題范圍的文字或代碼時,護欄就會將它引導回限定的功能和話題上。

對話安全護欄,指避免大模型輸出時“胡言亂語”。

胡言亂語包括兩方面的情況。

一方面是大模型生成的答案中包括事實性錯誤,即“聽起來很有道理,但其實完全不對”的東西;

另一方面是大模型生成帶偏見、惡意的輸出,如在用戶引導下說臟話、或是生成不道德的內容。

攻擊防御護欄,即防止AI平臺受到來自外界的惡意攻擊。

這里不僅包括誘導大模型調用外部病毒APP從而攻擊它,也包括黑客主動通過網絡、惡意程序等方式攻擊大模型。護欄會通過各種方式防止這些攻擊,避免大模型癱瘓。

所以,這樣的護欄要如何打造?

如何打造一個大模型“護欄”?

這里我們先看看一個標準的“護欄”包含哪些要素。

具體來說,一個護欄應當包括三方面的內容,即格式規范(Canonical form)、消息(Messages)和交互流(Flows)。

首先是格式規范,即面對不同問題的問法時,規定大模型要輸出的內容。

例如被問到“XX文章是什么”,大模型必須給出特定類型的“文章”,而非別的東西;被問到“誰發表了什么”,大模型必須給出“人名”,而非別的回答。

圖片

然后是消息定義,這里以“用戶問候”話題為例,大模型可以輸出這些內容:

圖片

最后是交互流的定義,例如告訴大模型,怎么才是問候用戶的最好方式:

圖片

一旦問候用戶的機制被觸發,大模型就會進入這個護欄,規規矩矩地問候用戶。

具體工作流程如下:首先,將用戶輸入轉換成某種格式規范(canonical form),據此生成對應的護欄;隨后,生成行動步驟,以交互流指示大模型一步步完成對應的操作;最后,根據格式規范生成輸出。

圖片

類似的,我們就能給大模型定義各種各樣的護欄,例如“應對用戶辱罵”的護欄。

這樣即使用戶說出“你是個傻瓜”,大模型也能學會冷靜應對:

圖片

目前,英偉達正在將護欄技術整合進他們的AI框架NeMo中,這是個方便用戶創建各種AI模型、并在英偉達GPU上加速的框架。

對“護欄”技術感興趣的小伙伴們,可以試一試了~

開源地址:
https://github.com/NVIDIA/NeMo-Guardrails

責任編輯:張燕妮 來源: 量子位
相關推薦

2015-05-08 07:36:36

Google App 云割據

2018-07-21 14:32:58

無限流量套餐網絡

2023-11-14 08:15:49

OptionalJava

2021-07-31 07:09:22

谷歌安卓App

2021-12-21 08:12:01

Web JavaScriptCSS

2025-02-03 00:00:10

2024-01-26 15:28:29

大模型MambaLeCun

2023-04-11 14:32:25

騰訊面試Chunk

2009-06-29 13:28:18

PHP小組PHP技巧網站加速

2023-04-02 18:00:56

2023-02-12 19:40:17

2013-05-20 16:30:37

移動應用App推廣

2023-10-26 23:55:46

數據模型

2014-09-28 10:09:28

2015-05-18 09:27:19

2023-11-18 09:30:42

模型AI

2024-06-20 13:19:48

2023-06-16 09:49:11

人工智能研究

2020-10-13 06:52:50

數據倉庫項目

2025-02-13 11:02:12

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品91久久| 久久成人国产精品 | 国产在线一区二 | 一区二区高清 | 黄色大片在线播放 | 中文字幕在线一区二区三区 | 国产成人精品一区二区三区四区 | 黄色一级视频 | 一区二区视频免费观看 | a级片播放 | 香蕉视频在线播放 | hsck成人网| 国产午夜精品一区二区三区嫩草 | 6080亚洲精品一区二区 | 国产精品视频一区二区三区 | 91亚洲国产成人久久精品网站 | 二区中文字幕 | 免费一级做a爰片久久毛片潮喷 | 国产亚洲人成a在线v网站 | 久久久精品一区 | www.亚洲精品 | 色综合天天天天做夜夜夜夜做 | 日本福利片 | 日韩免费福利视频 | 成人在线一级片 | 欧美在线观看一区 | 欧美激情精品久久久久久变态 | 亚洲一区视频在线 | 在线观看成人免费视频 | 网址黄| 日韩免费网站 | 玖玖玖在线| 日韩综合网 | 国产在线观看一区二区三区 | 古装人性做爰av网站 | 日韩欧美国产精品综合嫩v 一区中文字幕 | 色婷婷在线视频 | 男女羞羞的网站 | 国产1区2区3区 | 久久精品91久久久久久再现 | 久久综合狠狠综合久久 |