成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

數據管理對生成式人工智能的影響

人工智能
我們需要更好的法規和標準來實施這些新的人工智能技術。但是對于數據治理和數據管理的重要作用卻缺少討論,因為這在企業采用和安全使用人工智能方面可以發揮關鍵作用。

       2023年將是我們記住的人工智能時代的主流開端,由每個人都在談論的技術:ChatGPT推動。

  像ChatGPT這樣的生成式人工智能語言模型已經抓住了我們的想象力,因為我們第一次能夠看到人工智能像真人一樣與我們對話,并生成散文、詩歌和其他我們認為有創意的新內容。生成式人工智能解決方案似乎充滿了突破性的潛力,可以實現更快、更好的創新、生產力和實現價值的時間。然而,它們的局限性尚未得到廣泛理解,它們的數據隱私和數據管理最佳實踐也尚未得到廣泛理解。

  最近,由于缺乏對人工智能技術使用的理解和足夠的監管護欄,技術和安全界的許多人都敲響了警鐘。我們已經看到人們對人工智能工具輸出的可靠性、知識產權和敏感數據泄露以及侵犯隱私和安全的擔憂。

  在這家科技巨頭無意中將自己的秘密泄露給ChatGPT后,三星與ChatGPT的事件成為頭條新聞。三星并不是唯一這樣做的公司:Cyberhaven的一項研究發現,4%的員工曾將敏感的公司數據輸入大型語言模型。許多人沒有意識到,當他們用企業數據訓練模型時,人工智能公司可能能夠在其他地方重用這些數據。

  似乎我們不需要更多的網絡犯罪素材,網絡安全情報公司RecordedFuture透露:“在ChatGPT發布的幾天內,我們在暗網和特殊訪問論壇上發現了許多威脅行為者,他們分享有缺陷但功能齊全的惡意軟件、社會工程教程、賺錢計劃等等——所有這些都是通過使用ChatGPT實現的。”

  私人互聯網接入工程總監JoseBlaya說,在隱私方面,當一個人使用ChatGPT這樣的工具注冊時,它可以訪問IP地址、瀏覽器設置和瀏覽活動——就像今天的搜索引擎一樣。但風險更高,因為未經個人同意,它可能會泄露政治信仰或性取向,并可能意味著尷尬甚至毀掉職業生涯的信息被發布。

  顯然,我們需要更好的法規和標準來實施這些新的人工智能技術。但是對于數據治理和數據管理的重要作用卻缺少討論,因為這在企業采用和安全使用人工智能方面可以發揮關鍵作用。

  一切都與數據有關  

  以下是應該關注的三個方面:

  1.訓練數據的數據治理和透明度:核心問題圍繞專有的預訓練AI模型或大型語言模型(LLM)展開。使用llm的機器學習程序包含來自許多來源的大量數據集。問題是,LLM是一個黑盒子,幾乎不提供源數據的透明度。我們不知道來源是否可信,無偏見,準確或非法包含個人身份信息或欺詐性數據。例如,開放人工智能就不會共享其源數據。《華盛頓郵報》分析了谷歌的C4數據集,涵蓋了1500萬個網站,發現了數十個令人討厭的網站,其中包括煽動性和個人身份信息數據以及其他可疑內容。我們需要數據治理,它要求所使用的數據源透明,并要求來自這些數據源的知識的有效性/可信度。例如,你的人工智能機器人可能會根據未經證實的來源或虛假新聞網站的數據進行訓練,從而使其知識產生偏差,而這些知識現在是你公司新政策或研發計劃的一部分。

  2.數據隔離和數據域:目前,不同的人工智能供應商在如何處理你提供的數據隱私方面有不同的策略。不知不覺中,您的員工可能會在他們的提示中向LLM提供數據,而不知道該模型可能會將數據合并到其知識庫中。公司可能會在不知情的情況下將商業機密、軟件代碼和個人數據泄露給世界。一些人工智能解決方案提供了變通方法,例如通過將數據排除在預訓練模型之外來保護數據隱私的api,但這限制了它們的價值,因為理想的用例是用特定情況的數據增強預訓練模型,同時保持數據的私密性。一個解決方案是讓預先訓練過的人工智能工具理解數據“域”的概念。訓練數據的“通用”領域用于預訓練,并在實體之間共享,而基于“專有數據”的訓練模型擴展則安全地限制在組織的邊界內。數據管理可以確保創建和保留這些邊界。

  3.人工智能的衍生作品:數據管理的第三個領域與人工智能過程及其最終所有者生成的數據有關。假設我使用AI機器人來解決編碼問題。如果某些事情沒有正確完成,導致bug或錯誤,通常我會知道誰做了該調查和修復的事情。但有了人工智能,我的組織要為我要求人工智能執行的任務所導致的任何錯誤或不良后果負責——即使我們對流程或源數據不透明。你不能責怪機器:在某個地方,是人類造成了錯誤或糟糕的結果。那么IP呢?你是否擁有使用生成式AI工具創作的作品的IP?你在法庭上怎么辯護?據《哈佛商業評論》報道,藝術界已經開始提起訴訟。

  現在要考慮的數據管理策略  

  在這些早期階段,我們不知道我們對人工智能的不了解,包括壞數據、隱私和安全、知識產權和其他敏感數據集的風險。人工智能也是一個廣泛的領域,有多種方法,如法學碩士,基于邏輯的自動化,這些只是通過結合數據治理政策和數據管理實踐來探索的一些主題:

  • 暫停對生成式人工智能的實驗,直到你有一個監督戰略、政策、

  以及降低風險和驗證結果的程序。

  • 合并數據管理指南:首先要對自己的數據有一個堅實的理解,無論它位于哪里。你的敏感個人信息和客戶數據在哪里?你有多少IP數據,這些文件在哪里?你能否監控使用情況,以確保這些數據類型不會被無意中輸入人工智能工具,并防止安全或隱私泄露?

  ?不要給人工智能應用程序提供超過所需的數據,不要共享任何敏感的專有數據。鎖定/加密IP和客戶數據,防止其被共享。

  • 了解人工智能工具如何以及是否可以與數據源透明。

  供應商能保護你的數據嗎?谷歌在其博客中分享了這一聲明,但“如何”并不清楚:“無論一家公司是在VertexAI中訓練模型,還是在GenerativeAIAppBuilder上構建客戶服務體驗,私人數據都是保密的,不會用于更廣泛的基礎模型訓練語料庫。”閱讀每個人工智能工具的合同語言,了解你提供給它的任何數據是否可以保密

標記業主或委托項目的個人或部門的衍生作品的數據。這很有幫助,因為你可能最終要對公司產生的任何工作負責,你想知道人工智能是如何被納入過程的,以及由誰加入的。

  • 確保域間數據的可移植性。例如,團隊可能想要剝離其IP和識別特征的數據,并將其提供給通用訓練數據集以供將來使用。這個過程的自動化和跟蹤是至關重要的。

  • 隨時了解正在制定的任何行業法規和指導方針,并與其他組織的同行交流,了解他們是如何實現風險緩解和數據管理的。

  • 在開始任何生成式人工智能項目之前,請咨詢法律專家,了解發生數據泄露、隱私和知識產權侵犯、惡意行為者或虛假/錯誤結果時應遵循的風險和流程。

  企業中人工智能的實用方法  

  人工智能正在迅速發展,并以前所未有的速度加速創新、削減成本和改善用戶體驗,具有巨大的潛力。但就像大多數強大的工具一樣,人工智能需要在適當的環境中謹慎使用,并配備適當的數據治理和數據管理護欄。人工智能數據管理的明確標準尚未出現,這是一個需要進一步探索的領域。同時,企業在使用人工智能應用之前,應該謹慎行事,確保清楚地了解數據暴露、數據泄露和潛在的數據安全風險。

責任編輯:武曉燕 來源: 機房360
相關推薦

2023-06-01 16:47:59

2021-11-10 15:43:23

人工智能智能家居科技

2022-11-30 13:28:53

人工智能AI

2020-08-10 10:25:18

人工智能技術工具

2023-05-05 14:02:59

人工智能聊天機器人

2023-07-17 13:41:26

人工智能測試數據

2023-08-02 18:26:31

2024-05-10 12:52:01

2023-03-14 10:19:14

AIML數據管理

2024-02-28 14:45:39

人工智能數據管理AI

2023-07-19 08:33:17

人工智能項目團隊

2024-03-01 10:00:09

2023-09-11 11:27:48

人工智能算法

2024-03-25 19:47:00

AIGC數據治理

2025-01-17 14:03:02

2023-08-29 11:36:49

2024-10-08 14:12:17

2024-05-10 13:15:27

2025-02-10 10:24:36

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲精品粉嫩美女一区 | 欧美日韩亚 | 亚洲精品播放 | 欧美性受xxxx白人性爽 | 中文字幕在线观看一区二区 | 国产精品爱久久久久久久 | 羞羞的视频在线看 | 99久久免费精品 | 国产亚洲精品久久久久动 | 国产伦精品一区二区三区视频金莲 | 在线看片福利 | 欧美一级一 | 成人一区二区三区视频 | 欧美亚洲国产一区 | 天天综合日日夜夜 | 在线日韩精品视频 | 久久久久久国产精品 | 日韩在线日韩 | 日韩精品四区 | 欧美成人激情 | 丝袜一区二区三区 | a视频在线| 国产高清免费视频 | 日本 欧美 三级 高清 视频 | 水蜜桃久久夜色精品一区 | 呦呦在线视频 | 免费视频一区 | 国产资源一区二区三区 | 色黄爽| 365夜爽爽欧美性午夜免费视频 | 国产精品久久久亚洲 | 福利一区视频 | 九九九久久国产免费 | 免费在线观看一区二区三区 | 免费99视频 | 国产一伦一伦一伦 | 欧美一二三| 亚洲播放 | 一区二区三区播放 | 免费观看av网站 | 日本中文字幕一区 |