成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

人工智能一大技術:強化學習(RL)

人工智能 深度學習
強化學習主要由智能體(Agent)、環境(Environment)、狀態(State)和動作(Action)、獎勵(Reward)組成。智能體將在環境的當前狀態下,根據獎勵信號做出動作,從而達到環境中的不同狀態并得到獎勵。

人工智能技術進步的速度越來越快,每種細分技術所創造的價值正日益得到展現。

[[359390]]

2013年,DeepMind發明了DQN算法,成功將深度學習和強化學習結合起來,開啟了深度強化學習的新紀元。此后數年,強化學習的成果日新月異,很多非常困難的問題都被深度強化學習算法解決。

2016年,谷歌阿爾法圍棋以4:1戰勝圍棋世界冠軍、職業九段棋手李世石,不僅讓深度學習為人們所知,而且掀起了人工智能的“大眾熱”,大家由此更加關注強化學習這一技術要點。

使用強化學習的一個很好的例子是讓機器人學習如何走路。機器人首先向前邁出一大步然后跌倒。這一大步和摔倒是強化學習系統關注的響應點。由于反饋是負面的,所以繼續調整,系統會根據多個負反饋的比對最終確定機器人應該把步子邁的小一點,不停地小,直到機器人走路不會摔倒為止。

通過強化學習,Boston Dynamics公司的機器人已經掌握了托舉、后空翻、跳上窗臺的要點。而迪斯尼幻想工程已經把這一點帶到了一個新的層面,那就是讓人形機器人來執行玩命的特技。

有業內人士指出,強化學習和其他的人工智能技術有一個很大的差異,那就是它的學習范式和其它技術不太一樣。它不需要我們去收集數據,也不需要我們去做任何標記,而是我們把稱之為智能體(Agent),放在一個環境里,就像動物或者我們自己生存的一個環境里,它會和環境自己打交道,自己學會在環境里如何完成一個任務,解決一個問題。

強化學習主要由智能體(Agent)、環境(Environment)、狀態(State)和動作(Action)、獎勵(Reward)組成。智能體將在環境的當前狀態下,根據獎勵信號做出動作,從而達到環境中的不同狀態并得到獎勵。

除了強化學習外,機器學習也備受關注。機器學習是AI的一個子集,是通過不同場景中的經驗來訓練系統的能力。隨著車輛變得越來越自動化,開發人員可以使用機器學習訓練系統來識別對象,并用更少的數據更好地解釋其環境。

再來看一下深度學習。深度學習就是從有限樣例中通過算法總結出一般性的規律,并可以應用到新的未知數據上。例如,我們可以從一些歷史病例的集合中總結出癥狀和疾病之間的規律。這樣,當有新的病人到來時,我們可以利用總結出來的規律來判斷這個病人得了什么疾病。

那么,強化學習、機器學習、深度學習三者的區別是什么?簡單說,人工智能范圍最大,涵蓋機器學習、深度學習和強化學習。如果把人工智能比喻成孩子大腦,那么機器學習是讓孩子去掌握認知能力的過程,而深度學習是這種過程中很有效率的一種教學體系。

由強化學習、機器學習等技術構成的人工智能,其良好的發展前景引人期待。從全國來看,據艾瑞咨詢測算,2022年國內人工智能核心產業規模有望達到1573億元,復合增速達58%,產業將持續快速增長。如此廣闊的市場空間,吸引著社會各界投資者的關注。

值得一提的是,發展“以人為本”的人工智能是全社會的課題,需要政府、商界、學界及所有利益相關方共擔責任,協力推動。作為技術應用與推廣的主體,企業負有不可推卸的社會責任。在研究強化學習相關技術時,企業要自覺遵守法規制度和社會公約,以此促進其有序、可持續應用。

未來,全球的可持續發展越來越依賴于數據創造的價值,而人工智能是數字經濟中應用十分廣泛的技術之一。或許再過幾年,AI將在精準農業、智能家居、遠程醫療、自動駕駛等領域發揮更加重要的作用。

 

責任編輯:姜華 來源: 今日頭條
相關推薦

2017-02-20 16:35:10

人工智能算法強化學習

2023-08-28 06:52:29

2020-12-15 15:01:48

人工智能機器學習深度學習

2021-11-30 08:00:00

人工智能數據技術

2024-01-16 10:32:39

大模型AI人工智能

2022-12-05 09:42:21

語音人工智能程序

2021-04-13 16:18:30

人工智能強化學習人臉識別

2023-10-12 15:20:23

人工智能機器學習

2022-11-14 15:06:16

2025-02-24 10:07:10

2024-03-19 00:15:00

機器學習強化學習人工智能

2024-12-09 08:45:00

模型AI

2023-09-28 15:04:53

人工智能AI

2025-05-28 09:15:00

AI視覺模型

2021-03-02 14:19:30

人工智能根技術“十四五”

2018-08-08 16:08:45

深度學習機器學習NLP

2022-12-01 07:03:22

語音識別人工智能技術

2017-02-27 11:36:31

阿里

2020-04-15 16:44:38

谷歌強化學習算法

2020-06-05 14:49:51

強化學習算法框架
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 伊人网综合在线观看 | 久久久日韩精品一区二区三区 | 国产精品亚洲一区二区三区在线观看 | 欧美色图综合网 | 日韩在线免费视频 | 国产精品伦一区二区三级视频 | 黑人精品 | 亚洲欧美综合 | 国产高清视频在线观看 | 国产一区二区三区视频 | 国产精品久久久久久久7777 | 亚洲精品中文字幕在线观看 | xxxcom在线观看 | 日韩三级在线观看 | 九九九色 | 男女精品网站 | 欧美激情一区二区三区 | 免费观看一级黄色录像 | 精国产品一区二区三区 | 日韩伦理一区二区 | 久久尤物免费一区二区三区 | av男人的天堂在线 | 99精品久久 | 国产精品国色综合久久 | 春色av| 伊人春色在线 | 亚洲视频一区在线播放 | 99精品一级欧美片免费播放 | 一级做a爰片久久毛片免费看 | 亚洲经典一区 | 久久精品亚洲成在人线av网址 | 视频一区在线观看 | 中文字幕一区二区三区在线乱码 | 精品国产乱码久久久久久a丨 | 国产激情视频在线免费观看 | 欧美一区二区在线观看 | 亚洲免费网址 | 人人看人人射 | 久久久久久精 | 欧美国产精品一区二区三区 | 久久久夜 |