成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

狂攬1.3億美金!AlphaGo大神組隊Gemini大牛,用RL打造超級智能,英偉達搶投

人工智能 新聞
打造出AlphaGo的超級天才、谷歌DeepMind十二年老將Ioannis Antonoglou下場創業了,初創Reflection已融資1.3億,種子輪由紅杉資本等領投。他和Gemini 的核心貢獻者攜手,目標是用強化學習造出真·超級AI。

正如Ilya所說,AI的下一步,就是「超級智能」。

圖片

近日,由DeepMind近12年老將、做出AlphaGo/AlphaZero/MuZero等項目的超級天才Ioannis Antonoglou,和Gemini強化學習的核心負責人Misha Laskin,聯合成立的初創Reflection AI終于浮出了水面。

Reflection AI的目標十分明確——構建超級智能自主系統!

首先,從自主編碼開始。

目前,這家初創已經融資了1.3億,投資方有紅杉資本、 Lightspeed和CRV。

圖片

如此野心的背后,是堪稱豪華的團隊陣容。

過去的十年間,團隊成員在RL和LLM領域均取得了重大突破,并為DeepMind、OpenAI等前沿AI實驗室主導構建了當時最為強大的AI系統——

圖片

那么,究竟該如何構建超級智能?

這就涉及到了這樣一個問題:究竟如何讓LLM在計算機上展現出與AlphaGo在圍棋上同等水平到自主能力?

對此,Reflection的策略是,通過RL提高LLM的自主能力。

他們相信,解決自主編碼是一個根節點問題——如果能構建一個超級智能的自主編碼系統,所有其他基于計算機的工作領域都將自然而然地解決。

DeepMind頂級研究員出走創業,估值5.55億美金

此前,這家名為Reflection AI的初創公司一直很低調。

就在剛剛,它宣布了全新融資:由紅杉資本和CRV領投的2500萬美元種子輪融資,以及由Lightspeed Venture Partners和CRV領投的1.05億美元A輪融資。

而其他投資者,包括LinkedIn聯合創始人Reid Hoffman、Scale AI首席執行官Alexandr Wang、SV Angel和英偉達的風投部門。

現在,Reflection AI的最新估值已經達到5.55億美元。

圖片

如今,已經有越來越多的科技公司押注于所謂的AI智能體,最近爆火的Manus,就反映了人們對這種幫用戶執行任務的AI的渴望。

但Reflection卻有著更為宏大使命:構建具有完全自主性的工具,而不僅僅一種協作工具或助手。

在他們看來,這種方法將更快地實現「超級人工智能」——也就是比大多數人更聰明、范圍更廣的AI。

許多大公司,比如OpenAI、Anthropic和DeepMind,都有著類似的目標。

現在,Relection已經在擁有大型編碼團隊的領域(如金融服務和技術行業)有付費客戶了。這家公司專注于自動化繁瑣和機械的工程工作,比如遷移軟件數據庫或重構代碼。

Lightspeed合伙人Raviraj Jain將在Reflection的董事會中任職,他表示,公司要做的事并不是取代工程師。而是讓工程師不再做繁重的工作,而是成為像建筑師一樣的角色,來監督大量的自主AI智能體。

如今,AI編程領域已經涌入了一大批資金充足的初創公司,而Cursor制造商Anysphere、Replit和Poolside,都在此領域頗為出名。

在Laskin看來,一般的AI助手就像定速巡航,而Reflection則致力于成為更像Waymo那樣的存在。

而紅杉資本合伙人Stephanie Zhan,也十分看好Relection。

在他看來,Reflection有潛力與從事類似工作的大型AI實驗室競爭并勝出,因為世界在短短幾年內就會變得非常不同,AI完全能自動化今天我們做的許多任務。

劍指「超級智能」

在官方博客中,Relection聯創Ioannis回顧了十年前,自己作為創始工程師加入了DeepMind的經歷。

那時,他創造了AlphaGo,第一個在圍棋游戲中超越人類世界冠軍的系統。

2016年的那一刻,是AI的轉折點,也對Reflection團隊的許多成員產生了深遠影響——他們第一次真正領悟到,超級智能的真實形態是什么樣子。

多年來,他們一直孜孜以求地構建超級智能。

Reflection將其視為一個能在計算機上完成大部分認知工作的自主系統。

它不僅能幫助自動化現有的工作,還能發現我們未曾考慮過的更好的解決方案,就像AlphaGo在圍棋中發現了新策略,擴展了人類知識,讓著名的第37手棋成為了傳奇。

Reflection相信,解決自主編碼問題將更廣泛地實現超級智能。

圖片

構建完全自主編碼系統所需的突破——如高級推理和迭代自我改進——會自然延伸到更廣泛的計算機工作類別。

一旦復雜軟件可以被自動規劃、編寫和完善,類似的能力就會無縫轉移到其他計算機驅動的任務上,加速向AGI的進展。

多年來,如何構建這樣一個系統并不明確。

然而,在過去十年中,Reflection團隊在RL和LLM方面開創了重大進步,他們相信,這些是超級智能的基本構建模塊。

從2013年到2020年,團隊用RL創建了專用超級智能系統,如Deep Q Networks、AlphaGo、AlphaZero和MuZero。

從2020年到2024年,他們以LLM的形式開發了通用智能系統,如PaLM、CharacterAI、ChatGPT和Gemini,領導了這些AI的預訓練和后訓練。

正是突破,指導了他們實現通用人工智能的策略:通過強化學習擴展大語言模型的自主能力。

圖片

作為一家公司,Reflection共同的核心信念是,最重要的評估是實際應用評估。

開創性的AI不是在真空中發展的;它需要研發與產品的協同設計。自主能力必須在真實場景中展示切實價值。

通過與用戶反饋一起迭代,他們確保這些系統不僅可靠地滿足實際需求,還有助于塑造負責任設計的AI的未來。

目前,他們的重點是一個自主編碼系統:一個實用的產品,同時也代表著向我們超級智能目標邁出的重要一步。

他們有一個簡單的兩步計劃:

  1. 構建一個超級智能的自主編碼系統
  2. 使用這一藍圖擴展到所有其他基于計算機的工作類別

如今,Reflection已經組建了一個世界級的團隊。

圖片

創始團隊

Misha Laskin:聯合創始人兼CEO

圖片

Misha Laskin于2022年加入DeepMind擔任研究科學家,負責谷歌關鍵LLM項目Gemini的RLHF和獎勵模型團隊。

他見證了初代Gemini和Gemini 1.5的誕生。

他的研究興趣是「強化學習如何為LLM和多模態模型解鎖新能力」,并致力于開發通用AI智能體。

圖片

此前,他在耶魯大學獲得學士學位,在芝加哥大學獲得理論物理學博士學位,并在加州大學伯克利分校BAIR實驗室進行AI領域的博士后研究,主攻深度強化學習和無監督學習。

圖片

圖片

2017年,他曾共同創辦了一家專注于為零售商預測產品需求的AI公司,并從BCC、Y Combinator和Salesforce Ventures獲得175萬美元風險投資。

而他也藉此被福布斯評為「30 Under 30」零售和電子商務領域的杰出人物。

圖片

Ioannis Antonoglou:聯合創始人兼CTO

近12年的老將Ioannis Antonoglou,不僅是DeepMind的創始工程師,而且也是Gemini的第四位核心開發者。

圖片

此前,他在亞里士多德大學獲得電氣和計算機工程學士和碩士學位,并在愛丁堡大學AI和機器學習碩士學位。

值得一提的是,他在DeepMind期間還獲得了倫敦大學學院AI博士學位。

圖片

超級智能是未來

Ilya曾在NeurIPS 2024上表示,超級智能(superintelligence)是公認的發展方向,也是研究人員們正在構建的東西。

從本質上來說,超級智能與現在的AI完全不同。

目前,我們擁有出色的LLM和聊天機器人,但它們也表現出某些奇怪的不可靠性——時常會感到困惑,但卻能在評估中表現出遠超人類的能力。

雖然我們還不知道如何調和這一點,但最終遲早會實現以下目標:AI將真正具備實際意義上的智能體特性,并將正學會推理。

由于推理會引入了更多的復雜性,因此一個會推理的系統,推理量越多,就會變得越不可預測。

相比之下,我們熟知的深度學習都是可以預測的。

舉個例子,那些優秀的國際象棋AI,對于最頂尖的人類棋手來說就是不可預測的。

所以,我們將來不得不面對的,是一些極其不可預測的AI系統——它們能夠從有限的數據中理解事物,同時也不會感到困惑。

同樣,自我意識也是有用的,它構成了我們自身的一部分,同時也是我們世界模型中的一部分。

當所有這些特性與自我意識結合在一起時,就會帶來與現有系統完全不同性質和特性的系統,它們將擁有令人難以置信的驚人能力。

雖然無法確定如何實現、何時實現,但這終將發生。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-05-30 08:40:00

英偉達芯片AI

2025-05-12 08:24:01

2014-01-13 15:13:18

豌豆莢投資

2024-03-01 13:20:58

機器人OpenAIGPT

2023-06-30 08:12:46

2018-06-21 09:07:58

京東實踐京麥平臺

2013-04-03 09:25:11

2021-08-26 16:46:43

網絡安全白宮微軟谷歌

2022-11-21 10:59:02

人工智能

2012-12-31 09:09:08

SDNIDC數據中心

2025-03-18 09:36:04

2012-07-09 09:53:24

超級計算機Tesla GPU

2023-03-14 13:06:54

2017-07-21 13:56:25

互聯網

2024-08-29 10:47:27

2018-07-04 15:09:23

海風教育

2023-08-10 07:13:24

互聯網NVIDIANVLink

2012-06-20 09:43:39

Sequoia超級計算機top500

2024-09-18 13:01:10

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久精品无码一区二区三区 | 浮生影院免费观看中文版 | av在线天堂网 | 最新黄色毛片 | 国产中文视频 | 日韩一区二区三区在线视频 | 免费在线观看一区二区三区 | 草草草网站 | 成年精品| 久久精品国产一区二区电影 | 国产高清精品一区二区三区 | 亚洲精品一区久久久久久 | 天天干天天操天天射 | 狠狠操狠狠干 | 91精品国产乱码久久久 | 蜜桃黄网 | 国产四虎 | 看片91| 国产精品久久久久婷婷二区次 | 国产精品久久久久久久久免费丝袜 | 日韩在线免费 | 日韩精品 | 欧美中文一区 | 精品亚洲一区二区 | av看片网站 | 美女一区 | 激情六月丁香婷婷 | 亚洲欧美一区二区三区在线 | 欧美精品久久久 | 国产一区二区在线视频 | 欧美视频二区 | 九九热精品视频 | 亚洲成人免费视频 | 亚洲h视频| 欧美成人一区二区 | 色网站在线免费观看 | 香蕉视频久久久 | 久久成人在线视频 | 国产精品久久久久久久午夜 | 欧美国产亚洲一区二区 | 久久久久久久久蜜桃 |