微軟推人人可用的機(jī)器學(xué)習(xí),打通windows應(yīng)用程序任督二脈,惠及5000萬開發(fā)者
北京時(shí)間 5 月 19 日晚間 11 點(diǎn),微軟一年一度的「Build開發(fā)者大會」正式線上開幕。
開篇微軟CEO Satya Nadella 20分鐘的演講干貨滿滿。開發(fā)者和合作伙伴最想知道的內(nèi)容,他基本都在視頻里都提到了。
演講全程,Nadella 試圖對開發(fā)者表現(xiàn)出一種慈父般的熱情:「微軟的使命是賦能每一個(gè)人,而且最主要的就是要賦能開發(fā)者,微軟為你們打造的平臺和工具是你們構(gòu)筑這個(gè)智能時(shí)代的一磚一瓦。」
這種對開發(fā)者產(chǎn)生的濃厚興趣,在2018年微軟不惜大手筆收購開發(fā)者之家GitHub事件上,表現(xiàn)的淋漓盡致。
Nadella 稱,擁有了GitHub后,微軟就有機(jī)會為開發(fā)者構(gòu)建最完整的工具鏈,匯集了GitHub、VisualStudio和Azure的精華。
目前GitHub的開發(fā)者數(shù)量超過了5000萬。而兩年前推出的低代碼開發(fā)平臺Power Platform的開發(fā)者數(shù)量也超過了350萬人。
WhiteNoise:人人可用的差分隱私機(jī)器學(xué)習(xí)工具包
今年的大會,微軟著重強(qiáng)調(diào)了機(jī)器學(xué)習(xí)領(lǐng)域的進(jìn)展。
Build大會上微軟宣布將開源多個(gè)機(jī)器學(xué)習(xí)工具包,這些工具跟以往的相比,更關(guān)注機(jī)器學(xué)習(xí)的隱私和公平性。
如今,各種底層架構(gòu)的日趨成熟,開發(fā)人員構(gòu)建一個(gè)人工智能模型變的越來越容易,但是有一個(gè)問題,這些系統(tǒng)是否「容易解釋」 ,是否「遵守了非歧視和隱私規(guī)定」?
WhiteNoise
這次機(jī)器學(xué)習(xí)領(lǐng)域的重頭戲要屬WhiteNoise 了,WhiteNoise 是一個(gè)使用差分隱私的工具包,不久就可以通過 Azure 和 GitHub 上的開放源碼來使用了。它加入了新的人工智能可解釋性和公平性工具,以及新的數(shù)據(jù)、模型和訪問控制,還新增了工作流溯源文檔等。
差分隱私旨在提供一種加密方法,當(dāng)從統(tǒng)計(jì)數(shù)據(jù)庫查詢時(shí),最大化數(shù)據(jù)查詢的準(zhǔn)確性,同時(shí)最大限度減少識別其記錄的機(jī)會。
WhiteNoise 工具包是微軟與哈佛大學(xué)定量社會科學(xué)研究所合作開發(fā)的,它利用差分隱私來加密數(shù)據(jù),可以保護(hù)數(shù)據(jù)中的個(gè)人信息,如姓名或出生日期等敏感信息。
WhiteNoise的算法會在原始數(shù)據(jù)中注入少量噪聲,然后將其輸入本地機(jī)器學(xué)習(xí)模型,從而使惡意攻擊者難以從訓(xùn)練好的模型中逆向提取出原始文件。即使攻擊者看到算法的輸出,也不能判斷它是否在計(jì)算中使用的特定個(gè)體的信息,WhiteNoise的算法就起到了隱私保護(hù)的作用。
比如醫(yī)院想建立一個(gè)癌癥治療效果預(yù)測模型,首先你要保證預(yù)測的整個(gè)流程符合醫(yī)院和其他監(jiān)管部門的規(guī)定,同時(shí)你還要保證患者和醫(yī)院的隱私信息不被泄漏,之前這個(gè)過程都要人工去審核,或者壓根沒有審核的機(jī)制。
現(xiàn)在通過WhiteNoise的私有算法庫,通過簡單的API就能實(shí)現(xiàn)整個(gè)流程的合規(guī)和數(shù)據(jù)隱私化處理。
除了WhiteNoise,微軟還推出了兩個(gè)旨在評估AI系統(tǒng)公平性和可解釋性的工具包,F(xiàn)airlearn 和InterpretML,將來這兩個(gè)工具包也會融入到Azure的機(jī)器學(xué)習(xí)系統(tǒng)中。
Fairlearn
Fairlearn 則為開發(fā)人員和數(shù)據(jù)科學(xué)家提供了評估機(jī)器學(xué)習(xí)模型公平性和緩解不公平的能力。針對不同的人群,F(xiàn)airlearn會在模型性能和公平性之間做一個(gè)取舍,爭取到最佳平衡點(diǎn)。
Fairlearn 在一個(gè)儀表板上定義了 AI 系統(tǒng)是否對人不公平,模型主要關(guān)注兩種危害: 分配危害和服務(wù)質(zhì)量危害。當(dāng)人工智能系統(tǒng)擴(kuò)展或抑制機(jī)會、資源或信息(例如招聘、入學(xué)和借貸)時(shí),分配危害就出現(xiàn)了。服務(wù)質(zhì)量危害指的是,沒有機(jī)會、資源或信息被延長或保留,但是系統(tǒng)區(qū)別對待兩個(gè)人。
Fairlearn采用了一種被稱為群體公平的方法,該方法旨在揭示哪些群體的個(gè)體面臨著遭受傷害的風(fēng)險(xiǎn)。數(shù)據(jù)科學(xué)家指定工具包中的相關(guān)群體(例如性別、膚色和種族),然后通過一組正則項(xiàng)約束群體公平性,讓不同群體之間具有可比性。
比如安永會計(jì)師事務(wù)所使用 Fairlearn 來評估男女貸款的不公平性。根據(jù)安永的調(diào)查數(shù)據(jù),同樣條件下,男性和女性獲得貸款之間有15.3% 的差異。隨后,安永利用 Fairlearn開發(fā)了多個(gè)補(bǔ)救模型,讓性別差異減少到了0.43%。
InterpretML
最后出場的是InterpretML。這個(gè)工具包致力于幫助開發(fā)人員、數(shù)據(jù)科學(xué)家更全面地理解他們的機(jī)器學(xué)習(xí)模型。現(xiàn)在已經(jīng)可以在Azure 機(jī)器學(xué)習(xí)中使用了。
想對比不同模型的效果,直接show!
InterpretML包含了許多機(jī)器學(xué)習(xí)的可解釋性技術(shù),通過可視化模型的行為和預(yù)測背后的推理來幫助解釋模型。也就是說你用InterpretML不僅能選出對模型最重要的參數(shù)或變量,而且可以解釋它們?yōu)槭裁词侵匾摹?nbsp;
有了上面這些工具包,開發(fā)人員就可以真正理解自己的模型ーー不光可以看到模型的可解釋性和公平性,還能理解為什么模型做出這樣那樣的預(yù)測。
Project Reunion:做Windows應(yīng)用開發(fā)從來沒有這么容易
如果要問一個(gè)開發(fā)者,一個(gè)平臺最讓人抓狂的是什么?混亂,絕對是個(gè)把人逼瘋的高手。
Windows應(yīng)用開發(fā)的長期以來的混亂局面,微軟自己都看不下去了,在Build大會上重磅推出了巨大更新:Project Reunion。
單從這個(gè)名字你就能感受到一股「We the Windows」「Make Windows great again」的味道撲面而來。
Project Reunion利用.NET包管理器NuGet等工具,統(tǒng)一訪問現(xiàn)有的Win32和UWP API,并將其與操作系統(tǒng)解耦,為新的應(yīng)用程序提供一個(gè)共同的平臺,從而讓你現(xiàn)有的應(yīng)用能夠緊跟平臺步伐,而不在乎用的是C++、.NET、(包括WPF、Windows Forms和UWP)還是React Native。
Project Reunion包括兩個(gè)組件:WinUI 3 Preview 1和WebView2的新預(yù)覽版。
WinUI 3 Preview 1是微軟最新的Windows UI框架,允許應(yīng)用程序擁有一個(gè)可以跨設(shè)備擴(kuò)展的、統(tǒng)一化、現(xiàn)代化的UI。
WebView2可以輕松地將基于Chromium的WebView嵌入到Windows Forms、WPF和UWP/WinUI 3應(yīng)用程序中。WebView2與操作系統(tǒng)脫鉤,成為又一條微軟伸向其他平臺的觸手。
此外,微軟升級了Windows子系統(tǒng)(WSL),加入了GPU加速和對GUI圖形界面的支持,如此一來,不僅提升了在Linux下的并行計(jì)算、機(jī)器學(xué)習(xí)模型及訓(xùn)練,同時(shí)也允許WSL直接運(yùn)行帶有圖形界面的Linux應(yīng)用。
當(dāng)然,少不了Windows Terminal 1.0。
Linuxer們可能始終沒想到,最終來打通Windows和Linux之間壁壘的錘子,居然來自微軟自己。
Azure量子計(jì)算平臺預(yù)覽版發(fā)布:開源量子開發(fā)工具包,人人可以從零學(xué)起
如果要問巨頭們的下一個(gè)爭奪的目標(biāo)是什么?量子計(jì)算絕對在Top名單上。
未來幾年,商用量子計(jì)算機(jī)投入市場時(shí),對于相應(yīng)開發(fā)人員的需求也會越來越高,企業(yè)需要提早開始準(zhǔn)備。金融服務(wù)、汽車和制藥行業(yè)等已經(jīng)開始將量子計(jì)算的應(yīng)用提上了日程。
去年年底,亞馬遜就發(fā)布了量子計(jì)算服務(wù)Amazon Bracket預(yù)覽版,并成立AWS量子計(jì)算中心和亞馬遜量子解決方案實(shí)驗(yàn)室;今年三月份,谷歌開源了量子計(jì)算學(xué)習(xí)庫TensorFlow Quantum。
因此在Build大會上,微軟特意向開發(fā)者和公司客戶展示了他們的「Azure量子計(jì)算平臺預(yù)覽版」。
Azure為開發(fā)人員提供了一個(gè)在線平臺,來為量子計(jì)算機(jī)開發(fā)算法和應(yīng)用程序,而不需要因?yàn)橛布退惴ǖ母露貙懘a。
Azure量子計(jì)算部門也在和產(chǎn)業(yè)界合作,其中包括日本豐田通商公司想利用云量子計(jì)算服務(wù)來嘗試解決路線規(guī)劃和交通擁堵等問題。
Azure Quatum平臺于去年11月份推出, 發(fā)布之初就震驚四座,這是繼 IBM 和谷歌各自宣布實(shí)現(xiàn)量子優(yōu)勢/量子霸權(quán)后該領(lǐng)域的又一次重磅突破。
微軟之所以現(xiàn)在就著急拋出預(yù)覽版,意在抓緊時(shí)間挑選合作伙伴和開發(fā)者。為了爭奪客戶和開發(fā)者,微軟開出了非常誘人的條件:一旦被選中,合作伙伴和開發(fā)者可以從微軟、1QBit、霍尼韋爾、 IonQ 和 QCI 獲得量子硬件和軟件。
開發(fā)者是一個(gè)平臺能否堅(jiān)固的基石。為更好的吸引和培養(yǎng)量子計(jì)算領(lǐng)域的開發(fā)者,目前微軟已開源了量子開發(fā)工具包(QDK),讓任何人都可以從零開始學(xué)習(xí)量子計(jì)算。
此外,微軟還在Microsoft Learn platform上推出了兩門課程,教你用 Q# 語言寫程序,以及通過量子計(jì)算來解決優(yōu)化問題。
專業(yè)研究公司 Gartner inc. 的分析師非常看好Azure Quantum,認(rèn)為它的競爭優(yōu)勢在于讓開發(fā)人員為商用級量子計(jì)算機(jī)的到來提前做好準(zhǔn)備,從而讓微軟在量子計(jì)算領(lǐng)域不掉隊(duì)。
目前,微軟在世界各地有8個(gè)量子計(jì)算實(shí)驗(yàn)室,其中一個(gè)位于華盛頓州雷德蒙德的總部,網(wǎng)站上有29個(gè)空缺職位。大家加油!