Kevin P. Murphy《概率機器學習:進階》成書,還開放了PDF下載
今天,谷歌研究科學家 Kevin P. Murphy 正式宣布:《概率機器學習:進階》書稿已經(jīng)完成,并面向公眾提供免費下載。
這本書是《概率機器學習:簡介》的續(xù)編,說起來,Kevin P. Murphy 的概率機器學習書算是經(jīng)典教材了,所以去年他宣布再版的消息曾引起廣泛關注。
在第二卷《進階》中,作者擴展了機器學習的范圍,以包含更具挑戰(zhàn)性的問題。例如探討了在多種不同分布下的學習和測試;生成高維輸出,如圖像、文本和圖形;基于潛在變量模型發(fā)現(xiàn)數(shù)據(jù)「洞察力」的方法;以及如何在決策和控制任務中使用概率模型和推理。
消息公布后,一部分讀者立即下載了第二卷書稿并開始學習,另一部分讀者則突然想起去年下載的第一卷還沒翻開過……
不過,Kevin P. Murphy 提到,這本書也還沒有全部完成,目前缺失一章內(nèi)容且需要進一步校對。他還會對網(wǎng)絡發(fā)布版本進行微調(diào),最終書稿將在今年夏天發(fā)送給 MIT 出版社。
或許是因為第二卷成書的效率太高,一位讀者表示大受震撼:「什么?第一卷我還沒看完啊……」
更多讀者還是表達了對第二卷新書的期待:
「你找不到比這兩本書更全面、更連貫的現(xiàn)代機器學習評論了(這里是第二本書)。這套書籍提供了一流的教育效果,只需要你愿意閱讀……」
閱讀本書之前,讀者應該基本了解 (監(jiān)督) 機器學習和其他相關的數(shù)學主題 (概率、統(tǒng)計、線性代數(shù)、優(yōu)化)。這些背景材料在第一卷中有所涉及,不過第二卷是自成一體的,先閱讀第一卷不是必需的。
第二卷涵蓋了眾多主題,因此不可能把全部內(nèi)容都放進書稿中,一些額外的材料可以在書籍主頁的線上補充中找到,這個頁面還包含用于復現(xiàn)書中大部分圖形的 Python 代碼。
作者表示,第二卷《概率機器學習:進階》將于 2023 年正式出版。同時,去年成稿的第一卷《概率機器學習:簡介》近日也已經(jīng)正式出版,只是價格略貴:
第二卷的整體目錄如下:
- 書籍地址:https://github.com/probml/pml2-book/releases/latest/download/pml2.pdf
- 完整目錄:https://probml.github.io/pml-book/pml2/toc2-long-2022-02-27.pdf
這本書側(cè)重于概率建模和推理,用于解決四種主要任務:預測 (分類和回歸) 、生成 (圖像和文本生成) 、發(fā)現(xiàn) (聚類、降維和狀態(tài)估計) 和控制 (決策)。
第一部分更詳細地介紹了這個領域的一些基本原理,并對一些第一卷中缺少的細節(jié)進行了詳細介紹。
第二部分討論了各種概率模型中的貝葉斯推理算法。這些不同的算法在速度、精度、通用性等方面的影響不同,由此產(chǎn)生的方法可以應用于許多不同的問題。
第三部分討論了預測方法,用于適合 p (y|x) 形式的條件分布,其中 x ∈ X 是輸入(通常是高維的),y ∈ Y 是期望的輸出(通常是低維的)。這一部分假設了存在一個想要預測的正確答案,盡管通常這個答案是不確定的。
第四部分討論了生成模型,形式為 p (y) 或 p (y|x),其中可能有多個有效輸出。例如,給定一個文本提示符 x,希望生成一組多樣化的圖片 y 與標題相匹配。在預測設置中,評估這些模型比評估標題更難,因為它的期望輸出是不清楚的。
第五部分將注意力轉(zhuǎn)向了數(shù)據(jù)分析,討論了一些旨在揭示有意義的潛在狀態(tài)或模式的方法。這部分主要關注潛在變量模型,它們是 p (z, y) = p (z) p (y|z) 的聯(lián)合模型,其中 z 是隱藏狀態(tài),y 是觀測值,目標是從 y 中推斷 z。(該模型可以選擇性地以固定的輸入為條件,得到 p (z, y|x)。)此外還探討了一些方法,用于發(fā)現(xiàn)以 p (y|x) 形式的預測模型隱式學習到的模式,而不依賴于顯式的生成模型。
最后,第六部分討論了如何使用概率模型和推理在不確定性中進行決策,引出了因果關系這個重要命題。
此外,由于內(nèi)容涉及范圍廣泛,大約三分之一的章節(jié)是與客座作者共同撰寫或合作撰寫的,這些客座作者都是領域?qū)<?(參見下面的貢獻者完整名單)。