斯坦福NLP課程XCS224U視頻全部放出,干貨滿滿,速來聽講
從對話智能體到搜索查詢,自然語言理解(NLP)是當今許多最令人興奮的技術的基礎。如何建立這些模型來高效、可靠地理解語言?如果你還沒有那么清楚的話,是否會找個課程來聽呢?
但是有些課程不僅天價還很難報名,有些課程不僅質量極高還免費公開。誰不想要這后者呢?
沒錯,今天機器之心為大家介紹的是斯坦福 XCS224U:自然語言理解 (2023)課程。它干貨滿滿,講師 Christopher Potts 讓這門課充滿魅力。更重要的是,這堂課已經放出了全部視頻,50 個視頻任君學習。
視頻地址:https://www.youtube.com/playlist?list=PLoROMvodv4rOwvldxftJTmoR3kRcWkJBp
該課程借鑒了語言學、自然語言處理和機器學習的理論概念。在這門以項目為導向的課程中,你將開發使機器理解人類語言的系統和算法。
課程前半部分將探索自然語言理解的三個基本任務:上下文語言表征、信息檢索和 NLU 模型的高級行為評估。每個任務主題都包含實踐部分,你將在其中建立基線模型。這些基線模型將幫助你開發自己的模型。
課程后半部分則將開展自然語言理解方面的原創項目,重點關注該領域的最佳實踐。額外的講座和材料將涵蓋重要的主題,以幫助擴展和改進你的系統,包括評估和度量、語義解析和基礎語言理解。
在這些課中,你將:
- 開發對人類語言進行穩健機器學習理解的系統和算法;
- 使用大型語言模型建立神經信息檢索系統;
- 利用上下文單詞表示模型(如 transformers、BERT、ELECTRA 和 GPT),理解單詞之間的語義和句法關系;
- 利用經典和神經信息檢索方法從文本中獲取所需信息;
- 設計并開展一個自己選擇的 NLU 研究項目。
學前準備
劃重點,該課程并不是針對小白的,而是需要在課程開始之前有所積累。
具體來說,學習課程之前,你需要有一些技術、知識基礎,才能更加順利地理解課程內容,完成課程相關任務。
- 熟練掌握 Python:編碼作業將使用 Python。因為有些作業需要熟悉基本的 Linux 命令行工作流程。
- 熟悉微積分和線性代數:需要能夠熟練應用(多元)導數,并理解矩陣 / 向量符號和運算。
- 掌握概率論:熟悉基本概率分布(連續、高斯、伯努利分布),能夠定義連續和離散隨機變量的概念:期望值、獨立性、概率分布函數和累積分布函數。
斯坦福還建議大家將自然語言處理 XCS224U 課程與深度學習 XCS224N 課程結合起來,效果更好。此外還貼心地給大家準備了一份復習 NLP 相關知識的材料清單,你可按需取用。
清單鏈接:http://web.stanford.edu/class/cs224u/background.html
講師介紹
Christopher Potts 是斯坦福語言學教授,同時也是計算機科學教授和語言與信息研究中心(CSLI)主任。在研究中,他致力于使用計算方法探索情感如何在語言中表達,以及語言的產生和解釋如何受到語篇、語境的影響。
他于 2005 年出版了《The Logic of Conventional Implicatures》一書,并發表了大量計算語言學和理論語言學方面的學術論文。
課程視頻下面的評論中,網友們表達了對課程的喜愛。
更有推薦者直接表達了對 Christopher Potts 的贊美,認為他是一位才華橫溢的教育家,解釋復雜的 ML 和 NLP 概念時具有特殊的才能。「我從他的研究和講座中學到了很多東西。強烈建議觀看他的新課程。」