NLP領域索引神器,3000+代碼庫,一鍵查找論文、GitHub庫
說到搜索,學術搜索也是一門學問。
擅于運用搜索可以幫助你快速尋找想要的學術資料,起到事半功倍的效果。比如我們常用到的論文及對應源碼的神器 Papers With Code,就收錄了很多 SOTA 論文和代碼,直接搜索論文關鍵字就可以得到相關的論文和代碼,還可以分領域進行搜索;又比如 arXiv 與文獻調研神器 Connected Papers 強強聯合,每篇 arXiv 論文可以在摘要頁面直接鏈接到其在 Connected Papers 中的關聯論文圖。
這種超級實用的搜索工具,可以方便研究者查找學術資料,節省了大量時間,并且可以提供最優搜索結果。
這里我們介紹一個非常實用的 NLP 索引工具「The NLP Index」,同樣也是為學術搜索而開發,它是免費且開源的。

項目地址:https://index.quantumstat.com/
「The NLP Index」擁有 3000 多個代碼庫,使用者可以搜索其中一個側欄,側欄中包含當今 NLP 中一些最重要的主題。當你鍵入相關內容時,就可以進行搜索。其索引包括 arxiv 研究論文 PDF 格式、文獻調研神器 ConnectedPapers 鏈接及其相應的 GitHub 代碼庫,可謂將這三款學術神器進行了綜合。
「The NLP Index」介紹
「The NLP Index」左側欄有 10 個模塊,如下圖所示,包括數據(數據擴充、數據集等)、任務(關系提取、語音識別等)、相關領域(醫療、金融等)、模型(BERT、BART 等)、語言類型(跨語言、多語言等)、模型范圍(字符級別、句子級別等)、包含架構(編碼器、解碼器等)、PIPELINE 等。

我們以左側欄中第三個模塊「MODELS(模型)」為例。點擊該模塊,下拉框會出現如下圖所示的界面,在「MODELS(模型)」下面包含有比較常用到的模型,比如 cnn、rnn、bart、bert、gpt-2等。

MODELS 下拉框包含的部分內容。
我們隨機點擊其中任意模型,如「bert」,右側會顯示出帶有「BERT」關鍵字的相關論文,并以藍色字體突出顯示,除此以外還會顯示論文摘要、論文作者、論文 PDF 鏈接、Graph 鏈接以及 GitHub 鏈接,方便使用者快速查找。

當鼠標放在對應的模塊上面(如摘要、作者等),相關內容會全部顯示,以供使用者了解該論文的整體內容。

除此以外,「The NLP Index」還關聯了 Connected Papers,點擊 Graph 界面跳轉至生成的文獻分析網絡圖,結果頁面分三欄,左邊一欄是本文以及相關參考文獻的題目,右邊一欄是相關參考文獻的具體內容,而中間一欄是文獻檢索分析圖譜。可以在線進行分析文獻的引文信息,輕松了解某篇文獻的引用和被引用關聯,分析出文獻的前世今生,方便研究者對一篇文獻或者某個領域進行調研。

對于這個免費且開放的索引工具,有網友表示:「這太神奇了。數據來自 Papers With Code 嗎?」

還有網友表示:「非常感謝為其他人提供了便利。」
