老照片修復、尋找系外行星……這里有8個超贊的機器學習項目
作者:Kajal Yadav
機器之心編譯
編輯:小舟、杜偉
在人工智能的大潮中,機器學習項目琳瑯滿目。哪些項目是兼具代表性和實用性的呢?近日,一位名為 Kajal Yadav 的作者列出了 8 個經典的機器學習項目,實用又有趣。目前已在 medium 上獲贊 1.7K。
這 8 個項目的主題包括情緒分析、自動摘要生成、情緒檢測、老照片修復以及深度學習生成音樂等。
基于社交媒體的抑郁情緒分析
這是一個非常敏感的話題,以至于被認為是一個迫切需要解決的問題。全球有超過 2.64 億人正在遭受抑郁癥的折磨。抑郁癥是全球致殘的主要原因之一,也是全球疾病負擔中極為重要的一部分。每年有 80 萬人自殺而死。自殺是 15 到 29 歲人群的第二大致死因素。遺憾的是,抑郁癥的治療往往延遲、不準確甚至完全不起作用。
基于互聯網的生活為改變早期抑郁癥治療服務提供了機會,尤其是在年輕人群中。
正如 Pew 研究中心(Pew Research Center)指出的那樣,有 72% 的人使用互聯網。社交網絡上發布的數據集對許多領域都非常重要,例如人文科學和大腦研究。但是,僅依賴專業領域的支持還遠遠不夠,并且顯式方法論也并不奏效。
所以,通過分析社交媒體帖子中的一些標志性語言,我們可以創建一種新的深度學習模型。這種模型可以較傳統方法更早地使人深入了解自身心理狀態。
借助神經網絡生成體育比賽視頻的文本摘要
該項目的想法主要是基于從體育比賽視頻中提取出準確的摘要。一些體育網站能夠給出比賽的亮點。關于提取式文本摘要任務,已經出現了各種各樣的模型,其中以神經網絡的性能最佳。通常,摘要生成指的是簡要介紹文章的信息,著重傳達事實類信息,同時突出文章重點。
自動創建游戲視頻的輪廓帶來了一項挑戰,即找出游戲中精彩的環節和亮點。因此,人們可以使用三維卷積網絡(3D-CNN)、遞歸神經網絡(RNN)和長短期記憶網絡(LSTM)等深度學習方法,同時也可以先通過機器學習算法將視頻分成幾個片段然后應用支持向量機(SVM)、神經網絡(NN)、k-means 算法等。
使用 CNN 的手寫方程式求解器
在所有問題中,手寫數學表達式識別是計算機視覺研究領域令人困惑的問題之一。借助于圖像處理技術加持的卷積神經網絡(CNN),我們可以通過手寫數字(handwritten digit)和數學符號來訓練手寫方程式求解器。開發這樣的系統需要用數據訓練機器,使其熟練學習并做出所需的預測。
使用 NLP 生成商務會議摘要
曾經遇到過這樣的情況,每個人都只想看到摘要而不是報告的全部內容。上學的時候,我們會花費很多時間準備報告,但老師只有時間看摘要。
摘要已經成為解決數據過多問題的一種無可替代的有效方法。從對話中提取信息具有很好的商業和教育價值,這可以通過捕獲具有對話結構的統計、語言和情感方面的特征來解決。
通常來說,手動將報告濃縮為一個匯總摘要要花費很多時間,但是用自然語言處理(NLP)來做就會簡單很多。用深度學習生成文本摘要能夠理解整篇文章的上下文,對所有需要快速生成文檔摘要的人來說真是太方便了。
用人臉識別來檢測情緒并推薦歌曲
人臉是人體的重要組成部分,它對于了解人的心理狀態尤為重要。用人臉識別檢測心情并推薦歌曲不僅可以省去歌曲手動分類的麻煩,而且有助于根據人的情緒特征生成適當的播放列表。
人們傾向于根據心情和興趣聽音樂。所以,我們可以創建一種應用程序,通過捕獲面部表情,識別出用戶的情緒并推薦相應的歌曲。
計算機視覺是一個跨學科領域,這一領域的研究致力于在計算機上對數字圖像和視頻做高水平的理解。計算機視覺組件可用于通過面部表情決定用戶情緒。
文章《20+ Emotion Recognition APIs That Will Leave You Impressed, and Concerned》中介紹了 20 多種有趣且實用的情緒識別 API。
文章鏈接:
https://nordicapis.com/20-emotion-recognition-apis-that-will-leave-you-impressed-and-concerned/
從開普勒等太空飛行器拍攝的圖像中找出宜居的系外行星
在最近十年中,對超過 100 萬顆恒星進行了監測,以識別正在凌日行星(transiting planet)。人工解釋系外行星候選者的工作量巨大,并且容易出現人為錯誤,其后果難以評估。卷積神經網絡適用于在嘈雜的時間序列數據中,以比最小二乘策略更高的準確性來識別類地系外行星。
老照片修復

以原始方法修復受損照片是非常耗時和痛苦的。因此,我們可以通過深度學習找出所有的圖像缺陷(如裂縫、劃痕和孔洞),并且借助于圖像修復算法,我們還可以根據像素值輕松地找出缺陷,以復原老照片,并為老照片著色。
用深度學習生成音樂
音樂是一種變換頻率的曲調。因此,自動音樂生成(Automatic Music Generation)是一個用最少的人為調整作出一小段曲子的過程。最近,深度學習工程(deep learning engineering)已成為程序化音樂生成的最前沿技術。
【本文是51CTO專欄機構“機器之心”的原創譯文,微信公眾號“機器之心( id: almosthuman2014)”】