8個機器學習項目創意,助你在求職競爭中脫穎而出
本文轉載自公眾號“讀芯術”(ID:AI_Discovery)。
紙上得來終覺淺,絕知此事要躬行。光看教程是不夠的,你需要通過實踐來掌握更多更真實的內容。以下有8個創意十足的機器學習實操項目供你選擇,趕緊行動起來吧!
1. 基于社交媒體帖子的抑郁情緒分析
世界上有超過2.64億人患有抑郁癥。抑郁癥是全球殘疾、疾病的主要原因,每年都有近80萬人自殺身亡——自殺是15-29歲人群死亡的第二大原因。但與之相對的是,針對抑郁癥的治療卻經常不到位、不及時、不精確。
網絡為改變早期抑郁提供了機會,尤其是針對青年人的病癥。推特上每時每刻發送的推文幾乎超過35萬條,每天發送5億條,每年則約2000億條。
皮尤研究中心指出,72%的人依靠互聯網生活。社交網絡發布的數據集對于很多領域都很重要,比如人文科學和大腦研究。通過分析社交媒體帖子中的語言標記,可以建立深度學習模型,使個人了解其心理健康狀況,這種方法比傳統方法快很多。
2. 使用神經網絡將體育比賽視頻轉換為文本摘要
圖源:Unsplash
這個項目的想法是,從體育比賽視頻中獲取精確的摘要,而后將高光部分發布在體育網站上。科學家已經提出了各種用于提取文本摘要的模型,但是神經網絡的效果最好。一般來說,摘要是指在一個簡要的結構中引入信息,集中傳達事實和信息,同時保證其重要性。
自動生成游戲視頻的摘要給辨別游戲高光部分帶來了挑戰。
為了完成上述任務,可以使用一些深度學習技術,如3D-CNN(三維卷積神經網絡)、RNN(循環神經網絡)、LSTM(長短期記憶神經網絡),還可以通過機器學習算法將視頻分成不同的部分,然后應用SVM(支持向量機)、NN(神經網絡)和k-均值算法。
3. 使用CNN的手寫方程求解器
識別手寫數學表達式在計算機視覺研究領域屬于最令人困惑的問題之一。你可以使用卷積神經網絡(CNN)和一些圖像處理技術,通過手寫數字和數學符號來訓練手寫方程求解器。開發這樣一個系統需要用數據訓練機器,使其能夠熟練地學習并且做出所需預測。
4. 使用NLP生成商務會議摘要
你有沒有遇到過這種情況:別人只想看你的摘要而不是完整的報告。我在學生時代就是經常花了很多時間準備完整的報告,但老師只有看摘要的時間。
摘要已經勢不可擋地成為解決數據負擔過重的一種有效方法。從對話中提取信息具有很好的商業和教育價值,這可以通過捕捉對話結構中統計、語言和情感方面的特征來實現。
手動將報告轉換為摘要太費時間了,人們可以借助自然語言處理(NLP)技術來實現。使用深度學習的文本摘要技術可以理解整個文本的上下文,對于我們這些需要快速總結文件的人來說簡直是福音。
5. 根據人臉識別情緒推薦合適的歌曲
圖源:unsplash
臉是身體的重要組成部分,對于了解個人精神狀態起著重要作用。通過人臉識別推薦歌曲省去了手動將歌曲分組這項枯燥乏味的步驟,并能根據個人情感特征生成合適的播放列表。
人們往往會根據自己的情緒和興趣聽歌。你可以通過捕捉面部表情創建一個應用,根據用戶的情緒為他們推薦合適的歌曲。
計算機視覺是一個跨學科領域,有助于向計算機傳達對數字圖像或視頻的高級理解,計算機視覺組件可用于通過面部表情確定用戶情緒。
6. 從開普勒等航天器拍攝的圖像中尋找可居住的系外行星
近十年間,科學家監測了超過100萬顆星星以識別凌日行星。人工詮釋潛在的候選系外行星需要大量勞動力,還很容易出現人為錯誤,且結果很難評估。卷積神經網絡比最小二乘法更適合在嘈雜的時間序列數據中識別類地系外行星。
7. 老損膠片照片的再生成
圖源:Pikist
我知道修復舊照片有多么耗時和痛苦,因此,人們可以考慮通過深度學習尋找照片上所有的缺陷(斷裂、劃痕、漏洞),并使用圖像修復算法,從而通過四周的像素值輕松地發現缺陷,以恢復舊照片并為其著色。
8. 使用深度學習生成音樂
音樂是各種頻率音調的組合,自動生成音樂則是將人類參與度降到最低,從而創作一小段音樂的過程。近來,深度學習工程已經成為了編程生成音樂的前沿。
(https://medium.com/analytics-vidhya/music-generation-using-deep-learning-a2b2848ab177)
尋找項目的選題,你需要大膽假設,仔細觀察。如果尚在為選題苦惱,不如從上面的創意中挑一個試試吧。