如何用數據科學改變世界
利用數據科學的力量,以應對全球挑戰
只有當我們收集的數據可以通知并激勵那些職位的數據來完成,才能改變 - Michael J. Schmoker
今天,在數據科學相關領域全球工作近一百萬人。
該行業已經出現了大規模的增長,在過去兩年中有大多數世界上生成的數據。數據驅動的行業在過去幾年中看到了大量增長。
數據科學的應用使生活變得更加容易。從尋找最好的電影來選擇最好的餐廳吃晚餐,數據為我們提供了比我們所需要的更多便利。
今天世界的幾乎每一個數據科學的應用都集中在舒適的生活中更加舒適。
但是,可以使用更多可用的數據來完成更多。可以寫入用于提高銷售的相同算法來提高社會影響。
如何利用數據科學進行社交良好?
使用數據科學的一些例子的社會益處包括:
- 創建預測家庭貧困狀態的機器學習算法。
- 確定在線欺凌和自殺之間的趨勢。
- 檢查不同街道特征對行人死亡人士的影響。
- 確定社交媒體使用的個性化算法是否加強了負面身體圖像。
這是現在比以往任何時候都更好的時間來創建數據驅動的解決方案來解決社會問題。可以收集與上述所有主題相關的大量數據。
非營利組織可以與此數據合作以更好地了解社會問題。如果他們所做的工作是由數據驅動的,他們將能夠對實現社會問題的解決方案來實現更大的進步。
例如,可以實現機器學習模型以識別需要立即關注并優先考慮它們的社區。
然而,很難在數據科學領域進行社會良好的進展。雖然大型科技公司可以承擔雇用數據科學家并開發大型數據生態系統,但非營利組織無法承受。
這意味著即使非政府組織對他們提供了豐富的數據,它們也無法利用它,因為它們缺乏技術技能。
幸運的是,有一些組織可以幫助非政府組織獲得技術人才。
這些組織將數據科學家/分析師與非政府組織的全部全球相結合。
事實上,如果您是一個有抱負的數據科學家,您可以在其中一個組織中志愿者。您將能夠與其他行業專業人士合作,分析社交數據并回答以下問題。
你如何參與
“使用數據不僅做出關于我們想要查看的哪些電影的決定,但我們想要看到的是什么樣的世界” - Datakind
Datakind是一個連接數據科學家和非政府組織的組織。他們甚至為想要參與社會科學的數據科學家提供指導。
他們的座右銘是“在人類服務中利用數據科學的力量。”
如果您是一個想要回饋社會的數據科學家,您可以將Datakind作為志愿者加入。如果您作為志愿者加入,他們會將您分配給現有項目,您將與一群像志同道合的人一起回答社會數據科學問題。
截至目前,他們正在努力地最受歡迎的項目之一被稱為vision零。該項目旨在將交通相關的死亡和損傷降至零。
他們的大部分活動都是在晚上或周末組織的,因此工作全職工作的人也可以積極參與。您可以在此處了解有關工作Datakind的更多信息。
華威大學也經營著DSSG(社會良好的數據科學)夏季團契,并對Datakind進行了類似的工作。他們教學生與非政府組織合作,并為社會良好開發數據科學產品。你可以看看他們在這里做的一些工作。
有許多更多的獎學金和志愿者機會可供社交數據科學提供,因此如果您對您感興趣的東西,您應該對此進行一些研究。
您可以工作的項目
如果您想在社交數據科學領域進行一些研究,這里有一些項目的想法:
分析BLM運動
為了應對系統性種族主義,流行的運動被稱為黑人生活。這種運動抗議警察殘暴和其他形式的暴力,黑人在日常生活中面對。
然而,BLM運動已經從其他社區接收了大量的反障。許多人不愿相信全身種族主義存在。他們說不需要BLM等運動。
所有生活都有諸如對BLM運動的回應之類的運動,堅持認為美國是一個職位的種族社會,而且在該國不再存在種族主義。
數據可用于證明黑色社區是否處于劣勢。紐約警察局每天都會發布交通停止數據。
記錄每個流量停止的細節,此數據可用于查找系統種族主義的證據。它可以用來回答問題,比如“少數民族的種族官員更常見的是較不法行為的證據?”
如果這是一個分析,您應該查看斯坦福開放式警務項目。
貧困預測
為了結束極端貧困,定期衡量它是重要的。如果他們不時測量,非政府組織只能了解他們的貧困策略是否有效。
如果我們要識別貧困,我們首先需要收集家庭消費數據。然后,我們可以在標記的貧困數據集上培訓機器學習模型,并對未來數據進行預測。
通過良好的算法,我們可以快速識別低收入家庭。這些預測可以幫助社會組織優先考慮低收入家庭,并將減貧戰略放在適當的地方。
如果這是您對的項目,您應該查看卡格的貧困預測數據集。
結論
大多數現有數據驅動的解決方案都集中在改善人們日常生活中的舒適程度。雖然這是一個產生最多收入的數據科學的應用,但它肯定不是最有意義的。
數據有可能為人們創造更好的生命,可以用來打擊貧困,藥物濫用和種族主義等問題。
數據科學在戰斗社會問題的應用被稱為社會數據科學,可以產生影響的影響。
編輯推薦】