數據科學家變身故事大王的秘訣是……?
本文轉載自公眾號“讀芯術”(ID:AI_Discovery)
作為數據科學家,我們也應擅長講故事。我們經常要向不同的利益相關者展示工作,由于他們的背景不同,所以我們也要相應地變化語調。但在任何情況下保持不變的是,講故事的那個人是你。
許多方法有助于講好故事,讓我們一起來研究研究。
盡可能多地交流
交流是有效實現某事的關鍵。作為數據科學家,盡可能多地與不同的相關者交流就更加重要。我們通常把相關者分為四類:
- 用戶——他們渴望看見經驗的最佳解決方法
- 領域專家——他們有義務用領域的專業知識提供幫助
- 行政領導——他們對業務和收入更感興趣
- 技術人員——他們對技術方面的事最感興趣
為了有效地與他們交流,需要用他們能理解的方式交談。用戶對于最終解決方案和解決難題的方法更感興趣;行政領導和經理更傾向于關注收入及相關的事情;領域專家樂于在相關領域用專業知識提供幫助。你需要利用他們的知識為給定的問題構建一個好的解決方案。
以既定事實開頭
講故事要以人們都知道的事實開頭。可以是用戶每天面對的問題,或是未經優化的、可以智能化的東西,也或許是能為公司創收的東西。若以人們早就知道的事開頭,人們就能有更好的理解,因為他們親身經歷過這件事。
通常,對于不直接接觸技術的概念的人來說,技術概念抽象模糊又復雜。講故事包括兩部分:
- 有助支撐論據、易于觀眾理解后面的故事情節的種種事實。
- 為了說服觀眾采取行動、把故事中展示的事與思考內容和思考方式聯系起來的敘述
因此,有必要以一種為預期的相關者描繪解決方案的方式來展示事實。
利用視覺化吸引觀眾
一圖值千言。的確如此,僅僅一張圖就能展示你想向觀眾傳達的一大堆話。不同的圖表、數字、視覺化工具可供選擇以讓觀眾更好地理解數據進展、數據趨勢以及數據的一般行為。
有時在分析數據或使用不同的統計技術時,可能會遺漏有用信息,此時教具和圖表會起作用。它們使你發現之前未注意到的部分、方面以及對加強數據的理解。
視覺化實際上是一個機會,讓你用觀眾理解的事替代故事。例如,如果在一個圖表里有許多變量,那么觀眾可能不易理解,在圖表也復雜的情況下。所以,你最好制作簡單而直接的視覺圖像以便利用它們敘述故事。
使用統計學理解數據
統計學對于理解和解釋數據大有裨益。你可以從中推斷出許多事實,并利用這些事實來更好地理解它們。
統計學主要可以分為兩類,描述統計學和推論統計學。前者描述現有數據而后者展示數據中不同特點和變量的總體關系。通常,使用描述統計學能獲得關于當前或可用的一組數據的信息,而使用推理統計不僅僅能基于一個或多個樣本使用抽樣來概括總體。
根據故事的不同層面選擇不同的統計學類型很重要,這可以對現成的數據加以解釋,并把結論講給那些你不了解他們的特點的人。你可以使用這一信息告訴觀眾你在數據中發現的不同的理解,并相應地建立不同的假說。
解釋模型的運作原理
機器學習模型通常被稱為“黑盒”。如果你使用過一些高級模型,那么就需要在性能和可解釋性之間進行權衡。線性模型,邏輯回歸模型和基于樹的模型是容易解釋的,而非線性模型是很難解釋的。
在現實世界,沒人想使用自己不理解的東西。而且,在一些領域如銀行業、保險業和藥業,更需要解釋管理過程要求。可解釋性的另一層面是對不同利益相關者的終極信任。眾人皆知,如果我們清楚地理解一件事的運作原理,那么就會自信地使用它、信任它。
同理,機器學習模型也是如此。如果理解這些技術,人們就會對題目更感興趣。可解釋機器學習模型的技術多種多樣。一些現有的技術與統計推斷相關,它們可以幫助我們識別關鍵特征,并從數據中獲得有意義的表示。
講故事涉及多種內容。它是一種藝術,通過實踐和學習可以加強講故事的能力。它可以從原始數據中挖掘出黃金,幫助你和你的用戶發現之前可能會遺漏的理解和信息。
希望本文的技巧能幫你修煉成為一個“講故事大家”。