財經專業學生應該如何學習人工智能?
我讀大學的時候專業是自動控制,當時正是人工智能的冬天。有一天我對神經網絡產生了興趣,于是問一個老師該如何學習神經網絡。結果老師搖著頭說,神經網絡上世紀就已經被研究爛了。這個畫面至今記憶猶新,常在我腦子里浮現。很多年之后我還是很疑惑:神經網絡真的沒啥前途么?由此可見,大學老師不能隨便對一件事情做出主觀性太強的判斷。
今天我將從三個方面去談財經學生怎樣學習人工智能:學習的目的,學習的內容以及學習的方式。
財經人才→財經(金融)科技人才
因為知識背景和思維特點的差異,財經學生和工科學生學習AI的出發點和規律都是不同的。工科學生比較容易上手,但是在尋找應用場景方面會比較薄弱;財經學生專業知識比較強,但是對一些技術的掌握速度比較慢。理想的情況應該是兩者相互合作或者財經專家領導工程專家。但從目前的情況來看,傳統財經專業的學生很難具備這樣的領導力。
我認為財經學生學習AI并不是要去替代工科學生,而是要成為領導角色。不是領導人,而是領導機器。這種領導角色具有良好的專業知識,理解編程的基本邏輯,能夠將AI的框架與專業知識框架進行融合。這也是未來各行各業***人才必須具備的能力:你不用很會編程,但是你要知道程序是怎么寫出來的,以及如何與技術人員進行對話與合作。
在進一步之前,需要破除一個誤區。
現在很多人以為金融科技就是量化投資,智能投顧等。不少財經類的學生一聽到這樣的詞匯就感到很興奮,覺得高大上,趨之若鶩。
我想潑一下冷水:在量化投資領域,財經學生基本上不是工科學生的對手。因為這個應用場景實在是太簡單了,無法發揮財經專業的優勢。
量化投資只是金融科技里面一個很簡單的場景,它的潛力被輿論高估了。真正的藍海是其他更加廣泛的財經領域,比如會計,資產評估,保險等等。這些領域的特點是商業模式更加復雜,需要更深厚的專業背景,并不是簡單用一些復雜的機器學習算法就能完成的。
財經專業學生應該把重點放到這些行業,也就是與自己所學專業密切相關的領域,這才是你們真正有優勢的地方。每個細分領域都需要一個AI,財經學生應該盡快的去思考自己所在的領域應該如何設計和使用AI,有哪些數據是可用的。你們在學校里雖然不能做出一些非常復雜的應用,但是應該進行一些簡化的訓練,以具備基本的技能。等你們畢業之后,要用一生的時間去優化和實現自己的AI,就像你的孩子一樣,***。
計量模型→數據科學
那么下一個問題,利用AI進行數據分析與現在的計量分析有什么不同呢?UCLA的朱松純老師做了一個很好的歸納。他講的比我好,直接把原文復制過來:
同樣是在概率統計的框架下,當前的很多深度學習方法,屬于一個被我稱作“大數據、小任務范式(big data for small task)”。針對某個特定的任務,如人臉識別和物體識別,設計一個簡單的價值函數Loss function,用大量數據訓練特定的模型。這種方法在某些問題上也很有效。但是,造成的結果是,這個模型不能泛化和解釋。所謂泛化就是把模型用到其它任務,解釋其實也是一種復雜的任務。這是必然的結果:你種的是瓜,怎么希望得豆呢?我多年來一直在提倡的一個相反的思路:人工智能的發展,需要進入一個“小數據、大任務范式(small data for big tasks)”,要用大量任務、而不是大量數據來塑造智能系統和模型。
沿用朱老師的觀點,我認為大家課堂上學的計量分析可以歸納為第三種范式:小數據、小任務范式(small data for small tasks)。雖然我也認為大數據是過度炒作,應該回歸到“小數據、大任務范式(small data for big tasks),但從學習的角度來講,財經學生應該這三種范式都去訓練。
大數據的好處是可以容錯,容易產生一些pattern,但是大部分領域的數據量是遠遠談不上大數據的,對模型和場景的理解的要求會更高,這對于財經學生來說是個好消息。
在這里我還要強調一點,計量雖然很重要,但是不要局限在這個層面,一定要從數據科學的高度去理解數據,這樣才能更好的理解新的概念和方法。
數據是一個江湖
到目前為止,我們談到了三個問題:數據,模型(場景)和算法。這三個維度是AI的核心三角。一般來說工科人才強于算法和數據處理,弱于場景設計,財經人才則相反,強于場景,弱于算法和數據。
針對這個問題我的建議是,財經學生應該按照場景、數據和算法的順序設定優先目標。場景也就是建模,這是專業知識的訓練,永遠是核心競爭力的關鍵。數據則是第二優先的目標。財經學生要從很早就開始思考,自己行業的數據能夠從哪里來,具有什么樣的特點,應該如何去組織和結構化?
對于數據,我的觀點是公開數據已經足夠做出很好的東西。很多人一談數據就覺得一定要有私有數據。這種狹隘的認知導致在大數據時代,數據孤島的現象反而更加嚴重了。
數據是一個江湖,只有數據沒有用,必須要有處理數據的技術能力。單一的數據也沒有用,必須要與其他的數據進行融合才能發揮價值。對于數據一定要建立開放的價值觀,分享優于孤立。你只有不斷的與他人分享合作,才能逐漸理解數據的內涵,建立起更強大的AI系統。因為數據本身是死的,處理數據的方式才是關鍵,你與別人的鏈接是方法的鏈接。 如果把一個行業的公開數據搞明白了,那你已經處于絕對領先的地位。還有一個告誡:一定要盡早積累原始數據,因為其實很多數據會很快消失的,時間可能是比數據規模更重要的維度。
風險!風險!風險!
那么財經學生在進行場景設計的時候重點應該考慮什么呢?
簡而言之:圍繞著風險做文章!
財經科技的***波浪潮以辦公自動化為主,通過安裝財務管理系統之類的方法,以提高效率,降低成本,而這些工作一般的專業IT公司就能夠承擔。但人工智能時代,核心問題并不是效率或成本,而是風險管理。
誰能夠利用新的方法和數據去發現未知的風險,誰就能占據這個領域的新高點。因此財經學生在利用AI解決問題的時候,必須緊緊圍繞風險這一概念。注意這個風險是個廣義的風險,并不是簡單的信用風險或交易風險。圍繞著風險去尋找數據和設計模型,這個方向一定不會錯。
越早開始越好
有了上面的認知之后,下面談一下基本的學習方法,財經學生應該掌握哪些基本技能,從什么時候開始學習***?
我認為從大一下學期就應該開始相關的學習了,重點是編程語言,例如Python。我發現很多學生到了研究生還沒學過Python,這實在是太晚了。Python應該成為財經學生的公共基礎課。
大二時至少掌握以下基本的編程技能,例如:編寫爬蟲程序,抓取基本的數據,調用程序接口,自動生成報告,使用AI開源平臺等。有了這些準備之后,到了大三就可以開始搜集數據和解決一些更為復雜的問題了。
如果錯過了上述的時機,就比較麻煩了,因為高年級學生要做的事情太多,相關的學習就不得不推遲到研究生階段。一拖再拖,永遠落后。
對于一些AI算法,我的觀點是會用即可,不用深究其中的細節和原理,因為很多算法本身還是黑箱。要充分利用網絡上的資源,多去嘗試不同的場景,了解每個算法的優缺點,如果有興趣再去學習更深的東西。因此,切不可有畏難心理,照葫蘆畫瓢也是一種很好的學習方式。
關于財經學生學習人工智能的方法還在研究之中,我們的AI特訓班還在探索,相信很快會有很好的經驗供大家參考,請關注我們的后續文章。