七次全國人口普查——一個超大的“用戶畫像”
本文轉載自微信公眾號「數師兄」,作者數師兄。轉載本文請聯系數師兄公眾號。
在萬眾期待之下,伴隨著各種質疑和猜測,第七次全國人口普查數據千呼萬喚始出來,終于在5月11日公之于眾。
從數據分析的角度來看,人口普查就相當于對全國人民做了一個畫像,從年齡、地域、教育水平等維度來描述我國人口當前分布狀況。
今天我們就著第七次人口普查數據,閑扯一篇。
1.整體趨勢
(截自《第七次全國人口普查公報(第二號)》)
從上圖來看,全國人口雖未負增長,但其增速已經平得不能再平了,年均增長率0.53%,可以理解為近十年在每一萬人中,每年新生人口減去死亡人口數量后的凈新增只有5.3。
(截自《第七次全國人口普查公報(第二號)》)
再看這個平均每個家庭的人數,不足3個人,較上一次普查減少了0.48,這一數字給我們的直觀感覺就是大量家庭是沒有孩子的。除了年輕一代長大成人建立了新的家庭之外,還有一大因素就是這些新生家庭的生育意愿正在降低。
過去幾次普查數據顯示的年均增長率一直都是在下降,1990年-2010年,可以理解為在計劃生育相關政策的控制下,將人口增速逐步放緩,而最近幾年我們已經放開了二胎,按理說在如此大的人口基數之下,且醫療水平日益提高的今天,正常死亡率會越來越低,凈新增應該會出現較大漲幅才對。而實際的增長比上一個十年還要平,“死亡”沒有問題,那么“新生”可能就不對勁了。
放到我們通常的互聯網產品上來說,這就相當于我們的活躍用戶數量增長緩慢,“新生人口”就是我們的新增用戶(安裝、注冊等),“死亡人口”就是流失用戶(注銷、休眠等)。對于一個發展中的產品,如果新增緩慢,“開源節流”就要提上日程了,這就輪到渠道調控發揮作用了。
2.區域分布
(截自《第七次全國人口普查公報(第三號)》)
受于人口基數的影響,在大環境相對穩定的情況下,廣東、山東、河南、江蘇、浙江這幾個人口大省仍然是位居前列。但是省與省之間的差異卻是巨大的,這受到了地理環境、歷史文化、經濟水平等等多重因素的交叉影響,最后以行政單位形成了一個分界線。
同樣,引申到用戶畫像上,不同地域的用戶就會具有不同特征,人們在地理位置上的聚集,會一定程度上反應出其在教育水平、家庭收入、文化理念、風土人情等各方面的區域特性。所以,在用戶畫像當中,地域分布往往都是一個非常重要的標簽,通常會按行政區劃、城市等級兩個方面來進行劃分。
3.性別構成
(截自《第七次全國人口普查公報(第四號)》)
我國男女比例并不大,近年波動也較為平緩。這對于單身狗們來說算是個好事兒,至少理論上,狗子們找到另一半的機會還是很可觀的。
性別是所有人群的一個自然屬性。男性和女性通常會具有不同的行為習慣、不同的性格、不同的需求,所以在常規的畫像當中,性別這一標簽也有很重要的作用。正是因為不同性別的用戶其行為特征差異較大,所以一些產品往往可以利用這一標簽大做文章,常見的就是電商平臺、內容平臺的推薦策略等。
4.年齡構成
所有人還有另一個自然屬性,年齡。國家層面上來看,老壯青年齡的分布很大程度上可以左右未來的發展潛力。
(截自《第七次全國人口普查公報(第五號)》)
從本次人口普查公布的年齡分層數據來看,雖然青壯年人口(15-59)占比仍有63.35%,但是對比2010年的第六次人口普查來看,就顯得有些后繼乏力了。60或65歲以上人口占比上升了5個百分點左右,老齡化的趨勢愈發明顯。而隨著這一數據的發布,當日下午的養老概念股就開始持續走高,未來養老產業可能將要迎來一次高潮。那么為了避免青黃不接、減小老齡化的影響,可以預見政府將會采取一些鼓勵生育的措施。所以到時候,我等打工人養娃的成本也許會有所下降,希望這些政策早日出臺,我們也可以早日為中華民族的繁榮昌盛再添一把力,生生不息。
再次回到用戶畫像上,用戶的年齡對于互聯網產品通常也是極為重要的一個特征。因為不同年齡階段的用戶往往具有不同的需求,比如老人愛“養生”、日常“催婚”“催生”,年輕人愛熬夜、愛禿頭、愛追求自由,熊孩子們愛動畫片、愛“坑隊友”,有孩子的中年人就愛“學習”、愛“攀比”、愛娃生過愛自己。玩笑歸玩笑,有一說一,年齡代表了一個人所處的人生階段,瞄準目標人群有的放矢,這是畫像的初衷。
5.受教育水平
(截自《第七次全國人口普查公報(第六號)》)
在人群受教育水平上,北京可謂是一騎絕塵。百分之四十多的大學以上學歷,比第二名的上海還高出8個百分點,其教育資源之豐富與其對高學歷人才的吸引能力可見一斑。從全國來看,當前大學學歷人群與上次人口普查時相比,增加了約70%,這表示我們國家高等教育的普及程度越來越高了,拋開地域因素不談,我們這代打工人的崽兒也有了更多機會去接受更好的教育。
一個人受教育的程度,會影響他的眼界、能力、素養、行事風格等,那么當然用戶畫像也用得著這一標簽。以短視頻平臺為例,其用戶有著明顯的教育水平分層,平臺上充斥著大量三俗內容、虛假信息,而這些內容下的用戶多數教育程度不高,容易被不良自媒體誤導和引誘。本身這些用戶并非此類內容的生產者,而是因為這些自媒體的低質內容錨住了下沉用戶群。當然平臺上也不乏有良心的自媒體賬號和優質內容,但還是希望平臺可以加大力度整治不良內容、凈化網絡環境,生產休閑娛樂內容的同時,也能讓更多的科學知識惠及到普羅大眾,傳播更多的正能量和正確的三觀。
結語
到這里第七次人口普查的數據基本上就講完了。
通篇來看呢,就相當于對我們的全國人民做了一個畫像,通過地域、年齡、性別、教育等屬性來描述用戶群的分布。那么在分析師的分析工作中,除了以上維度的應用,還有很多其他的畫像標簽在這里是沒有提及的,比如:用戶在產品中的行為、用戶的偏好、用戶社群關系等等。