{eval=Array;=+count(Array);}
取數(shù)是數(shù)據(jù)工作的一個基礎(chǔ)內(nèi)容,也是大多數(shù)“入門”級別數(shù)據(jù)工作人員(例如數(shù)據(jù)分析師)的基本職責,取數(shù)對于前期的數(shù)據(jù)概況和業(yè)務(wù)需求會是一個熟悉和漸進了解的過程,因此這個過程必不可少,特別是對于剛?cè)肼毜男氯恕?/p>
但是,如果一個數(shù)據(jù)工作者長期從事取數(shù)工作(例如超過2年,這里的時間取決于企業(yè)的數(shù)據(jù)規(guī)模和復雜度),那么其價值確實會很小,為什么這么講呢?
這里,首先要談?wù)勅?shù)這個工種的特點,就八個字:上不著天,下不著地。
在企業(yè)內(nèi)取數(shù)的目的無外乎兩個:決策分析(比如各類統(tǒng)計等)和用戶營銷,取數(shù)人員對下銜接了平臺和數(shù)據(jù),對上銜接了業(yè)務(wù)人員,似乎是最容易成為復合型人才的,但大多時候不是這樣。
實際情況是,取數(shù)人員號稱需要理解業(yè)務(wù),但由于不為業(yè)務(wù)發(fā)展負責,因此其不需要鉆研業(yè)務(wù),而通過取數(shù)獲得的直觀業(yè)務(wù)理解是非常有限的。
舉個例子,業(yè)務(wù)人員需要取某個特定口徑營銷活動的目標用戶,取數(shù)人員當然可以方便的取出來,但很少有取數(shù)人員能真正的去理解取數(shù)的背景,當然可能人家也不給這個機會,比如營銷活動的目的是什么、為什么定這個業(yè)務(wù)口徑、采用什么樣的營銷政策、準備怎么觸達這些用戶等等。
從技術(shù)的角度看,取數(shù)人員雖然要接觸平臺和數(shù)據(jù),但由于只取不改,因此技術(shù)要求其實很低,一般掌握簡單的SQL就可以了,但這降低了取數(shù)人員技術(shù)進步的可能,現(xiàn)在很多取數(shù)工具可視化做得不錯,取數(shù)人員甚至連后臺的基本命令都不需要掌握。
因此,取數(shù)人員的實際技術(shù)含量是很低的。
但由于取數(shù)速度又往往影響企業(yè)的決策和營銷效率,因此取數(shù)人員在企業(yè)內(nèi)非常被需要,有些取數(shù)人員自我感覺還不錯,但由于這個工種本身的特點,決定了職業(yè)天花板很低。
更不好的消息是,在一個企業(yè)內(nèi),IT部門一般就是后端部門了,數(shù)據(jù)部門則是IT部門的后端,而取數(shù)又是數(shù)據(jù)部門的末端,取數(shù)特別上不了臺面,上不了臺面意思就是取數(shù)太強調(diào)過程了,沒法體現(xiàn)真正的業(yè)務(wù)或技術(shù)貢獻,部門或公司不需要取數(shù)人員做匯報,其業(yè)績往往只是部門老大PPT上的一個數(shù)字,1000和10000對取數(shù)來說可能是云泥之別,但對于其它人的意義就是一個變動的數(shù)字。
如果你現(xiàn)在已經(jīng)從事取數(shù)工作1年以上了,但被業(yè)務(wù)部門日常、瑣碎的取數(shù)需求占據(jù)大部分時間,每天忙到懷疑人生,你就要想想,自己是否已經(jīng)成為了一臺取數(shù)機器。
一些取數(shù)人員覺得會不服氣,自己幸幸苦苦,加班加點取出那么多數(shù)據(jù),業(yè)務(wù)人員EXCEL、PPT倒騰幾下就出了結(jié)論,自己則沒半點功勞,憑什么?
那你得好好想想蘋果手機的價值鏈,最有價值的是設(shè)計,從來不是富士康,前者具有稀缺性,后者換誰做都可以,這就是現(xiàn)實。
這是很多取數(shù)人員在一個企業(yè)內(nèi)面臨的基本面。
我這么提,并不是說取數(shù)是一個沒有前途的工種,而只是表明,一些工種天然跟業(yè)務(wù),領(lǐng)導聯(lián)系緊密,很容易被關(guān)注,能獲得更多的反饋,也容易獲得進步,潛力不容易被埋沒,而很多工種則相反,特別強調(diào)自省,否則一不小心就成了大叔,泯然眾人矣,類似的其實很多,比如一些維護和客服工作。
首先要說明,從來沒有人明確定義過有取數(shù)這個工種,也沒有人限定過取數(shù)的邊界,你去招聘網(wǎng)站上看,只能看到數(shù)據(jù)建模,數(shù)據(jù)分析,數(shù)據(jù)架構(gòu),經(jīng)營分析,數(shù)據(jù)開發(fā),數(shù)據(jù)管理等這類崗位,但基本沒有取數(shù)。
取數(shù)實際是上述崗位需要掌握的一個基本功,取數(shù)本身只是手段,其內(nèi)涵很難成就一個職業(yè),企業(yè)里現(xiàn)實情況是,一方面很多取數(shù)人員沒認真思考過職業(yè)規(guī)劃,比如取數(shù)了一年還沒點想法,另一方面企業(yè)可能也缺乏數(shù)據(jù)人才培養(yǎng)的環(huán)境,沒能力照顧到每個員工的發(fā)展,往往是走一步看一步,現(xiàn)在外行領(lǐng)導內(nèi)行的情況蠻多的,外行可以搞搞無為而治,但要說培養(yǎng)專業(yè)人才,必須對于這個專業(yè)有深入的理解。
假如你已經(jīng)意識到了這個困境,希望有所改變,我就給五個建議,下面是五千字長文,一定要看完:
1、理解什么叫真會取數(shù)
取數(shù)是理解數(shù)據(jù)和業(yè)務(wù)最有效的手段,如果你是個新人,先老老實實的去實踐吧,即使已經(jīng)有什么數(shù)據(jù)分析師,數(shù)據(jù)建模師等的職業(yè)理想也先藏在心里,這個過程一般在半年到一年,當然各類企業(yè)由于業(yè)務(wù)和數(shù)據(jù)環(huán)境的不同有差異,等到你成為合格的取數(shù)人員了,你再繼續(xù)往下看。
(1)在你所取數(shù)的領(lǐng)域,業(yè)務(wù)人員一開口,你就基本知道怎么取了,完全不依賴它人,這需要反復的練習,形成自己的取數(shù)套路,如果你經(jīng)常跟業(yè)務(wù)人員扯皮,或者返工很多,或者外部評價一般,就要想想是否是自己學藝不精,而不是人家跟你過不去,如果你取數(shù)到一定水平,會形成一定的取數(shù)權(quán)威,業(yè)務(wù)人員會信任你。
(2)面對業(yè)務(wù)人員能獨當一面并不意味著你已經(jīng)是合格的取數(shù)人員,很多企業(yè)寬表做的很好,能夠應付大多數(shù)的取數(shù),筆者建議你至少要知道你這條業(yè)務(wù)線的取數(shù)涉及的所有基礎(chǔ)表的來龍去脈,這需要自頂向下的學習,無法靠簡單的自底向上的日常實踐就能獲得,你要盡量擴充你的數(shù)據(jù)視野,千萬不要被幾張寬表困在局中,否則你完全不知道如何變通,寬表成就不了數(shù)據(jù)分析,數(shù)據(jù)建模等事業(yè),這個大家可以掂量下自己的分量。
如果你覺得夠格了,那可以繼續(xù)往下看,如果現(xiàn)在連取數(shù)都還疙疙瘩瘩,那就別好高騖遠,先認認真真,老老實實的做好了再說。
2、業(yè)務(wù)上要更進一步
在我看來,基于業(yè)務(wù)人員想法來取好數(shù),最多只是"60分工作",即便你的需求來源是業(yè)務(wù)部門老總,也就值60分。何為"60分工作"?就是剛剛滿足溫飽的工作,讓你能賺這份工資,但無法凸顯你的價值。
如果你的職業(yè)規(guī)劃偏向業(yè)務(wù),比如成為經(jīng)營分析師或者數(shù)據(jù)分析師,你就需要通過取數(shù)過程主動表現(xiàn)出你對于業(yè)務(wù)的認識和貢獻,如果你還不知道什么叫作主動體現(xiàn)想法,以下是兩個場景:
(1)主動提供取數(shù)建議:有大量的取數(shù)是有一定難度的,業(yè)務(wù)部門往往事先沒想清楚,這個時候就需要當面溝通,要抓住機會主動提供一些建議,與業(yè)務(wù)人員互動也是理解業(yè)務(wù)需求和分析思路的好機會,要善于換位思考,最好將取數(shù)的主動權(quán)抓在自己手里,引導業(yè)務(wù)人員按你的想法去做,不僅讓人家覺得你這人靠譜,而且可以降低大量無效的取數(shù),要知道,業(yè)務(wù)人員越想不清楚的需求,就越容易亂提,然后雙方就在口徑上糾纏不清,取數(shù)人員經(jīng)常埋怨業(yè)務(wù)部門新人亂提需求,不懂基本的規(guī)則,就是這個原因。
在與業(yè)務(wù)部門互動的過程中,你的取數(shù)能力、業(yè)務(wù)能力、思考能力、溝通能力及表達能力都能獲得很好的鍛煉和展現(xiàn),這種取數(shù)人員很容易被業(yè)務(wù)部門盯上,然后某天就去業(yè)務(wù)部門報道了,當然并不是說一定要走這條路,但這樣做的確讓自己的人生多了一種選擇,畢竟不是每個取數(shù)人員都適合去做技術(shù)。
(2)主動參與一些分析:一般認為,業(yè)務(wù)分析是業(yè)務(wù)部門的事情,數(shù)據(jù)部門很少參與,但實際情況并不是這樣,取數(shù)人員照樣有分析鍛煉的機會,比如KPI指標異動,往往需要先確保原始數(shù)據(jù)準確,然后再從業(yè)務(wù)上查找問題,這個時候業(yè)務(wù)人員和數(shù)據(jù)人員的分工界面其實不是很清楚,大家都可以做,由于取數(shù)人員最先拿到數(shù)據(jù),因此有條件先人一步。
公司也不關(guān)注到底哪個部門應該提供分析報告,而在于哪個部門能更快更好的通過分析發(fā)現(xiàn)和解決問題,因此偏系統(tǒng)層面的欠費分析,稽核分析等等,數(shù)據(jù)部門做往往更有優(yōu)勢。
在做數(shù)據(jù)分析的過程中,取數(shù)人員會養(yǎng)成深度思考的習慣,掌握基本的分析和表達技巧,煉成一種通過數(shù)據(jù)講故事的能力,不僅提升了綜合能力,而且能較好的彰顯自身的價值,性價比是很高的,根據(jù)筆者的觀察,能通過取數(shù)打開一片天空的,很多有數(shù)據(jù)分析的經(jīng)驗。
因此,取數(shù)人員不僅要扮演好"實現(xiàn)者"的角色,更要能成為"思考者",分析則是取數(shù)人員實現(xiàn)突破的康莊大道。
3、技術(shù)提升的空間很大
如果你還是想做技術(shù),那技術(shù)空間可大著,關(guān)鍵在于要有改變的意識,不要總是按部就班,其實取數(shù)過程中接觸的任何現(xiàn)成平臺、工具與數(shù)據(jù)都有改進的機會,關(guān)鍵在于你敢不敢去優(yōu)化,甚至顛覆它們,以下是一些場景:
(1)讓模型變得更好用:數(shù)據(jù)倉庫模型本來的目的是降低取數(shù)的成本,但隨著業(yè)務(wù)發(fā)展、系統(tǒng)變更及取數(shù)復雜性的增大,可用性會越來越差,很多取數(shù)人員就沒有這個意識去改變下,比如增加幾個字段,甚至自己建個模型表,別以為現(xiàn)成的模型師就比你做得好。如果你以后想成為一個數(shù)據(jù)架構(gòu)師,可以從做數(shù)據(jù)倉庫模型優(yōu)化開始,敢于動底層的代碼,在這個過程中能搞清楚一系列的概念,比如ETL,DW,OLAP等等,要敢于去做一些長遠的事,取數(shù)的經(jīng)驗通過模型沉淀下來后可以讓取數(shù)跑得更快,你的優(yōu)化將讓全團隊受益,這就是顯性化價值,如果你想改變,這就是一個切入點。
(2)讓平臺變得更好用:在做數(shù)據(jù)倉庫的時候,為了讓數(shù)據(jù)跑得更快,你需要接觸到大量的技術(shù),評估各類技術(shù)的優(yōu)劣,現(xiàn)在大數(shù)據(jù)平臺hadoop,MPP,流處理是為了滿足不同的大數(shù)據(jù)處理場景需要而產(chǎn)生的,你甚至可以自己來搭建平臺,從數(shù)據(jù)處理者轉(zhuǎn)變?yōu)槠脚_架構(gòu)師,這又是一條成長路徑,當然你要提前做好準備,比如多找些開源工具練手,或者自己搭一個取數(shù)環(huán)境,真有機會才能抓得住。
(3)讓產(chǎn)品變得更好用:假如你發(fā)現(xiàn)很多取數(shù)能夠固化成報表,應該當仁不讓的寫腳本并實現(xiàn)它,假如你所在的企業(yè)提供了取數(shù)工具,你恰好對產(chǎn)品感興趣,就可以結(jié)合取數(shù)的實踐,思考下這個工具有什么問題,有哪些需要改進的地方,做數(shù)據(jù)產(chǎn)品經(jīng)理不是你想做就能做得,你得首先體現(xiàn)出做產(chǎn)品的素質(zhì),敢于提出建議并給出設(shè)計,這就是一個好的開始,團隊少一個取數(shù)人員損失不大,多一個有想法的做開發(fā)和產(chǎn)品的人,那是可遇而不可求的事情。
(4)讓數(shù)據(jù)變得更有用:如果你對數(shù)據(jù)挖掘感興趣,那就不要僅限于只會SQL,起碼要把Python,R等語言學會,能夠端到端的完成一個數(shù)據(jù)挖掘過程,一般數(shù)據(jù)團隊總是有相關(guān)的專業(yè)課題的,機會一到,一定要主動請纓,在做這類具有挑戰(zhàn)性的課題中,你的能力會快速增長,也就實現(xiàn)了華麗轉(zhuǎn)身。
總之,取數(shù)人員如果要做技術(shù),就要想清楚自己要什么,然后讓領(lǐng)導看到你在這方面的努力和變化。
4、從授人以魚到授人以漁
由于市場變化很快,取數(shù)總是滯后于市場,同時企業(yè)的取數(shù)流程帶來的管理開銷是巨大的,無論是溝通成本,審批成本或是反復成本,實際上取數(shù)永遠無法讓業(yè)務(wù)人員滿意,最好的方式是讓業(yè)務(wù)部門自己來取,這是最高效率的做法,但這種模式能否執(zhí)行也依賴于企業(yè)的實際情況。
假如業(yè)務(wù)部門真的愿意自己來取(一般競爭越激烈的企業(yè)驅(qū)動力越強)也不是那么容易,至少取數(shù)人員要配合做到以下幾點:
(1)提供平臺或工具:如果沒有適當?shù)墓ぞ撸尫羌夹g(shù)人員寫SQL(姑且認為分析師是技術(shù)吧),可能普通業(yè)務(wù)會排斥,此時需要給他們提供一個界面化、可點擊、可拖拽的工具。這種系統(tǒng)如果只是簡單的基于底層數(shù)據(jù)來開發(fā)不難,無非是將用戶界面的點擊和篩選條件,映射到后臺的sql“模板”,并生成一個sql語句然后再去數(shù)據(jù)庫執(zhí)行,這種方法往往比較容易接受且非常靈活。或者市面上有現(xiàn)成的BI工具,諸如下放圖片所示的FineBI,可以直接用于搭建企業(yè)的數(shù)據(jù)分析系統(tǒng),也是非常好的選擇!
(2)提供適當?shù)呐嘤枺焊鳂I(yè)務(wù)線學員自己要能獲取數(shù)據(jù),要給業(yè)務(wù)線的其中一個經(jīng)常運用到數(shù)據(jù)的人員進行培訓,對每個部門種下一名種子選手,當這名選手學會之后,他有個任務(wù)就是把技能擴散到部門中的各個人員。
(3)普及數(shù)據(jù)文化:由于人員培養(yǎng)是個長期過程,因此需要協(xié)同公司的人力等部門,建立一套常態(tài)化的培訓機制,包括課程體系、師資隊伍等等,比如筆者企業(yè)的大數(shù)據(jù)千人計劃,當前每年開展的培訓次數(shù)超過4000人次。
如果你已經(jīng)意識到這一點,可以嘗試著現(xiàn)在就提出這種思路,甚至簡單的去實現(xiàn)一個自助取數(shù)工具,說不定會獲得認可呢?即使推動不了業(yè)務(wù)部門用,自己用也可以,配置是絕對快過自己寫代碼的,比如我們有只7個人的取數(shù)團隊,手工+配置每天能做到30張單子,原來沒有配置能力前就只能做十幾個。
授人以漁這種支撐模式跟每個企業(yè)的發(fā)展階段有關(guān)系,其實你能做的大多時候只能是順勢而為,但要相信自助化是一個趨勢,不嘗試永遠沒有機會。
5、與業(yè)務(wù)人員做一定的博弈
博弈的目的不是為了推擋取數(shù)需求,而是因為取數(shù)這種事務(wù)性的工作,特別容易讓你陷入低質(zhì)勤奮的狀態(tài),取數(shù)人員需要為自己留出一定的時間來思考前面筆者提出的系列問題,比如機器換人,大量的資源投入長遠來講實際還損害公司的利益,不少企業(yè)碩士或者博士都在長期取數(shù),這是資源的浪費。
(1)建立一套取數(shù)管理機制和流程,包括標準化的取數(shù)模板,嚴格的審批流程等等,雖然增加了取數(shù)門檻,但也會擋掉一些需求,給自己一些時間緩沖,否則很容易會被各種緊急需求淹沒。
(2)多問問業(yè)務(wù)人員取數(shù)的目的,別當老好人,你問得越多,業(yè)務(wù)人員提需求就會越謹慎,比如常問“你要這個數(shù)據(jù)干什么?“,對業(yè)務(wù)人員來說就是一種威懾,有可能數(shù)據(jù)需求連他們自己都沒想明白,這可以有效過濾掉不靠譜的、不尊重別人時間的需求。
(3)需求太多的時候可以跟業(yè)務(wù)人員協(xié)商,排定優(yōu)先級,暗示時間和資源有限,把時間放在高價值、最重要的地方。
相信你的上級所以一直讓你做取數(shù),大多時候,是因為根本不知道你除了取數(shù)還能干什么,假如你的確按照以上的做了,發(fā)現(xiàn)企業(yè)仍然不能給你進一步提升的機會,你就要考慮是不是應該換個公司。
這好像是很多數(shù)據(jù)分析師難逃的命運!
不過從根源上來說本人認為原因有兩個:
第一,公司和領(lǐng)導缺乏認知,對于崗位定位不明確,放縱一個本來可以創(chuàng)造更多價值的崗位變成了一個取數(shù)機器!
第二,數(shù)據(jù)分析師是一個同時偏業(yè)務(wù)測和技術(shù)側(cè)的崗位,但其核心還是對于問題的思考方式,并非一身技術(shù)才華就能做得很好的,所以這一塊還是靠著個人扎實技術(shù)的同時,多思考業(yè)務(wù)真正的問題,很多問題并非真正的問題,就好像之前遇到過一個公司一直在努力解決公司的投訴問題,殊不知投訴的根源是產(chǎn)品問題!
數(shù)據(jù)分析師就是用簡單、通俗的數(shù)據(jù)表現(xiàn)方法表達數(shù)據(jù)內(nèi)在的本質(zhì)及規(guī)律性。要完成此目的并不是簡單的進行一系列的數(shù)字邏列,而是要在充分的大量的數(shù)據(jù)基礎(chǔ)上進行分析、判斷,此外還需進行各種調(diào)查研究,進行對比分析,找出可信的、有說服力的行業(yè)或糸統(tǒng)資料,為領(lǐng)導分析、判斷提供科學的數(shù)據(jù)支持。
0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答