摘要:今天,我就用數據告訴你,書中到底有沒有黃金屋。數據來源利用的拉勾爬蟲爬取了拉勾杭州站,要求年工作經驗的條招聘數據。原始數據的薪資是一個區間,將區間拆分為最低與最高兩個變量。大專本科碩士工資單位月最低工資分布最高薪資
北起漠河南至曾母暗沙,東達撫遠西至斯姆哈納。在廣袤的中國土地上,千百年一直流傳著古老的傳說:書中自有黃金屋。
今天,我就用數據告訴你,書中到底有沒有黃金屋。
數據來源利用 Max 的拉勾爬蟲爬取了拉勾杭州站,要求3~5年工作經驗的1000條招聘數據。
簡單數據分析 疑問1:不同學歷進的公司規模有明顯不同嗎?positionlist_grouped = positionlist.groupby(by = ["companySize","education"],as_index = False).count()
將數據按照公司規模與教育程度分組。
plt.rcParams["font.family"] = ["Arial Unicode MS"] plt.rcParams["axes.unicode_minus"] = False sns.set_style("whitegrid",{"font.sans-serif":["Arial Unicode MS","Arial"]}) # Draw a nested barplot to show survival for class and sex g = sns.catplot(x="companySize", y="positionId", hue="education", data=positionlist_grouped, height=6, kind="bar", palette="muted") g.despine(left=True) g.set_ylabels("count");
繪制分組數據的條形圖。
從圖上可以看到,雖然明確要求碩士的崗位比較少,但是不同規模的公司對學習要求的分布基本一致。
不同學歷進的公司規模沒有明顯不同。
疑問2:不同學歷進的公司財務狀況有明顯不同嗎?做法與疑問1一樣,區別是將數據按照財務狀況和學歷進行分組,然后繪制分布的條形圖。
groupbyfe = positionlist.groupby(by = ["financeStage","education"],as_index = False).count()
我們可以看到 C 輪的公司開放給大專學歷的崗位相比 B 輪有一個斷崖式的下跌。餅圖會更明顯的反應出這個現象。
plt.pie("positionId",labels = "financeStage",data = groupbyfe[groupbyfe["education"] == "大專"],autopct="%1.1f%%") plt.title("專科"); .... ....# 省略了繪制本科的代碼 ....# 省略了繪制碩士的代碼
對比三個餅圖,注意觀察本科和專科,B、C 輪公司的分布,我們可以看到 C 輪的公司提供給專科學歷的人的崗位占比非常的低。
所以對于疑問2,我的看法是:不同學歷進的公司財務狀況基本一致,但是 C 輪的公司可能更傾向于招募本科及本科以上學歷的員工。
疑問3:不同的崗位對學歷的要求有明顯不同嗎?對于這個問題,我繪制了詞云。
首先將數據按照職位類別和學歷進行分組并統計頻數
僅保留分組數據的職位類別和學歷列
將新的數據轉置
將職位類別行設置為列名
利用 pandas 的 to_dict 方法生成詞頻數據
利用 wordcloud 的 generate_from_frequencies 方法繪制詞頻
positionlist_grouped = positionlist.groupby(by = ["secondType","education"],as_index = False).count() grouped_dz = positionlist_grouped[positionlist_grouped["education"] == "大專"].loc[:,["secondType","positionId"]].T.dropna(axis = 1) grouped_dz.rename(columns=grouped_dz.loc["secondType",:],inplace = True) grouped_dz.drop(labels = "secondType",inplace=True)
from wordcloud import WordCloud wordcloud = WordCloud(font_path="/Library/Fonts/Songti.ttc",background_color="white").generate_from_frequencies(grouped_dz.to_dict("records")[0]) plt.imshow(wordcloud, interpolation="bilinear") plt.axis("off") plt.show()
上面三張圖由左至右分別是專科、本科與碩士學歷的職位詞云。
可以看到銷售相關的工作要求專科學歷即可,運營、后端開發、移動前端開發、產品經理等崗位對學歷的要求專科、本科平分秋色。而一些當下火熱的崗位,比如人工智能、硬件開發、數據開發等,大部分公司對學歷的要求是碩士。
疑問4:不同學歷的薪資有明顯不同嗎?終于,到了最核心也是大家最關心的部分。
原始數據的薪資是一個區間,將區間拆分為最低與最高兩個變量。
positionlist["Lsalary"]=positionlist["salary"].str.split("-",expand = True)[0].str[:-1].astype(int) positionlist["Hsalary"]=positionlist["salary"].str.split("-",expand = True)[1].str[:-1].astype(int)
繪制不同學歷的最低薪資與最高薪資分布直方圖。
x = positionlist[positionlist["education"] == "大專"].loc[:,["Lsalary"]] y = positionlist[positionlist["education"] == "本科"].loc[:,["Lsalary"]] z = positionlist[positionlist["education"] == "碩士"].loc[:,["Lsalary"]] ax = sns.distplot(x) ax = sns.distplot(y) ax = sns.distplot(z) ax.set_xlabel("工資(單位K/月)") ax.set_title("最低工資分布"); #*****最高薪資
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/43873.html
摘要:今天,我就用數據告訴你,書中到底有沒有黃金屋。繪制分組數據的條形圖。我們可以看到輪的公司開放給大專學歷的崗位相比輪有一個斷崖式的下跌。繪制不同學歷的最低薪資與最高薪資分布直方圖。北起漠河南至曾母暗沙,東達撫遠西至斯姆哈納。在廣袤的中國土地上,千百年一直流傳著古老的傳說:書中自有黃金屋。 今天,我就用數據告訴你,書中到底有沒有黃金屋。 數據來源 利用 Max 的拉勾爬蟲爬取了拉勾杭州站,要求...
摘要:對于商業市場來說,特別是中國這樣一個云計算才剛剛起步的市場。反觀云計算售賣的一些商品,目前主要還是以服務器為主。云計算的本質是將計算能力轉化為標準化,可售賣的服務。可以說是云計算實踐的一個經典案例。有的人會問,云計算廠商需要提供哪些服務。 2015年伊始,國內云計算市場可謂風起云涌。各路群豪紛紛涌入這個市場。其中最活躍的領域當屬IAAS。阿里騰訊硝煙未盡,百度重新檢討了自己的PAAS戰略后,...
摘要:華為說應屆生招聘已經結束了。我進入華為之后,要定崗,一般大家都愿意去市場部,因為華為最強的是市場部。我非常驚訝,因為為了避免這樣的事情,在簡歷里我只字未提在華為的測試經歷。 非商業轉載請注明作譯者、出處,并保留本文的原始鏈接:http://www.ituring.com.cn/article/72226 段念,現任豆瓣工程副總裁,曾在Google,樂元互動,OpenTV等公司...
摘要:認知突圍做復雜時代的明白人石志遠到底什么才是明白人,處在浪蕩歲的我何談明白。和認知層次不同的人交流,猶如雞同鴨講。同一件事情可以做的更快,單位時間內做事情的數量越多,賺取的時間越多。單位時間內做事的經歷越多,人生經歷越豐富,賺取的時間越多。 《認知突圍》做復雜時代的明白人 石志遠 到底什么才是明白人,處在20浪蕩歲的我何談明白。 引子 以前,有三個乞丐在城門口要飯,正好踫到皇上出宮狩獵...
摘要:以后會持續添加一些總結年,延續著年的野心,打算在考大學之前完成一個成功的項目,但屢屢遭到了挫折。到現在,年,這個項目已經完成了,但是覺得自己是無法在高考前把它發布的了。 showImg(http://segmentfault.com/img/bVbJID); 題圖為本文作者作品,未經許可請勿轉載并修改發布。另外聲明,題圖不是本人。 Mark:以后會持續添加一些總結 2013...
閱讀 3290·2021-09-09 11:39
閱讀 1237·2021-09-09 09:33
閱讀 1139·2019-08-30 15:43
閱讀 555·2019-08-29 14:08
閱讀 1741·2019-08-26 13:49
閱讀 2386·2019-08-26 10:09
閱讀 1553·2019-08-23 17:13
閱讀 2291·2019-08-23 12:57