摘要:據(jù)說(shuō)此部之后,不少影迷熟知的角色演員就要離開(kāi)漫威世界的熒幕了。換句話說(shuō)用數(shù)據(jù)說(shuō)話,誰(shuí)才是漫威宇宙中著墨最多的人物我之前做了個(gè)小調(diào)查僅就我這邊的采樣來(lái)看,鋼鐵俠在國(guó)內(nèi)是無(wú)法撼動(dòng)的人氣王。
復(fù)聯(lián)4上映了!這次比美國(guó)還早了兩天。當(dāng)然,我還沒(méi)看,不會(huì)給你們劇透,當(dāng)然也不想不劇透。
這一部不僅是滅霸這一線劇情的結(jié)局,也被認(rèn)為漫威第三階段的收官之作。據(jù)說(shuō)此部之后,不少影迷熟知的角色(演員)就要離開(kāi)漫威世界的熒幕了。因此剛上映就備受關(guān)注,今天一天國(guó)內(nèi)票房就已超5億。
上次的文章《這可能是我用過(guò)最“強(qiáng)大”的API:Marvel API》中,我給大家演示了 漫威開(kāi)放接口(Marvel API) 的功能,并且在最后留了個(gè)“彩蛋”:爭(zhēng)取跟《復(fù)聯(lián)4》同步上線一個(gè)案例。
很遺憾,最近幾天忙著更新網(wǎng)站,眼看要鴿了。但慶幸的是,我們另一位實(shí)訓(xùn)生 @清風(fēng)小筑 站出來(lái)把坑給填了:
對(duì) Marvel API 中的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,將角色之間關(guān)系進(jìn)行可視化展示。 換句話說(shuō): 用數(shù)據(jù)說(shuō)話,誰(shuí)才是漫威宇宙中著墨最多的人物 ?
我之前做了個(gè)小調(diào)查:
僅就我這邊的采樣來(lái)看,鋼鐵俠在國(guó)內(nèi)是無(wú)法撼動(dòng)的人氣王。當(dāng)然,這可能因?yàn)閲?guó)內(nèi)更多是漫威系列電影觀眾。
那么官方的喜好又是如何?
上文中我們說(shuō)過(guò),在 Marvel API 的開(kāi)放數(shù)據(jù)中,包含了:
1491 個(gè)角色
43759 本漫畫(huà)
6200 個(gè)創(chuàng)作者
10713 個(gè)系列
96740 個(gè)故事
75 個(gè)事件
我們這次案例選取的是 角色(character) 和 故事(story) 之間的關(guān)系:
選取 故事最多的 N 個(gè)角色
根據(jù) 共同出現(xiàn)的故事數(shù) ,衡量 角色之間的關(guān)聯(lián)性
經(jīng)過(guò)統(tǒng)計(jì)發(fā)現(xiàn),故事數(shù)前3的是:
蜘蛛俠(Spider-Man)- 5192
X戰(zhàn)警(X-Men)- 4551
鋼鐵俠(Iron Man)- 3483
關(guān)聯(lián)性最高的前3位:
X戰(zhàn)警 - 金剛狼 - 1001
神奇四俠 - 霹靂火 - 817
神奇四俠- 隱形女俠 - 773
故事數(shù)最多的25個(gè)英雄/團(tuán)體的關(guān)系圖:
故事數(shù)最多的99個(gè)英雄/團(tuán)體的關(guān)系圖:
Data provided by Marvel. 2014 Marvel
數(shù)據(jù)由 Marvel 提供
來(lái)源:http://marvel.com
意料之外但情理之中, 蜘蛛俠是出現(xiàn)故事最多的角色 。這還只是主線角色,沒(méi)算上各個(gè)平行宇宙和衍生角色。事實(shí)上,小蜘蛛在漫威迷中一直有著超高的人氣,或許是因?yàn)樗墓适赂咏诂F(xiàn)實(shí)中的每一個(gè)平凡人,也或許是他那份“ 能力越大,責(zé)任越大 (With great power comes great responsibility)”的堅(jiān)持。而在國(guó)內(nèi)觀眾熟知的漫威系列電影中,蜘蛛俠似乎戲份不多,這是由于蜘蛛俠的電影版權(quán)很早就賣(mài)給了索尼(X戰(zhàn)警和神奇四俠也是類(lèi)似)。
鋼鐵俠、美隊(duì)、金剛狼 是緊隨其后的角色, X戰(zhàn)警 是故事最多的團(tuán)體。
關(guān)系圖上的顏色不是我們手動(dòng)標(biāo)注的,而是 Gephi 通過(guò) 聚類(lèi) 自動(dòng)劃分的。文字標(biāo)簽的大小則體現(xiàn)故事數(shù)的多少。 X戰(zhàn)警、神奇四俠、復(fù)仇者聯(lián)盟 ,這三個(gè)團(tuán)體壟斷了漫威絕大部分的故事。神奇四俠雖然人物和故事不算多,但相關(guān)關(guān)聯(lián)很緊密(大多同時(shí)出場(chǎng)),相反典型是 雷神(Thor) ,雖然故事很多,但大多獨(dú)來(lái)獨(dú)往。
最后來(lái)說(shuō)說(shuō)這個(gè)關(guān)系圖的實(shí)現(xiàn)過(guò)程。主要是兩大塊:
從 Marvel API 獲取數(shù)據(jù) 。首先是獲取所有角色,然后獲取角色相關(guān)的故事,再根據(jù)這些故事信息將角色進(jìn)行關(guān)聯(lián)統(tǒng)計(jì),最終得到 節(jié)點(diǎn)(角色、故事數(shù))和邊(關(guān)聯(lián)故事數(shù)) 的數(shù)據(jù)。
通過(guò) 可視化分析工具 Gephi 將節(jié)點(diǎn)和邊的數(shù)據(jù)進(jìn)行 可視化 展示,生成關(guān)系圖表。Gephi 的功能很強(qiáng)大,可以調(diào)節(jié)不同的展示效果,各位可以自行體會(huì)下。
其他需要注意的:
我們沒(méi)有直接通過(guò)網(wǎng)絡(luò)請(qǐng)求 Marvel API,而是使用了上次文章中提到的 marvel 模塊來(lái)實(shí)現(xiàn)。(使用示例見(jiàn)前文)
中間的臨時(shí)數(shù)據(jù),因?yàn)槭?JSON 格式,于是我們用 mongodb 進(jìn)行了存儲(chǔ),便于后續(xù)整理分析。如果你自己運(yùn)行,也可以通過(guò)其他方式(比如文件)進(jìn)行存儲(chǔ)。
經(jīng)過(guò)處理后的節(jié)點(diǎn)、邊數(shù)據(jù)我們保存成了 csv 文件,你可以在項(xiàng)目中獲取,直接放進(jìn) Gephi 使用。僅供學(xué)習(xí),請(qǐng)勿商用。
Marvel API 需要 申請(qǐng)秘鑰 、有請(qǐng)求 速率限制 ,使用時(shí)需 標(biāo)注數(shù)據(jù)出處和來(lái)源網(wǎng)址 。
相關(guān)網(wǎng)址:
Marvel API https://developer.marvel.com/docs
marvel庫(kù) https://pypi.org/project/marvel/
Gephi操作手冊(cè) https://gephi.org/users/quick-start/
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://m.specialneedsforspecialkids.com/yun/43653.html
摘要:數(shù)據(jù)庫(kù)文件已經(jīng)超過(guò)了了。復(fù)聯(lián)從開(kāi)始便是漫威宇宙各路超級(jí)英雄的集結(jié),到現(xiàn)在的第部,更是全英雄的匯聚。所以,滅霸出現(xiàn)的次數(shù)居然高于了鋼鐵俠。情感分析,又稱(chēng)為意見(jiàn)挖掘傾向性分析等。 showImg(https://segmentfault.com/img/remote/1460000019095022); 作者 | 羅昭成責(zé)編 | 唐小引 《復(fù)聯(lián) 4》國(guó)內(nèi)上映第十天,程序員的江湖里開(kāi)始流傳這...
摘要:另外由于豆瓣上一些電影評(píng)分?jǐn)?shù)量太少而不顯示,所以這里的電影數(shù)量會(huì)和票房數(shù)量有所差異。月度票房將類(lèi)型片的票房按月劃分,得到了這張圖。 去年末的時(shí)候,我招收了新的 實(shí)訓(xùn)生 。本文是其中一位 @齊大圣 同學(xué)在實(shí)訓(xùn)兩個(gè)月時(shí)完成的項(xiàng)目案例。(碼上行動(dòng)群里同學(xué)應(yīng)該都看過(guò)這個(gè)名字,現(xiàn)在也是助教之一。)項(xiàng)目最初的想法是, 從互聯(lián)網(wǎng)上的公開(kāi)信息中采集2018年在國(guó)內(nèi)上映電影的票房、評(píng)分、類(lèi)型、演員等信息...
摘要:上個(gè)禮拜權(quán)力的游戲第八季放出大結(jié)局,最終的結(jié)果布蘭登上了鐵王座。第二位臨冬城史塔克家族的城堡。第二位是什么都不懂的雪諾。第三位是白手起家最后又被騙的龍媽。 showImg(http://upload-images.jianshu.io/upload_images/13825820-995fbee837346456.jpg?imageMogr2/auto-orient/strip%7Ci...
摘要:昨天去看了最近火的發(fā)熱的好萊塢大片奇異博士,故事套路依舊好萊塢,特效吊炸天,看著確實(shí)挺爽。咒語(yǔ)是編程這個(gè)世界的源代碼的關(guān)鍵詞,或者函數(shù)。奇異博士讓我們接觸到了這個(gè)世界的底層世界,魔法師則是能夠掌握和利用這個(gè)底層世界的一群人。 昨天去看了最近火的發(fā)熱的好萊塢大片《奇異博士》,故事套路依舊好萊塢,特效吊炸天,看著確實(shí)挺爽。 showImg(/img/bVFeD0?w=640&h=360);...
閱讀 1960·2021-09-30 09:46
閱讀 1371·2019-08-30 15:43
閱讀 1130·2019-08-29 13:28
閱讀 1931·2019-08-29 11:24
閱讀 1690·2019-08-26 13:22
閱讀 3935·2019-08-26 12:01
閱讀 1826·2019-08-26 11:33
閱讀 3249·2019-08-23 15:34