摘要:本篇就來教大家如何使用來爬取這些精美的英雄皮膚。有了英雄編號的對應(yīng)關(guān)系,再找尋下英雄皮膚的鏈接規(guī)律。將圖片保存下來,并以英雄名稱皮膚序號方式命名效果展示最終的爬取效果如下圖所示。
0.引言
作為一款現(xiàn)象級游戲,王者榮耀,想必大家都玩過或聽過,游戲里中各式各樣的英雄,每款皮膚都非常精美,用做電腦壁紙?jiān)俸线m不過了。本篇就來教大家如何使用Python來爬取這些精美的英雄皮膚。
1.環(huán)境操作系統(tǒng):Windows / Linux
Python版本:3.7.2
2.需求分析我們打開《王者榮耀》官網(wǎng),找定位到英雄列表的頁面
可直接點(diǎn)此鏈接:
https://pvp.qq.com/web201605/...
在這個網(wǎng)頁中包含了所有的英雄,頭像及英雄名稱。點(diǎn)擊其中一個英雄的頭像,如“嫦娥”,進(jìn)去后如下圖:
我們記下此時的網(wǎng)址
https://pvp.qq.com/web201605/...
再后退到英雄列表頁面,點(diǎn)“甄姬”進(jìn)去查看:
https://pvp.qq.com/web201605/...
可以看到這些網(wǎng)址幾乎是固定不變的,變化的只是515、127這些數(shù)字,這些其實(shí)就是代表的英雄數(shù)字編號。
那么第一個關(guān)鍵點(diǎn)就來了,怎么找出各個英雄所對應(yīng)的數(shù)字編號呢?
我們回到最初的英雄列表頁面,打開瀏覽器的開發(fā)者工具
這里記錄了各個英雄的信息,其中就包含了每個英雄對應(yīng)的數(shù)字編號了,請忽略這里截圖中的亂碼顯示。我們切到herolist.json中的Headers,就可以拿到該請求的URL地址,進(jìn)而就可以把英雄及其對應(yīng)的數(shù)字,編號都提取出來了。
有了英雄編號的對應(yīng)關(guān)系,再找尋下英雄皮膚的鏈接規(guī)律。
現(xiàn)在重新進(jìn)入一個英雄的網(wǎng)址,打開瀏覽器的開發(fā)者工具,刷新頁面,在Network下刷新并找到英雄的皮膚圖片,如圖所示:
在Headers中查看該圖片的網(wǎng)址,查看即Request URL處的鏈接:
https://game.gtimg.cn/images/...
找尋一個看看
https://game.gtimg.cn/images/...
繼續(xù)尋一個看看
https://game.gtimg.cn/images/...
仔細(xì)分析如上三個鏈接,我們可以把英雄皮膚的URL拆分開來看。它是由一個固定前綴(我們可以記為base_url),再加上英雄數(shù)字編號、"bigskin"、皮膚編號、".jpg"組合而成,如下:
base_url / hero_num / hero_num - bigskin - heroskin_num .jpg
拿到了各個英雄皮膚的URL地址后,我們就可以進(jìn)行圖片的下載并保存在本地了。
3.代碼演示首先導(dǎo)入我們所用到的模塊
import requests import os
注:requests是非內(nèi)置模塊,若環(huán)境中沒有,需自行安裝:
pip install requests3.1 提取英雄名字及數(shù)字
使用herolist.json拿到herolist,并提取出我們關(guān)心的內(nèi)容
# 英雄的名字json url = "http://pvp.qq.com/web201605/js/herolist.json" head = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36"} response = requests.get(url, headers=head) hero_list = response.json() # 提取英雄名字和數(shù)字 hero_name=list(map(lambda x:x["cname"], hero_list)) hero_number=list(map(lambda x:x["ename"], hero_list))3.2 構(gòu)造英雄皮膚的URL
首先準(zhǔn)備好我們的BASE_URL,即英雄皮膚的固定前綴。
h_l="http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/"
接下來構(gòu)造好英雄皮膚的URL,同時我們需要對每一個英雄的所有皮膚進(jìn)行遍歷,如下:
# 逐一遍歷英雄 for i in hero_number: # 逐一遍歷皮膚,此處假定一個英雄最多有15個皮膚 for sk_num in range(15): hsl = h_l + str(i)+"/"+str(i)+"-bigskin-"+str(sk_num)+".jpg" hl = requests.get(hsl)3.3 存儲圖片
最后我們就只需將獲取到的圖片保存在本地即可。
# 將圖片保存下來,并以"英雄名稱_皮膚序號"方式命名 with open(hero_name[num] + str(sk_num) + ".jpg", "wb") as f: f.write(hl.content)4.效果展示
最終的爬取效果如下圖所示。
5.總結(jié)短短幾十行代碼就可以把心愛英雄的精美皮膚保存下來,趕快實(shí)操起來吧!
關(guān)注公眾號「Python專欄」,后臺回復(fù)「zsxq04」,獲取本文全套源碼!
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/43433.html
?王者農(nóng)藥皮膚圖片獲取!? 一、前言二、環(huán)境準(zhǔn)備三、具體實(shí)現(xiàn)1、所有英雄信息獲取2、分析圖片url3、具體實(shí)現(xiàn)4、結(jié)果 四、最后 一、前言 ??王者榮耀大家都玩過吧,沒玩過的也應(yīng)該聽說過,作為時下最火的手機(jī)MOBA游戲,咳咳,好像跑題了。我們今天的重點(diǎn)是爬取王者榮耀所有英雄的所有皮膚! 二、環(huán)境準(zhǔn)備 編輯器:pycharm 用到的庫:requests、lxml 三、具體實(shí)現(xiàn) 1、所有...
摘要:文章目錄方法方法作為王者榮耀的老玩家,今天教大家如何用爬蟲獲取王者榮耀皮膚本文將介紹兩種王者榮耀皮膚的爬取方法,一種比較簡單的,一種復(fù)雜的方法供大家學(xué)習(xí)。 文章目...
摘要:敵軍還有秒鐘到達(dá)戰(zhàn)場,請做好準(zhǔn)備研究產(chǎn)品,王者榮耀為什么這么火它的用戶成長體系是怎樣的用戶到底是怎么上癮的作為產(chǎn)品經(jīng)理,有哪些是可以借鑒學(xué)習(xí)的本文的小編將從上癮模型,全面分析王者榮耀到底是怎么一步步讓用戶上癮的。 敵軍還有5秒鐘到達(dá)戰(zhàn)場,請做好準(zhǔn)備!研究產(chǎn)品,王者榮耀為什么這么火?它的用戶成長體系是怎樣的?用戶到底是怎么上癮的?作為產(chǎn)品經(jīng)理,有哪些是可以借鑒學(xué)習(xí)的! 本文的小編將從Ho...
閱讀 1808·2021-11-24 10:21
閱讀 1219·2021-09-22 15:25
閱讀 3178·2019-08-30 15:55
閱讀 718·2019-08-30 15:54
閱讀 3468·2019-08-30 14:20
閱讀 1666·2019-08-30 14:06
閱讀 646·2019-08-30 13:11
閱讀 3155·2019-08-29 16:43