用Python爬取"王者農(nóng)藥"英雄皮膚

馬龍駒發(fā)布于2019-07-31 10:12 / 2096人閱讀

摘要：本篇就來教大家如何使用來爬取這些精美的英雄皮膚。有了英雄編號的對應(yīng)關(guān)系，再找尋下英雄皮膚的鏈接規(guī)律。將圖片保存下來，并以英雄名稱皮膚序號方式命名效果展示最終的爬取效果如下圖所示。

0.引言

作為一款現(xiàn)象級游戲，王者榮耀，想必大家都玩過或聽過，游戲里中各式各樣的英雄，每款皮膚都非常精美，用做電腦壁紙?jiān)俸线m不過了。本篇就來教大家如何使用Python來爬取這些精美的英雄皮膚。

1.環(huán)境

操作系統(tǒng)：Windows / Linux

Python版本：3.7.2

2.需求分析

我們打開《王者榮耀》官網(wǎng)，找定位到英雄列表的頁面

可直接點(diǎn)此鏈接：

https://pvp.qq.com/web201605/...

在這個網(wǎng)頁中包含了所有的英雄，頭像及英雄名稱。點(diǎn)擊其中一個英雄的頭像，如“嫦娥”，進(jìn)去后如下圖：

我們記下此時的網(wǎng)址

https://pvp.qq.com/web201605/...

再后退到英雄列表頁面，點(diǎn)“甄姬”進(jìn)去查看：

https://pvp.qq.com/web201605/...

可以看到這些網(wǎng)址幾乎是固定不變的，變化的只是515、127這些數(shù)字，這些其實(shí)就是代表的英雄數(shù)字編號。

那么第一個關(guān)鍵點(diǎn)就來了，怎么找出各個英雄所對應(yīng)的數(shù)字編號呢？

我們回到最初的英雄列表頁面，打開瀏覽器的開發(fā)者工具，刷新頁面、仔細(xì)觀察，你會找到一個herolist.json的文件，如圖所示：

這里記錄了各個英雄的信息，其中就包含了每個英雄對應(yīng)的數(shù)字編號了，請忽略這里截圖中的亂碼顯示。我們切到herolist.json中的Headers，就可以拿到該請求的URL地址，進(jìn)而就可以把英雄及其對應(yīng)的數(shù)字，編號都提取出來了。

有了英雄編號的對應(yīng)關(guān)系，再找尋下英雄皮膚的鏈接規(guī)律。

現(xiàn)在重新進(jìn)入一個英雄的網(wǎng)址，打開瀏覽器的開發(fā)者工具，刷新頁面，在Network下刷新并找到英雄的皮膚圖片，如圖所示：

在Headers中查看該圖片的網(wǎng)址，查看即Request URL處的鏈接：

https://game.gtimg.cn/images/...

找尋一個看看

https://game.gtimg.cn/images/...

繼續(xù)尋一個看看

https://game.gtimg.cn/images/...

仔細(xì)分析如上三個鏈接，我們可以把英雄皮膚的URL拆分開來看。它是由一個固定前綴（我們可以記為base_url），再加上英雄數(shù)字編號、"bigskin"、皮膚編號、".jpg"組合而成，如下：

base_url / hero_num / hero_num - bigskin - heroskin_num .jpg

拿到了各個英雄皮膚的URL地址后，我們就可以進(jìn)行圖片的下載并保存在本地了。

3.代碼演示

首先導(dǎo)入我們所用到的模塊

import requests

import os

注：requests是非內(nèi)置模塊，若環(huán)境中沒有，需自行安裝：

pip install requests

3.1 提取英雄名字及數(shù)字

使用herolist.json拿到herolist，并提取出我們關(guān)心的內(nèi)容

# 英雄的名字json

url = "http://pvp.qq.com/web201605/js/herolist.json"


head = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36"}
response = requests.get(url, headers=head)
hero_list = response.json()

# 提取英雄名字和數(shù)字
hero_name=list(map(lambda x:x["cname"], hero_list)) 

hero_number=list(map(lambda x:x["ename"], hero_list))

3.2 構(gòu)造英雄皮膚的URL

首先準(zhǔn)備好我們的BASE_URL，即英雄皮膚的固定前綴。

h_l="http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/"

接下來構(gòu)造好英雄皮膚的URL，同時我們需要對每一個英雄的所有皮膚進(jìn)行遍歷，如下：

# 逐一遍歷英雄
for i in hero_number:
# 逐一遍歷皮膚，此處假定一個英雄最多有15個皮膚
for sk_num in range(15):
hsl = h_l + str(i)+"/"+str(i)+"-bigskin-"+str(sk_num)+".jpg"

hl = requests.get(hsl)

3.3 存儲圖片

最后我們就只需將獲取到的圖片保存在本地即可。

# 將圖片保存下來，并以"英雄名稱_皮膚序號"方式命名
with open(hero_name[num] + str(sk_num) + ".jpg", "wb") as f:
f.write(hl.content)

4.效果展示

最終的爬取效果如下圖所示。

5.總結(jié)

短短幾十行代碼就可以把心愛英雄的精美皮膚保存下來，趕快實(shí)操起來吧！

關(guān)注公眾號「Python專欄」，后臺回復(fù)「zsxq04」，獲取本文全套源碼！

GPU云服務(wù)器云服務(wù)器 python b&quot&quot Quote quoted quot

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://m.specialneedsforspecialkids.com/yun/43433.html

發(fā)表評論

登陸后可評論

0條評論

馬龍駒

男|高級講師

我要關(guān)注我要私信

TA的文章

#黑五#Veesp：全場25%優(yōu)惠，VPS月付$2.25起，獨(dú)立服務(wù)器$57/月起

閱讀 1808·2021-11-24 10:21
云虛擬主機(jī)如何清除數(shù)據(jù)庫-如何重啟和關(guān)閉云虛擬主機(jī)？

閱讀 1219·2021-09-22 15:25
JavaScript引擎

閱讀 3178·2019-08-30 15:55
iOS11.3以下modal中input光標(biāo)錯位

閱讀 718·2019-08-30 15:54
Codepen 每日精選（2018-3-31）

閱讀 3468·2019-08-30 14:20
[筆記] 當(dāng)在 Vue 中不得不用全局樣式時...

閱讀 1666·2019-08-30 14:06
前端命名規(guī)范

閱讀 646·2019-08-30 13:11
css3中什么時候用transition什么時候用animation實(shí)現(xiàn)動畫

閱讀 3155·2019-08-29 16:43

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

用Python爬取"王者農(nóng)藥"英雄皮膚

相關(guān)文章

**?王者農(nóng)藥皮膚圖片獲取！?**

Python實(shí)戰(zhàn)---王者榮耀皮膚爬蟲

為什么“王者榮耀”讓你那么上癮？

發(fā)表評論

0條評論

馬龍駒

男|高級講師

TA的文章

#黑五#Veesp：全場25%優(yōu)惠，VPS月付$2.25起，獨(dú)立服務(wù)器$57/月起

云虛擬主機(jī)如何清除數(shù)據(jù)庫-如何重啟和關(guān)閉云虛擬主機(jī)？

JavaScript引擎

iOS11.3以下modal中input光標(biāo)錯位

Codepen 每日精選（2018-3-31）

[筆記] 當(dāng)在 Vue 中不得不用全局樣式時...

前端命名規(guī)范

css3中什么時候用transition什么時候用animation實(shí)現(xiàn)動畫

最新活動