批量下載文件（以xxx網(wǎng)站為例）

enali 發(fā)布于2019-07-24 18:33 / 897人閱讀

摘要：單田芳白眉大俠單田芳白眉大俠這個是他后臺臨時生成的下載地址，過幾分鐘就會失效。用直接拿到網(wǎng)頁單田芳白眉大俠單田芳白眉大俠，，都是固定的，變得只是下載的章數(shù)和動態(tài)生成的地址碼。

爸爸經(jīng)常拿個收音機聽評書，最近想幫爸爸在網(wǎng)上下個全集。打開百度搜了下評書，發(fā)現(xiàn)有個叫評書網(wǎng)的網(wǎng)站。搜了下單田芳說的《白眉大俠》。但是只能一回一次的單個點擊下載，那不得點死。所以就想到了批量搞它。本文用的方法很簡單（大神勿噴）。
發(fā)現(xiàn)規(guī)律，http://www.5ips.net/down_120_001.htm這個是第一回的下載地址，用瀏覽器打開顯示網(wǎng)頁源碼發(fā)現(xiàn)下載地址就在里邊那就好辦了。url[2]= "/pingshu/單田芳_白眉大俠/單田芳_白眉大俠_001.mp3?key=8de4ff27ca1e24e711d0772ebe13b454_511093084"這個是他后臺臨時生成的下載地址，過幾分鐘就會失效。規(guī)律得到了，url地址是_001表示第一回，文件地址為_001.mp3, 如果是_002就表示第二回，文件地址為_002.mp3。以此類推
好吧直接搞起。用urllib2直接拿到網(wǎng)頁

psurl0 = "http://www.5ips.net/down_120_"
psurl0_0 = ".htm"
psurl1 = "http://p33d.5ips.net/pingshu/單田芳_白眉大俠/單田芳_白眉大俠_"
def main(index):
    ji = "";
    if index < 10:
        ji = "00%d" %index;
    elif index < 100:
        ji = "0%d" %index;
    else:
        ji = "%d" %index
    
    url_p = psurl0 + ji + psurl0_0
    reque = urllib2.Request(url_p, headers = headers)
    content = urllib2.urlopen(reque).read()
    reg = ".mp3?key=.*""
    reslut = re.search(reg, content).group()
    reslut = reslut.replace(""", "")
    newpath = psurl1 + ji + reslut
    #down(newpath, ji + ".mp3")

psurl0，psurl0_0，psurl1都是固定的，變得只是下載的章數(shù)和動態(tài)生成的地址碼。由于下載地址直接顯示到網(wǎng)頁源碼中了，所以不需要復(fù)雜的解析，直接用正則找到下載地址reslut

拿到下載地址了直接用urllib2.urlopen下載失敗了，但是把地址帖到瀏覽器可以播放，應(yīng)該被網(wǎng)站禁止了。好吧，嘗試其他辦法。打開命令行用weget下載成功。問題解決了。weget是linux系統(tǒng)自帶的下載工具，Mac和windows都需要自己安裝。

def down(url, file_name):
    option = "wget -O ./白眉大俠/%s %s" %(file_name, url)
    pop = subprocess.Popen(target, stdin = subprocess.PIPE, stdout = subprocess.PIPE)
    pop.communicate(mess)

一個循環(huán)把320回的MP3全部搞下

GPU云服務(wù)器云服務(wù)器加密文件以保護數(shù)據(jù) 云存儲批量下載阿里云服務(wù)器網(wǎng)站文件下載 XXX

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://m.specialneedsforspecialkids.com/yun/37816.html

發(fā)表評論

登陸后可評論

0條評論

enali

男|高級講師

我要關(guān)注我要私信

TA的文章

由一個絕對定位引發(fā)overflow：auto滾動問題產(chǎn)生的關(guān)于包含塊（containing bloc

閱讀 1452·2019-08-29 17:14
css3實現(xiàn)圓形進度條

閱讀 1653·2019-08-29 12:12
css常用代碼大全

閱讀 733·2019-08-29 11:33
css--全屏布局

閱讀 3270·2019-08-28 18:27
['1', '2', '3'].map(

閱讀 1446·2019-08-26 10:19
平時遇到的問題整理（包括h5、PC、小程序）

閱讀 910·2019-08-23 18:18
經(jīng)典的遞歸面試題

閱讀 3532·2019-08-23 16:15
vue 前端項目技術(shù)選型、開發(fā)工具、周邊生態(tài)

閱讀 2545·2019-08-23 14:14

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

批量下載文件（以xxx網(wǎng)站為例）

相關(guān)文章

將 exe 文件反編譯成 Python 腳本

**練手項目3：訪問圖像網(wǎng)站，查找某類型圖片，下載查詢結(jié)果**

爬蟲 - 收藏集 - 掘金

mongoDB安裝與操作

如何配置 Aria2 來進行文件下載

發(fā)表評論

0條評論

enali

男|高級講師

TA的文章

由一個絕對定位引發(fā)overflow：auto滾動問題產(chǎn)生的關(guān)于包含塊（containing bloc

css3實現(xiàn)圓形進度條

css常用代碼大全

css--全屏布局

['1', '2', '3'].map(

平時遇到的問題整理（包括h5、PC、小程序）

經(jīng)典的遞歸面試題

vue 前端項目技術(shù)選型、開發(fā)工具、周邊生態(tài)

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

批量下載文件（以xxx網(wǎng)站為例）

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！