豆瓣讀書搜索頁的window.DATA的解密

BenCHou 發(fā)布于2019-08-26 13:36 / 3377人閱讀

摘要：而且我覺得比上次的知乎的還難點，但是可能就只有搜索頁是加密的，其他的直接找全部圖書的都是直接放在源碼的。寫在最后這個豆瓣解密可以說不難，也可以說有點難，因為需要扣很多，如果你能看懂他相關(guān)的解密方法就不需要扣，就會很容易了。

上次發(fā)了破解知乎模擬登陸的最新版之后，很多人看了都說好，唯獨沒人給我點贊，以后還是麻煩大家，如果看到對你有用的文章，可以點點贊，支持下作者哈。

還有，知乎模擬登陸的代碼已給出，github地址為：https://github.com/SergioJune...

希望各位大佬給點個star哈，以后會持續(xù)更新，將我的每個破解的網(wǎng)站源碼都放上去，如果你也有什么解不開的網(wǎng)站，歡迎去提issue，我會盡我能力去破解，后分享給大家。

這次給大家分享的是豆瓣的讀書搜索頁

https://book.douban.com/subje...

以前還以為豆瓣只是給新手爬蟲練手的，直到我發(fā)現(xiàn)了這個頁面，才發(fā)現(xiàn)是我錯了，原來豆瓣也有加密的，有可能是為了防止新手亂爬吧，一看到這個就覺得爬蟲越來越不好做了，隨便一個頁面都有 js 加密。

而且我覺得比上次的知乎的還難點，但是可能就只有搜索頁是加密的，其他的直接找全部圖書的都是直接放在html源碼的。

廢話不多說，生死看淡，不服就干！！！開始分析。

1. 尋找搜索內(nèi)容

這個圖書數(shù)據(jù)是直接加密的，隱藏在了html頁面，如果你需要找的話，估計還得找很長時間，我是從一位大佬告訴我的，就在下面這個頁面的 window.__DATA__ 里面

不過如果需要自己找的話，還是可以的，需要點時間，自己細心點找，對于這個有經(jīng)驗了，以后遇到那些找不到數(shù)據(jù)的都可以嘗試在本頁面的html里面找。

2. 找解密位置

直接搜 window.__DATA__ 即可

上面的就是html內(nèi)容，所以是下面一個，或者你不信的話可以自己嘗試下。

打斷點，一看，果不其然，數(shù)據(jù)都出來了

接著就是自己慢慢調(diào)試了，點擊下一步自己慢慢調(diào)試，看看用到的方法

走了幾步會很容易發(fā)現(xiàn)這個，這個就可以說是上面那個方法的解密步驟了

接下來就是自己看這些 JS 的內(nèi)容了，不算難，如果你厲害的話，能看出他加密使用的方法的話，你可以直接使用 Python 語言的相關(guān)加密方法，如果看不懂，你就需要自己扣出相關(guān)的 JS 了，

如果你初學 JS 的話，學過了 JS 原型的屬性，那么非常推薦你解一下，因為這里的 JS 分布在兩個文件內(nèi)，不像上次知乎那樣直接一段函數(shù)就解決了那么簡單，并且扣出來了還需要自己改下函數(shù)之間或者對象之間的原型，總之很復雜，這個只能意會不能言傳，篇幅有限，也不可能全部一個一個扣出來并和你說怎么改。

還是得自己實踐一次才能感受到，我最后花了幾天時間，扣出了1500+行代碼

3. 用Python運行

這里扣出了 JS 使用 python 的 execjs 執(zhí)行，會出現(xiàn)一個問題

UnicodeDecodeError: "gbk" codec can"t decode byte 0x80 in position 41: illegal multibyte sequence

這里是因為里面使用了一個 TextIOWrapper 對象，里面沒有指定編碼類型，使用了默認的 cp936 也就是 gbk 編碼，使讀取字符出錯，我們可以在這個類上面初始化改下編碼類型為 utf-8 即可運行

再次運行，即可成功。

4. 寫在最后

這個豆瓣解密可以說不難，也可以說有點難，因為需要扣很多 JS ，如果你能看懂他相關(guān)的解密方法就不需要扣，就會很容易了。如果逆向深入研究逆行 JS 的話，還是建議你自己動手擼一遍，

最后，想要源碼地址為 https://github.com/SergioJune...，對你有用的話請給個star，謝謝。

如果文章對你有用的話就點個贊吧！

本文僅用于交流學習，請勿用于非法用途，后果自負！

GPU云服務器云服務器 _Data js加密_解密數(shù)據(jù) Windows10_Enterprise python的_

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://m.specialneedsforspecialkids.com/yun/109136.html

發(fā)表評論

登陸后可評論

0條評論

BenCHou

男|高級講師

我要關(guān)注我要私信

TA的文章

tensorflow2.1

閱讀 3249·2023-04-25 20:35
我所了解的CSS包含塊

閱讀 3612·2019-08-30 15:54
vue中如何實現(xiàn)的自定義按鈕

閱讀 1991·2019-08-30 15:43
vertical-align:垂直對齊方式相關(guān)說明

閱讀 2181·2019-08-29 15:14
對css居中的一點總結(jié)

閱讀 1888·2019-08-29 11:17
豆瓣讀書搜索頁的window.__DATA__的解密

閱讀 3378·2019-08-26 13:36
JS數(shù)組中那些你知道或不知道的

閱讀 693·2019-08-26 10:15
如何解決vue打包項目中的圖片,靜態(tài)css,js 不能訪問路徑問題

閱讀 2832·2019-08-23 15:41

国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

豆瓣讀書搜索頁的window.DATA的解密

相關(guān)文章