摘要:根據(jù)算法的思路,手動復(fù)現(xiàn)算法。根據(jù)窗口大小,組合共現(xiàn)詞和頻率,頻率代表共現(xiàn)權(quán)重。正反雙向共現(xiàn)詞。根據(jù)每個詞的權(quán)重的迭代公式,采用冒泡排序的方法,將一個詞的所有共現(xiàn)詞的權(quán)重代入公式。迭代次,使每個詞的權(quán)重收斂。根據(jù)權(quán)重排序,輸出。 根據(jù)jieba textrank算法的思路,手動復(fù)現(xiàn)textrank算法。思路:1.分詞,確定窗口大小。 2.根據(jù)窗口大小,組合共現(xiàn)詞和頻率,頻率代表共現(xiàn)...
摘要:訪問需求示例需要訪問如下服務(wù)端目錄結(jié)構(gòu)問題我們習(xí)慣配置的服務(wù)為單入口,即多入口配置利用變量動態(tài)配置,實現(xiàn)多入口訪問 訪問需求示例 需要訪問如下 url:localhost/info.phplocalhost/detail.php 服務(wù)端 server-root 目錄結(jié)構(gòu): ? ~ tree public public ├── detail.php └── info.php 問題 我們...
摘要:所以建立并維護(hù)好一個有效的代理池也是爬蟲的一個準(zhǔn)備工作。網(wǎng)上提供免費代理的網(wǎng)址很多,下面我們以西刺網(wǎng)站為例來建立一個有效的代理池。 在爬取網(wǎng)站信息的過程中,有些網(wǎng)站為了防止爬蟲,可能會限制每個ip的訪問速度或訪問次數(shù)。對于限制訪問速度的情況,我們可以通過time.sleep進(jìn)行短暫休眠后再次爬取。對于限制ip訪問次數(shù)的時候我們需要通過代理ip輪換去訪問目標(biāo)網(wǎng)址。所以建立并維護(hù)好一個有效...
摘要:我們在日常開發(fā)中希望訪問文件以域名的形式訪問本地文件。一配置文件中的配置文件是打開配置文件如果文件是只讀,則需要利用文件名來修改文件模式修改文件權(quán)限,只需要添加下面的權(quán)限即可。 我們在日常開發(fā)中希望訪問文件以域名的形式訪問本地文件。而mac自帶apache,我們只需要簡單地配置apache配置文件及host配置文件,便可以實現(xiàn)用url的形式來訪問文件了。 一 apche配置文件 Mac...
摘要:自取上傳到這里內(nèi)核剖析深入理解最佳良品鳥哥的私房菜可能有點歷史久遠(yuǎn)了,中文版學(xué)習(xí)新的好書設(shè)計模式設(shè)計模式,可以更好的自己去實現(xiàn)一個框架,或者讀懂框架的源碼,實現(xiàn)高性能全球開發(fā)者大會上推薦的一本書,感覺內(nèi)容很前衛(wèi)新鮮。 https://github.com/guanhui07/... 自取 上傳到這里 《PHP7內(nèi)核剖析》 深入理解PHP最佳良品 《鳥哥的Linux私房菜》 可能有點歷史...
暫無介紹