摘要:根據(jù)算法的思路,手動復現(xiàn)算法。根據(jù)窗口大小,組合共現(xiàn)詞和頻率,頻率代表共現(xiàn)權重。正反雙向共現(xiàn)詞。根據(jù)每個詞的權重的迭代公式,采用冒泡排序的方法,將一個詞的所有共現(xiàn)詞的權重代入公式。迭代次,使每個詞的權重收斂。根據(jù)權重排序,輸出。 根據(jù)jieba textrank算法的思路,手動復現(xiàn)textrank算法。思路:1.分詞,確定窗口大小。 2.根據(jù)窗口大小,組合共現(xiàn)詞和頻率,頻率代表共現(xiàn)...
摘要:訪問需求示例需要訪問如下服務端目錄結構問題我們習慣配置的服務為單入口,即多入口配置利用變量動態(tài)配置,實現(xiàn)多入口訪問 訪問需求示例 需要訪問如下 url:localhost/info.phplocalhost/detail.php 服務端 server-root 目錄結構: ? ~ tree public public ├── detail.php └── info.php 問題 我們...
摘要:所以建立并維護好一個有效的代理池也是爬蟲的一個準備工作。網(wǎng)上提供免費代理的網(wǎng)址很多,下面我們以西刺網(wǎng)站為例來建立一個有效的代理池。 在爬取網(wǎng)站信息的過程中,有些網(wǎng)站為了防止爬蟲,可能會限制每個ip的訪問速度或訪問次數(shù)。對于限制訪問速度的情況,我們可以通過time.sleep進行短暫休眠后再次爬取。對于限制ip訪問次數(shù)的時候我們需要通過代理ip輪換去訪問目標網(wǎng)址。所以建立并維護好一個有效...
摘要:我們在日常開發(fā)中希望訪問文件以域名的形式訪問本地文件。一配置文件中的配置文件是打開配置文件如果文件是只讀,則需要利用文件名來修改文件模式修改文件權限,只需要添加下面的權限即可。 我們在日常開發(fā)中希望訪問文件以域名的形式訪問本地文件。而mac自帶apache,我們只需要簡單地配置apache配置文件及host配置文件,便可以實現(xiàn)用url的形式來訪問文件了。 一 apche配置文件 Mac...
摘要:自取上傳到這里內(nèi)核剖析深入理解最佳良品鳥哥的私房菜可能有點歷史久遠了,中文版學習新的好書設計模式設計模式,可以更好的自己去實現(xiàn)一個框架,或者讀懂框架的源碼,實現(xiàn)高性能全球開發(fā)者大會上推薦的一本書,感覺內(nèi)容很前衛(wèi)新鮮。 https://github.com/guanhui07/... 自取 上傳到這里 《PHP7內(nèi)核剖析》 深入理解PHP最佳良品 《鳥哥的Linux私房菜》 可能有點歷史...