成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲 中文字幕 日韩 无码

資訊專欄INFORMATION COLUMN

記一次關(guān)于sklearn.datasets.fetch_20newsgroups的下載速度極慢的解決

dabai / 2977人閱讀

摘要:明天就是中秋節(jié)了現(xiàn)在的實驗室空空蕩蕩的只剩下我們幾個了提前祝大家中秋快樂

最近, 耗子我在做關(guān)于互聯(lián)網(wǎng)新聞分類的項目, 需要用到sklearn.datasets里新聞數(shù)據(jù)抓取器fetch_20newsgroups, 而當將參數(shù)subset設(shè)置為"all"時, fetch_20newsgroups需要即時從互聯(lián)網(wǎng)下載數(shù)據(jù), So:

稍有python下載經(jīng)驗的就知道, 1M就得等很久了, 這是14M, 啊??!


So:老辦法一

直接復(fù)制圖片中的網(wǎng)址下載:

https://ndownloader.figshare.com/files/5975967

然后, 依然很慢......


So:老辦法二

復(fù)制鏈接, 用火狐瀏覽器插件多線程下載器下載
額, 也不算快啊......


So:老辦法三

直接復(fù)制鏈接給迅雷呀!? 剛咋沒想到呢????
行吧, 還算迅雷給力......

接下來。。。

問題又來了, 有文件了, Python 怎么讀取?????
文件名是 20newsbydate.tar.gz
然后我就搜了 Python如何讀取gz文件
大概是我中午沒睡好吧, 搜這干嘛......

幾經(jīng)波折, 終于找到了......
感謝大神的分享: 這里是原文

在此說明如下:
fetch_20newsgroups函數(shù)將下載的文件放在
C:Users(你的user_name)scikit_learn_data20news_home目錄下
將你下載的文件放在這里

注:
Python下載的文件叫20new-sbydate.tar.gz
你下載的叫20newsbydate.tar.gz
所以改成它那樣的就成
(不過自己應(yīng)該先看下, 你那個版本的Python下載的文件名字是啥)


進入Python安裝文件夾中找到文件 twenty_newsgroups.py

用任意文本編輯器打開它
找到download_20newsgroups函數(shù)

上紅框是下載文件的部分, 下紅框是解壓文件的部分
So, 我們只需要將上紅框注釋掉, 并加入文件地址即可
然后, ctrl+s , 如圖:

有可能再報一個縮進的錯:

縮進嘛, 看下哪行的4個空格變成一個Tab了, 改過來即可


So:

這是耗子我第一次發(fā)文章, 有錯誤的請不吝賜教, 耗子一定改正。 明天就是中秋節(jié)了, 現(xiàn)在的實驗室空空蕩蕩的只剩下我們幾個了, 提前祝大家中秋快樂!

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://m.hztianpu.com/yun/42517.html

相關(guān)文章

  • 一次修復(fù)微信支付吊起非常慢問題

    摘要:記一次修復(fù)微信支付吊起非常慢的問題微信接支付調(diào)用有些安卓手機吊起非常慢,因為調(diào)支付寫法就是這樣子,實在定位不到問題所在,正在打算放棄的時候。定位會導(dǎo)致支付吊起不了嗎原來之前把瀏覽器定位換成了微信定位,解決安卓下面會頻繁彈授權(quán)的問題。 記一次修復(fù)微信支付吊起非常慢的問題 微信h5接支付調(diào)用 window.wx.invoke(getBrandWCPayRequest) 有些安卓手機吊起非常...

    Mertens 評論0 收藏0
  • sklearn 文本分類記錄 [1] 官方文檔

    摘要:最后,模型甚至可以返回最能影響分類器分類效果的個單詞,但是要求分類器有屬性,目前用到的幾個分類器,似乎都有這個這個屬性。 工作上需要用到文本分類,這里用 sklearn 做為工具,記錄下學(xué)習(xí)過程 目錄 1. SVM 文本分類范例2. sklearn 做文本分類其他可選分類器3. 文本分類的數(shù)據(jù)預(yù)處理3. 中文文本分類方法 SVM 文本分類范例 import numpy as np f...

    pcChao 評論0 收藏0
  • 一次MongoDB高負載性能優(yōu)化

    摘要:年月日本文是關(guān)于記錄某次游戲服務(wù)端的性能優(yōu)化此處涉及的技術(shù)包括引擎隨著游戲?qū)肴藬?shù)逐漸增加單個集合的文檔數(shù)已經(jīng)超過經(jīng)常有玩家反饋說卡特別是在服務(wù)器遷移后從核降到核卡頓更嚴重了遂開始排查問題確認服務(wù)器壓力首先使用命令查看總體情況此時占用不高 Last-Modified: 2019年6月13日11:08:19 本文是關(guān)于記錄某次游戲服務(wù)端的性能優(yōu)化, 此處涉及的技術(shù)包括: MongoDB...

    huhud 評論0 收藏0
  • 一次MongoDB高負載性能優(yōu)化

    摘要:年月日本文是關(guān)于記錄某次游戲服務(wù)端的性能優(yōu)化此處涉及的技術(shù)包括引擎隨著游戲?qū)肴藬?shù)逐漸增加單個集合的文檔數(shù)已經(jīng)超過經(jīng)常有玩家反饋說卡特別是在服務(wù)器遷移后從核降到核卡頓更嚴重了遂開始排查問題確認服務(wù)器壓力首先使用命令查看總體情況此時占用不高 Last-Modified: 2019年6月13日11:08:19 本文是關(guān)于記錄某次游戲服務(wù)端的性能優(yōu)化, 此處涉及的技術(shù)包括: MongoDB...

    vibiu 評論0 收藏0

發(fā)表評論

0條評論

閱讀需要支付1元查看
<