成人无码视频,亚洲精品久久久久av无码,午夜精品久久久久久毛片,亚洲 中文字幕 日韩 无码

資訊專欄INFORMATION COLUMN

pandas使用

int64 / 1335人閱讀

摘要:寫這篇文章主要是想按照一定的邏輯順總結(jié)一下自己做項(xiàng)目以來(lái)序用到過(guò)的的知識(shí)點(diǎn)雖然官方文檔上各個(gè)方面都寫的很清楚但是還是想自己再寫一份一個(gè)是想作為個(gè)人梳理另外也可以把最經(jīng)常使用的部分拎出來(lái)更清晰一些不定時(shí)更新數(shù)據(jù)的讀數(shù)據(jù)其中是需要的語(yǔ)句是創(chuàng)建的

寫這篇文章,主要是想按照一定的邏輯順總結(jié)一下自己做項(xiàng)目以來(lái),序用到過(guò)的pandas的知識(shí)點(diǎn).
雖然pandas官方文檔上各個(gè)方面都寫的很清楚,但是還是想自己再寫一份,一個(gè)是想作為個(gè)人梳理,另外也可以把最經(jīng)常使用的部分拎出來(lái),更清晰一些.

不定時(shí)更新.

數(shù)據(jù)的IO MySQL

1.讀mysq數(shù)據(jù)

df = pd.read_sql(sql, db.conn)

其中sql是需要的sql語(yǔ)句,db是創(chuàng)建的數(shù)據(jù)庫(kù)連接對(duì)象.

一般來(lái)說(shuō),這樣基本就能滿足需求.

額外的參數(shù)

 1. chunksize : int, default None
    當(dāng)數(shù)據(jù)量比較大,或者想將讀入的數(shù)據(jù)分割成指定行數(shù)的一個(gè)個(gè)block,則可以設(shè)置這個(gè)參數(shù).其會(huì)返回一個(gè)迭代器,迭代器中的元素為chunksize行數(shù)的記錄.
    
 2. index_col : string or list of strings, optional, default: None
    可以設(shè)置某些列為索引列.

pandas.read_sql文檔

2.寫mysql數(shù)據(jù)

engine = create_engine("mysql+pymysql://root:password@localhost/schemeName", echo=False)

df.to_sql(tablename, engine, if_exists="append", index=index)

將df的數(shù)據(jù)寫入到數(shù)據(jù)庫(kù)表中.pandas文檔中提供的例子是SQlite的數(shù)據(jù)庫(kù),所以不能直接用db.conn去充當(dāng)engine.

參數(shù)說(shuō)明

1. if_exists: {‘fail’, ‘replace’, ‘a(chǎn)ppend’}, default ‘fail’
當(dāng)數(shù)據(jù)庫(kù)中存在要寫入的table時(shí),三種處理方式
fail:那么寫入失敗
replace:把原來(lái)的table刪掉,寫入新的
append:在原來(lái)的table上,添加新的記錄

2. index : boolean, default True
當(dāng)設(shè)為True時(shí),會(huì)把df的index當(dāng)成一列寫入數(shù)據(jù)庫(kù).

pandas.DataFrame.to_sql文檔

csv

1.讀數(shù)據(jù)

df = pd.read_csv(path + filename, header=None, names=[name1, name2])

參數(shù)說(shuō)明

1.header: int or list of ints, default ‘infer’
用來(lái)指定行號(hào)作為數(shù)據(jù)的開(kāi)始和列的名稱.header設(shè)為None是告訴其打開(kāi)的文件里沒(méi)有列名.如果打開(kāi)的文件有列名的時(shí)候,可以不設(shè)置這一項(xiàng),這樣系統(tǒng)會(huì)自動(dòng)推測(cè)出列名.

2.names : array-like, default None
顯示地指定列的名稱.當(dāng)header是None的時(shí)候,需要加上這個(gè).

關(guān)于這個(gè)函數(shù),可設(shè)置的參數(shù)還比較多,不過(guò)目前使用的也就這幾個(gè),所以先不描述其他了.

pandas.read_csv文檔

2.寫數(shù)據(jù)

df.to_csv(path+filename, index=False, header=header, mode="a")

參數(shù)說(shuō)明

1.index: boolean, default True
說(shuō)明是否需要寫入df的index.

2.header : boolean or list of string, default True
說(shuō)明是否要把列名寫入.也可以在這里重新設(shè)置寫入的列名.

3.mode : str,default ‘w’
python的寫入模式.

pandas.DataFrame.to_csv文檔

excel 直接創(chuàng)建dateFrame 數(shù)據(jù)的選擇 簡(jiǎn)單選擇

選擇部分行

選擇部分列

選擇數(shù)值

按照條件進(jìn)行篩選

單一條件篩選

多個(gè)條件篩選

數(shù)據(jù)的聚合值描述 數(shù)據(jù)的修改 索引信息的修改 數(shù)據(jù)的合并

concat

merge

join

數(shù)據(jù)的可視化 時(shí)間序列相關(guān)

數(shù)據(jù)采樣

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://m.hztianpu.com/yun/41218.html

相關(guān)文章

  • 還在抱怨pandas運(yùn)行速度慢?這幾個(gè)方法會(huì)顛覆你的看法

    摘要:它還使用執(zhí)行所謂的鏈?zhǔn)剿饕@通常會(huì)導(dǎo)致意外的結(jié)果。但這種方法的最大問(wèn)題是計(jì)算的時(shí)間成本。這些都是一次產(chǎn)生一行的生成器方法,類似中使用的用法。在這種情況下,所花費(fèi)的時(shí)間大約是方法的一半。根據(jù)每小時(shí)所屬的應(yīng)用一組標(biāo)簽。 作者:xiaoyu 微信公眾號(hào):Python數(shù)據(jù)科學(xué) 知乎:python數(shù)據(jù)分析師 showImg(https://segmentfault.com/img/bVboe...

    keelii 評(píng)論0 收藏0
  • Pandas數(shù)據(jù)類型轉(zhuǎn)換的幾個(gè)小技巧

    摘要:利用的一些輔助函數(shù)進(jìn)行類型轉(zhuǎn)換的函數(shù)和復(fù)雜的自定函數(shù)之間有一個(gè)中間段,那就是的一些輔助函數(shù)。這些輔助函數(shù)對(duì)于某些特定數(shù)據(jù)類型的轉(zhuǎn)換非常有用如。 利用Pandas進(jìn)行數(shù)據(jù)分析時(shí),確保使用正確的數(shù)據(jù)類型是非常重要的,否則可能會(huì)導(dǎo)致一些不可預(yù)知的錯(cuò)誤發(fā)生。筆者使用Pandas已經(jīng)有一段時(shí)間了,但是還是會(huì)在一些小問(wèn)題上犯錯(cuò)誤,追根溯源發(fā)現(xiàn)在對(duì)數(shù)據(jù)進(jìn)行操作時(shí)某些特征列并不是Pandas所能處理的...

    luckyw 評(píng)論0 收藏0
  • tensorflow安裝pandas

    當(dāng)使用TensorFlow進(jìn)行數(shù)據(jù)分析和機(jī)器學(xué)習(xí)時(shí),經(jīng)常需要使用Pandas庫(kù)來(lái)處理數(shù)據(jù)。在本文中,我將向您介紹如何在TensorFlow中安裝Pandas庫(kù)。 首先,確保您已經(jīng)安裝了TensorFlow。如果您還沒(méi)有安裝TensorFlow,請(qǐng)按照官方文檔中的說(shuō)明進(jìn)行安裝。 接下來(lái),打開(kāi)您的Python環(huán)境。您可以使用Anaconda Navigator或在命令行中輸入python來(lái)打開(kāi)Py...

    Salamander 評(píng)論0 收藏2201
  • 媲美Pandas?告訴你Python的Datatable包到底怎么用!

    摘要:幀的基礎(chǔ)屬性下面來(lái)介紹中的一些基礎(chǔ)屬性,這與中的一些功能類似。下面來(lái)看看如何在和中,通過(guò)對(duì)分組來(lái)得到列的均值分組分組代表什么在中,代表,它提供一種簡(jiǎn)單的方式來(lái)引用當(dāng)前正在操作的幀。 showImg(https://segmentfault.com/img/remote/1460000019598242);作者 | Parul Pandey 【導(dǎo)讀】工具包 datatable 的功能特征...

    KitorinZero 評(píng)論0 收藏0
  • Pandas之旅(七) 誰(shuí)說(shuō)pandas

    摘要:下面讓我們開(kāi)始提速假設(shè)我們現(xiàn)在的電價(jià)是定值,不根據(jù)用電時(shí)間段來(lái)改變,那么中最快的方法那就是采用,這就是一個(gè)簡(jiǎn)單的矢量化操作示范。它基本是在中運(yùn)行最快的方式。 Pandas 加速 大家好,今天我們來(lái)看有關(guān)pandas加速的小技巧,不知道大家在剛剛接觸pandas的時(shí)候有沒(méi)有聽(tīng)過(guò)如下的說(shuō)法 pandas太慢了,運(yùn)行要等半天 其實(shí)我想說(shuō)的是,慢不是pandas的錯(cuò),大家要知道pandas本身...

    genedna 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

閱讀需要支付1元查看
<