這篇“Python的concat與merge函數(shù)怎么使用”文章的知識(shí)點(diǎn)大部分人都不太理解,所以小編給大家總結(jié)了以下內(nèi)容,內(nèi)容詳細(xì),步驟清晰,具有一定的借鑒價(jià)值,希望大家閱讀完這篇文章能有所收獲,下面我們一起來看看這篇“Python的concat與merge函數(shù)怎么使用”文章吧。
“專業(yè)、務(wù)實(shí)、高效、創(chuàng)新、把客戶的事當(dāng)成自己的事”是我們每一個(gè)人一直以來堅(jiān)持追求的企業(yè)文化。 創(chuàng)新互聯(lián)是您可以信賴的網(wǎng)站建設(shè)服務(wù)商、專業(yè)的互聯(lián)網(wǎng)服務(wù)提供商! 專注于成都網(wǎng)站設(shè)計(jì)、做網(wǎng)站、軟件開發(fā)、設(shè)計(jì)服務(wù)業(yè)務(wù)。我們始終堅(jiān)持以客戶需求為導(dǎo)向,結(jié)合用戶體驗(yàn)與視覺傳達(dá),提供有針對(duì)性的項(xiàng)目解決方案,提供專業(yè)性的建議,創(chuàng)新互聯(lián)建站將不斷地超越自我,追逐市場(chǎng),引領(lǐng)市場(chǎng)!

concat()函數(shù)可以沿著一條軸將多個(gè)對(duì)象進(jìn)行堆疊,其使用方式類似數(shù)據(jù)庫中的數(shù)據(jù)表合并
pandas.concat(objs, axis=0, join=’outer’, join_axes=None, ignore_index=False, keys=None, levels=None, verify_integrity=False, sort=None, copy=True)
參數(shù)含義如下:
| 參數(shù) | 作用 |
|---|---|
| axis | 表示連接的軸向,可以為0或者1,默認(rèn)為0 |
| join | 表示連接的方式,inner表示內(nèi)連接,outer表示外連接,默認(rèn)使用外連接 |
| ignore_index | 接收布爾值,默認(rèn)為False。如果設(shè)置為True,則表示清除現(xiàn)有索引并重置索引值 |
| keys | 接收序列,表示添加最外層索引 |
| levels | 用于構(gòu)建MultiIndex的特定級(jí)別(唯一值) |
| names | 設(shè)置了keys和level參數(shù)后,用于創(chuàng)建分層級(jí)別的名稱 |
| verify_integerity | 檢查新的連接軸是否包含重復(fù)項(xiàng)。接收布爾值,當(dāng)設(shè)置為True時(shí),如果有重復(fù)的軸將會(huì)拋出錯(cuò)誤,默認(rèn)為False |
根據(jù)軸方向的不同,可以將堆疊分成橫向堆疊與縱向堆疊,默認(rèn)采用的是縱向堆疊方式
在堆疊數(shù)據(jù)時(shí),默認(rèn)采用的是外連接(join參數(shù)設(shè)為outer)的方式進(jìn)行合并,當(dāng)然也可以通過join=inner設(shè)置為內(nèi)連接的方式。
import pandas as pd
df1=pd.DataFrame({'A':['A0','A1','A2'],
'B':['B0','B1','B2']})df1
df2=pd.DataFrame({'C':['C0','C1','C2'],
'D':['D0','D1','D2']})df2
pd.concat([df1,df2],join='outer',axis=1)

import pandas as pd
first=pd.DataFrame({'A':['A0','A1','A2'],
'B':['B0','B1','B2'],
'C':['C0','C1','C2']})first
second=pd.DataFrame({'B':['B3','B4','B5'],
'C':['C3','C4','C5'],
'D':['D3','D4','D5']})second
當(dāng)使用concat()函數(shù)合并時(shí),若是將axis參數(shù)的值設(shè)為0,且join參數(shù)的值設(shè)為inner,則代表著使用縱向堆疊與內(nèi)連接的方式進(jìn)行合并
pd.concat([first,second],join='inner',axis=0)

1)主鍵合并數(shù)據(jù)
在使用merge()函數(shù)進(jìn)行合并時(shí),默認(rèn)會(huì)使用重疊的列索引做為合并鍵,并采用內(nèi)連接方式合并數(shù)據(jù),即取行索引重疊的部分。
import pandas as pd
left=pd.DataFrame({'key':['K0','K1','K2'],
'A':['A0','A1','A2'],
'B':['B0','B1','B2']})left
right=pd.DataFrame({'key':['K0','K1','K2','K3'],
'C':['C0','C1','C2','C3'],
'D':['D0','D1','D2','D3']})right
pd.merge(left,right,on='key')

2)merge()函數(shù)還支持對(duì)含有多個(gè)重疊列的DataFrame對(duì)象進(jìn)行合并。
import pandas as pd
data1=pd.DataFrame({'key':['K0','K1','K2'],
'A':['A0','A1','A2'],
'B':['B0','B1','B2']})data1
data2=pd.DataFrame({'key':['K0','K5','K2','K4'],
'B':['B0','B1','B2','B5'],
'C':['C0','C1','C2','C3'],
'D':['D0','D1','D2','D3']})data2
pd.merge(data1,data2,on=['key','B'])

join()方法能夠通過索引或指定列來連接多個(gè)DataFrame對(duì)象
join(other,on = None,how =‘left’,lsuffix =‘’,rsuffix =‘’,sort = False )
| 參數(shù) | 作用 |
|---|---|
| on | 名稱,用于連接列名 |
| how | ?可以從{‘‘left’’ ,‘‘right’’, ‘‘outer’’, ‘‘inner’’}中任選一個(gè),默認(rèn)使用左連接的方式。 |
| sort | 根據(jù)連接鍵對(duì)合并的數(shù)據(jù)進(jìn)行排序,默認(rèn)為False |
import pandas as pd
data3=pd.DataFrame({'A':['A0','A1','A2'],
'B':['B0','B1','B2']})data3
data4=pd.DataFrame({'C': ['C0', 'C1', 'C2'],
'D': ['D0', 'D1', 'D2']},
index=['a','b','c'])data3.join(data4,how='outer') # 外連接
data3.join(data4,how='left') #左連接

data3.join(data4,how='right') #右連接

data3.join(data4,how='inner') #內(nèi)連接

import pandas as pd
left = pd.DataFrame({'A': ['A0', 'A1', 'A2'],
'B': ['B0', 'B1', 'B2'],
'key': ['K0', 'K1', 'K2']})left
right = pd.DataFrame({'C': ['C0', 'C1','C2'],
'D': ['D0', 'D1','D2']},
index=['K0', 'K1','K2'])right
on參數(shù)指定連接的列名
left.join(right,how='left',on='key') #on參數(shù)指定連接的列名

當(dāng)DataFrame對(duì)象中出現(xiàn)了缺失數(shù)據(jù),而我們希望使用其他DataFrame對(duì)象中的數(shù)據(jù)填充缺失數(shù)據(jù),則可以通過combine_first()方法為缺失數(shù)據(jù)填充。
import pandas as pdimport numpy as npfrom numpy import NAN
left = pd.DataFrame({'A': [np.nan, 'A1', 'A2', 'A3'],
'B': [np.nan, 'B1', np.nan, 'B3'],
'key': ['K0', 'K1', 'K2', 'K3']})left
right = pd.DataFrame({'A': ['C0', 'C1','C2'],
'B': ['D0', 'D1','D2']},
index=[1,0,2])right
用right的數(shù)據(jù)填充left缺失的部分
left.combine_first(right) # 用right的數(shù)據(jù)填充left缺失的部分

以上就是關(guān)于“Python的concat與merge函數(shù)怎么使用”這篇文章的內(nèi)容,相信大家都有了一定的了解,希望小編分享的內(nèi)容對(duì)大家有幫助,若想了解更多相關(guān)的知識(shí)內(nèi)容,請(qǐng)關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。
分享標(biāo)題:Python的concat與merge函數(shù)怎么使用
本文網(wǎng)址:http://www.chinadenli.net/article10/pispgo.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供建站公司、面包屑導(dǎo)航、網(wǎng)站改版、網(wǎng)站內(nèi)鏈、商城網(wǎng)站、定制開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)