パンダのマージ - パンダのチュートリアル

パンダ マージ（） 2 つのデータセットを 1 つにまとめ、共通の属性または列に基づいて行を配置するプロセスとして定義されます。これは、DataFrame オブジェクト間のすべての標準データベース結合操作のエントリポイントです。

構文：

 pd.merge(left, right, how=&apos;inner&apos;, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True)

パラメーター：

データフレームまたは名前付きシリーズ

{'left', 'right', 'outer', 'inner'}、デフォルトの 'inner'

左：SQL の左外部結合と同様に、左フレームのキーのみを使用します。キーの順序を保持します。右：SQL の右外部結合と同様に、右フレームのキーのみを使用します。キーの順序を保持します。外側:SQL の完全外部結合と同様に、両方のフレームのキーの結合を使用しました。キーを辞書順に並べ替えます。内側:SQL 内部結合と同様に、両方のフレームのキーの共通部分を使用します。左のキーの順序を保持します。

ラベルまたはリスト

左上:

ラベル、リスト、または配列のような

ブール値、デフォルトは False

(str, str) のタプル、デフォルト ('_x', '_y')

ブール値、デフォルトは True

bool または str、デフォルトは False

_マージ

'左のみ'マージキーがデータフレームの「左側」にのみ現れる観測の場合、'右のみ'マージキーがデータフレームの「右側」にのみ現れる観測に対して定義されています。'両方'観測のマージキーが両方に見つかった場合。

str、オプション

「one_to_one」または「1:1」: マージキーが左右のデータセットの両方で一意であるかどうかを確認します。
'one_to_many' または '1:m': マージキーが左側のデータセットのみで一意であるかどうかを確認します。
'many_to_one' または 'm:1': マージキーが正しいデータセット内でのみ一意であるかどうかを確認します。
'many_to_many' または 'm:m': 許可されますが、チェックは行われません。

例1: キー上の 2 つの DataFrame をマージする

 # import the pandas library import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;John&apos;, &apos;Parker&apos;, &apos;Smith&apos;, &apos;Parker&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;William&apos;, &apos;Albert&apos;, &apos;Tony&apos;, &apos;Allen&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;]}) print (left) print (right)

出力

 id Name subject_id 0 1 John sub1 1 2 Parker sub2 2 3 Smith sub4 3 4 Parker sub6 id Name subject_id 0 1 William sub2 1 2 Albert sub4 2 3 Tony sub3 3 4 Allen sub6

例 2: 複数のキー上の 2 つの DataFrame をマージします。

 import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Alex&apos;, &apos;Amy&apos;, &apos;Allen&apos;, &apos;Alice&apos;, &apos;Ayoung&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Billy&apos;, &apos;Brian&apos;, &apos;Bran&apos;, &apos;Bryce&apos;, &apos;Betty&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) print pd.merge(left,right,on=&apos;id&apos;)

出力

 id Name_x subject_id_x Name_y subject_id_y 0 1 John sub1 William sub2 1 2 Parker sub2 Albert sub4 2 3 Smith sub4 Tony sub3 3 4 Parker sub6 Allen sub6

TechCodeview

パンダの DataFrame.merge()

構文：

パラメーター：

例1: キー上の 2 つの DataFrame をマージする

例 2: 複数のキー上の 2 つの DataFrame をマージします。