パンダのデータフレーム 行と列を含むテーブルのような 2 次元のラベル付きデータ構造です。 DataFrame のサイズと値は変更可能です。つまり、変更できます。
DataFrame は主にデータ分析とデータ操作に使用されます。 SQL データベース、MS Excel、Google スプレッドシートなどの表形式でデータを保存できるため、データに対する算術演算の実行が容易になります。
これは最も一般的に使用される Pandas オブジェクトです。の DataFrame() 関数 Pandas で DataFrame を作成するために使用されます。複数の方法で Pandas DataFrame を作成することもできます。
Pandas Dataframe() の構文
pandas.DataFrame(データ、インデックス、列)
抽象クラスはコンストラクターを持つことができますか
パラメーター:
- データ : DataFrame の作成元となるデータセットです。リスト、辞書、スカラー値、系列、配列などを指定できます。
- 索引 : これはオプションです。デフォルトでは、DataFrame のインデックスは 0 から始まり、最後のデータ値 (n-1) で終わります。行ラベルを明示的に定義します。
- 列 : このパラメータは、DataFrame に列名を提供するために使用されます。列名がデフォルトで定義されていない場合は、0 から n-1 までの値が取られます。
戻り値:
- データフレームオブジェクト
DataFrame() 関数について説明したので、DataFrame を作成するさまざまな方法を見てみましょう。
Python でデータフレームを作成するさまざまな方法
を作成するにはいくつかの方法があります パンダのデータフレーム で パイソン 。次のメソッドを使用して DataFrame を作成できます。
- DataFrame() 関数を使用して Pandas DataFrame を作成する
- リストのリストから Pandas DataFrame を作成する
- ndarray/listの辞書からPandas DataFrameを作成します
- 辞書のリストから Pandas DataFrame を作成する
- Series の辞書から Pandas DataFrame を作成する
- zip()関数を使用したDataFrameの作成
- インデックスラベルを明示的に証明してデータフレームを作成する
DataFrame() メソッドを使用して空のデータフレームを作成する
Python の DataFrame は、 パンダ図書館 。 DataFrame コンストラクターを使用して関数を呼び出すだけで、DataFrame を作成できます。
例 : Python で DataFrame() 関数を使用して空の DataFrame を作成する
Python3
# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df> => pd.DataFrame()> # Printing Empty DataFrame> print> (df)> |
>
>
出力:
Empty DataFrame Columns: [] Index: []>
リストのリストから DataFrame を作成する
Pandas DataFrame を作成するには リスト リストの場合は、pd.DataFrame() 関数を使用できます。この関数は、リストのリストを入力として受け取り、入力リストと同じ行数と列数を持つ DataFrame を作成します。
例 : DataFrame() メソッドを使用してリストのリストから DataFrame を作成する
Python3
# Import pandas library> import> pandas as pd> # initialize list of lists> data> => [[> 'tom'> ,> 10> ], [> 'nick'> ,> 15> ], [> 'juli'> ,> 14> ]]> # Create the pandas DataFrame> df> => pd.DataFrame(data, columns> => [> 'Name'> ,> 'Age'> ])> # print dataframe.> print> (df)> |
Javaのコレクションは何ですか
>
>
出力:
Name Age 0 tom 10 1 nick 15 2 juli 14>
ndArray/ListsのディクショナリからDataFrameを作成
データフレームを作成するには 辞書 の ndarray /lists では、すべての配列が同じ長さである必要があります。インデックスが渡される場合、長さインデックスは配列の長さと等しくなければなりません。
インデックスが渡されない場合、デフォルトでインデックスは range(n) になります。n は配列の長さです。
例 : ndarray/lists の辞書から DataFrame を作成する
Python3
# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'nick'> ,> 'krish'> ,> 'jack'> ],> > 'Age'> : [> 20> ,> 21> ,> 19> ,> 18> ]}> # Create DataFrame> df> => pd.DataFrame(data)> # Print the output.> print> (df)> |
>
>
出力:
Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>
注記: ディクショナリを使用して DataFrame を作成する場合、デフォルトではディクショナリのキーは列名になります。列パラメータを使用して列名を明示的に指定することもできます。
辞書のリストからデータフレームを作成
Pandas DataFrame は渡すことで作成できます 辞書のリスト 入力データとして。デフォルトでは、辞書キーは列として取得されます。
Python3
# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data> => [{> 'a'> :> 1> ,> 'b'> :> 2> ,> 'c'> :> 3> },> > {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates DataFrame.> df> => pd.DataFrame(data)> # Print the data> print> (df)> |
>
>
出力:
a b c 0 1 2 3 1 10 20 30>
別の例は、辞書のリストを渡して Pandas DataFrame を作成することです。 行インデックス 。
Python3
Javaの日付を文字列に変換する
# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data> => [{> 'b'> :> 2> ,> 'c'> :> 3> }, {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df> => pd.DataFrame(data, index> => [> 'first'> ,> 'second'> ])> # Print the data> print> (df)> |
>
>
出力:
b c a first 2 3 NaN second 20 30 10.0>
Series の辞書から DataFrame を作成する
ディクショナリから DataFrame を作成するには シリーズ 、辞書を渡して DataFrame を形成できます。結果として得られるインデックスは、渡された一連のインデックス付けされたすべての結合です。
例: シリーズの辞書から DataFrame を作成します。
Python3
Javaマップの例
# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d> => {> 'one'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ]),> > 'two'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ])}> # creates Dataframe.> df> => pd.DataFrame(d)> # print the data.> print> (df)> |
>
>
出力:
one two a 10 10 b 20 20 c 30 30 d 40 40>
zip()関数を使用してDataFrameを作成します。
2 つのリストは、 zip()関数 。ここで、pd.DataFrame() 関数を呼び出して Pandas DataFrame を作成します。
例: zip()関数を使用してDataFrameを作成します。
Python3
# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name> => [> 'tom'> ,> 'krish'> ,> 'nick'> ,> 'juli'> ]> # List2> Age> => [> 25> ,> 30> ,> 26> ,> 22> ]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples> => list> (> zip> (Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df> => pd.DataFrame(list_of_tuples,> > columns> => [> 'Name'> ,> 'Age'> ])> # Print data.> print> (df)> |
>
>
出力:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
インデックス ラベルを明示的に証明して DataFrame を作成する
インデックス ラベルを明示的に指定して DataFrame を作成するには、pd.DataFrame() コンストラクターのインデックス パラメーターを使用できます。 Index パラメーターはインデックス ラベルのリストを入力として受け取り、DataFrame はこれらのラベルを DataFrame の行に使用します。
例: インデックスラベルを明示的に証明してデータフレームを作成する
Python3
JavaでExcelファイルを読む
# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'Jack'> ,> 'nick'> ,> 'juli'> ],> > 'marks'> : [> 99> ,> 98> ,> 95> ,> 90> ]}> # Creates pandas DataFrame.> df> => pd.DataFrame(data, index> => [> 'rank1'> ,> > 'rank2'> ,> > 'rank3'> ,> > 'rank4'> ])> # print the data> print> (df)> |
>
>
出力:
Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>
結論
Python Pandas DataFrame は、行と列を持つテーブルに似ています。これは 2 次元のデータ構造であり、データ分析やデータ操作に非常に役立ちます。
このチュートリアルでは、Pandas DataFrame を作成する複数の方法について説明しました。このチュートリアルを使用すると、DataFrame を作成するための複雑な要件に対処できるようになります。