logo

Pandas データフレームを作成するさまざまな方法

パンダのデータフレーム 行と列を含むテーブルのような 2 次元のラベル付きデータ構造です。 DataFrame のサイズと値は変更可能です。つまり、変更できます。

DataFrame は主にデータ分析とデータ操作に使用されます。 SQL データベース、MS Excel、Google スプレッドシートなどの表形式でデータを保存できるため、データに対する算術演算の実行が容易になります。



これは最も一般的に使用される Pandas オブジェクトです。の DataFrame() 関数 Pandas で DataFrame を作成するために使用されます。複数の方法で Pandas DataFrame を作成することもできます。

Pandas Dataframe() の構文

pandas.DataFrame(データ、インデックス、列)

抽象クラスはコンストラクターを持つことができますか

パラメーター:

  • データ : DataFrame の作成元となるデータセットです。リスト、辞書、スカラー値、系列、配列などを指定できます。
  • 索引 : これはオプションです。デフォルトでは、DataFrame のインデックスは 0 から始まり、最後のデータ値 (n-1) で終わります。行ラベルを明示的に定義します。
  • : このパラメータは、DataFrame に列名を提供するために使用されます。列名がデフォルトで定義されていない場合は、0 から n-1 までの値が取られます。

戻り値:

  • データフレームオブジェクト

DataFrame() 関数について説明したので、DataFrame を作成するさまざまな方法を見てみましょう。



Python でデータフレームを作成するさまざまな方法

を作成するにはいくつかの方法があります パンダのデータフレーム パイソン 。次のメソッドを使用して DataFrame を作成できます。

  • DataFrame() 関数を使用して Pandas DataFrame を作成する
  • リストのリストから Pandas DataFrame を作成する
  • ndarray/listの辞書からPandas DataFrameを作成します
  • 辞書のリストから Pandas DataFrame を作成する
  • Series の辞書から Pandas DataFrame を作成する
  • zip()関数を使用したDataFrameの作成
  • インデックスラベルを明示的に証明してデータフレームを作成する

DataFrame() メソッドを使用して空のデータフレームを作成する

Python の DataFrame は、 パンダ図書館 。 DataFrame コンストラクターを使用して関数を呼び出すだけで、DataFrame を作成できます。

: Python で DataFrame() 関数を使用して空の DataFrame を作成する



Python3




# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df>=> pd.DataFrame()> # Printing Empty DataFrame> print>(df)>

>

>

出力:

Empty DataFrame Columns: [] Index: []>

リストのリストから DataFrame を作成する

Pandas DataFrame を作成するには リスト リストの場合は、pd.DataFrame() 関数を使用できます。この関数は、リストのリストを入力として受け取り、入力リストと同じ行数と列数を持つ DataFrame を作成します。

: DataFrame() メソッドを使用してリストのリストから DataFrame を作成する

Python3




# Import pandas library> import> pandas as pd> # initialize list of lists> data>=> [[>'tom'>,>10>], [>'nick'>,>15>], [>'juli'>,>14>]]> # Create the pandas DataFrame> df>=> pd.DataFrame(data, columns>=>[>'Name'>,>'Age'>])> # print dataframe.> print>(df)>

Javaのコレクションは何ですか

>

>

出力:

 Name Age 0 tom 10 1 nick 15 2 juli 14>

ndArray/ListsのディクショナリからDataFrameを作成

データフレームを作成するには 辞書 ndarray /lists では、すべての配列が同じ長さである必要があります。インデックスが渡される場合、長さインデックスは配列の長さと等しくなければなりません。

インデックスが渡されない場合、デフォルトでインデックスは range(n) になります。n は配列の長さです。

: ndarray/lists の辞書から DataFrame を作成する

Python3




# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data>=> {>'Name'>: [>'Tom'>,>'nick'>,>'krish'>,>'jack'>],> >'Age'>: [>20>,>21>,>19>,>18>]}> # Create DataFrame> df>=> pd.DataFrame(data)> # Print the output.> print>(df)>

>

>

出力:

 Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>

注記: ディクショナリを使用して DataFrame を作成する場合、デフォルトではディクショナリのキーは列名になります。列パラメータを使用して列名を明示的に指定することもできます。

辞書のリストからデータフレームを作成

Pandas DataFrame は渡すことで作成できます 辞書のリスト 入力データとして。デフォルトでは、辞書キーは列として取得されます。

Python3




# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data>=> [{>'a'>:>1>,>'b'>:>2>,>'c'>:>3>},> >{>'a'>:>10>,>'b'>:>20>,>'c'>:>30>}]> # Creates DataFrame.> df>=> pd.DataFrame(data)> # Print the data> print>(df)>

>

>

出力:

a b c 0 1 2 3 1 10 20 30>

別の例は、辞書のリストを渡して Pandas DataFrame を作成することです。 行インデックス

Python3

Javaの日付を文字列に変換する




# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data>=> [{>'b'>:>2>,>'c'>:>3>}, {>'a'>:>10>,>'b'>:>20>,>'c'>:>30>}]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df>=> pd.DataFrame(data, index>=>[>'first'>,>'second'>])> # Print the data> print>(df)>

>

>

出力:

b c a first 2 3 NaN second 20 30 10.0>

Series の辞書から DataFrame を作成する

ディクショナリから DataFrame を作成するには シリーズ 、辞書を渡して DataFrame を形成できます。結果として得られるインデックスは、渡された一連のインデックス付けされたすべての結合です。

例: シリーズの辞書から DataFrame を作成します。

Python3


Javaマップの例



# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d>=> {>'one'>: pd.Series([>10>,>20>,>30>,>40>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>]),> >'two'>: pd.Series([>10>,>20>,>30>,>40>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>])}> # creates Dataframe.> df>=> pd.DataFrame(d)> # print the data.> print>(df)>

>

>

出力:

 one two a 10 10 b 20 20 c 30 30 d 40 40>

zip()関数を使用してDataFrameを作成します。

2 つのリストは、 zip()関数 。ここで、pd.DataFrame() 関数を呼び出して Pandas DataFrame を作成します。

例: zip()関数を使用してDataFrameを作成します。

Python3




# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name>=> [>'tom'>,>'krish'>,>'nick'>,>'juli'>]> # List2> Age>=> [>25>,>30>,>26>,>22>]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples>=> list>(>zip>(Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df>=> pd.DataFrame(list_of_tuples,> >columns>=>[>'Name'>,>'Age'>])> # Print data.> print>(df)>

>

>

出力:

 Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>

インデックス ラベルを明示的に証明して DataFrame を作成する

インデックス ラベルを明示的に指定して DataFrame を作成するには、pd.DataFrame() コンストラクターのインデックス パラメーターを使用できます。 Index パラメーターはインデックス ラベルのリストを入力として受け取り、DataFrame はこれらのラベルを DataFrame の行に使用します。

例: インデックスラベルを明示的に証明してデータフレームを作成する

Python3

JavaでExcelファイルを読む




# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data>=> {>'Name'>: [>'Tom'>,>'Jack'>,>'nick'>,>'juli'>],> >'marks'>: [>99>,>98>,>95>,>90>]}> # Creates pandas DataFrame.> df>=> pd.DataFrame(data, index>=>[>'rank1'>,> >'rank2'>,> >'rank3'>,> >'rank4'>])> # print the data> print>(df)>

>

>

出力:

 Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>

結論

Python Pandas DataFrame は、行と列を持つテーブルに似ています。これは 2 次元のデータ構造であり、データ分析やデータ操作に非常に役立ちます。

このチュートリアルでは、Pandas DataFrame を作成する複数の方法について説明しました。このチュートリアルを使用すると、DataFrame を作成するための複雑な要件に対処できるようになります。