logo

Pythonパンダシリーズ

Pandas シリーズは、さまざまなデータ型を格納できる 1 次元配列として定義できます。 ' を使用して、リスト、タプル、辞書をシリーズに簡単に変換できます。 シリーズ ' 方法。シリーズの行ラベルはインデックスと呼ばれます。シリーズに複数の列を含めることはできません。次のパラメータがあります。

    データ:任意のリスト、辞書、またはスカラー値を指定できます。索引:インデックスの値は一意でハッシュ可能である必要があります。データと同じ長さでなければなりません。インデックスを渡さない場合、デフォルト np.arrange(n) 使用されます。dtype:シリーズのデータ​​型を指します。コピー:データのコピーに使用します。

シリーズの作成:

シリーズは 2 つの方法で作成できます。

  1. 空のシリーズを作成する
  2. 入力を使用してシリーズを作成します。

空のシリーズを作成します。

Pandas では空のシリーズを簡単に作成できます。これは、値が存在しないことを意味します。

空のシリーズを作成するために使用される構文は次のとおりです。

 = pandas.Series() 

以下の例では、値を持たず、デフォルトのデータ型を持つ空のシリーズ型オブジェクトを作成します。 float64

 import pandas as pd x = pd.Series() print (x) 

出力

 Series([], dtype: float64) 

入力を使用してシリーズを作成する:

さまざまな入力を使用してシリーズを作成できます。

  • 配列
  • 辞書
  • スカラー値

配列からシリーズを作成する:

シリーズを作成する前に、まず、 しこり モジュールを作成し、プログラム内で array() 関数を使用します。データが ndarray の場合、渡されるインデックスは同じ長さである必要があります。

インデックスを渡さない場合、デフォルトでは次のインデックスが使用されます。 範囲(n) n が配列の長さを定義する場合、[0,1,2,....] が渡されます。 range(len(配列))-1 ]。

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

出力

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

dict からシリーズを作成する

dict からシリーズを作成することもできます。 ディクショナリ オブジェクトが入力として渡され、インデックスが指定されていない場合は、ディクショナリ キーが並べ替えられた順序で取得され、インデックスが構築されます。

インデックスが渡された場合、インデックス内の特定のラベルに対応する値がインデックスから抽出されます。 辞書

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

出力

 x 0.0 y 1.0 z 2.0 dtype: float64 

スカラーを使用してシリーズを作成します。

スカラー値を取得する場合は、インデックスを指定する必要があります。スカラー値はインデックスの長さに一致するように繰り返されます。

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

出力

 0 4 1 4 2 4 3 4 dtype: int64 

Position を使用してシリーズからデータにアクセスする:

Series タイプのオブジェクトを作成すると、そのインデックス、データ、さらには個々の要素にアクセスできるようになります。

Series 内のデータには、ndarray 内のデータと同様にアクセスできます。

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

出力

 1 

シリーズオブジェクトの属性

Series 属性は、サイズ、データ型など、Series オブジェクトに関連する情報として定義されます。以下は、Series オブジェクトに関する情報を取得するために使用できる属性の一部です。

属性 説明
シリーズ.インデックス シリーズのインデックスを定義します。
シリーズ・形状 データの形状のタプルを返します。
シリーズ.dtype データのデータ型を返します。
シリーズサイズ データのサイズを返します。
シリーズ.空 Series オブジェクトが空の場合は True を返し、それ以外の場合は false を返します。
シリーズ.ハスナンス NaN 値がある場合は True を返し、それ以外の場合は false を返します。
シリーズ.nbytes データ内のバイト数を返します。
シリーズです。 データの次元数を返します。
シリーズ.アイテムサイズ 項目のデータ型のサイズを返します。

シリーズオブジェクトのインデックス配列とデータ配列の取得

属性のインデックスと値を使用して、既存の Series オブジェクトのインデックス配列とデータ配列を取得できます。

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

出力

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

型 (dtype) と型のサイズ (itemsize) の取得

Series オブジェクトの属性 dtype を dtype として使用して、シリーズ オブジェクトの個々の要素のデータ型を取得できます。 アイテムサイズ 属性を使用して、各データ項目に割り当てられたバイト数を示します。

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

出力

 int64 8 float64 8 

形状の取得

Series オブジェクトの形状は、欠損値または空の値 (NaN) を含む要素の総数を定義します。

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

出力

 (4,) (3,) 

次元、サイズ、バイト数の取得:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

出力

Javaでソートされた配列リスト
 1 1 4 3 32 24 

NaN の空性と存在のチェック

Series オブジェクトが空であることを確認するには、 空の属性 。同様に、系列オブジェクトに NaN 値が含まれているかどうかを確認するには、 ハッサン 属性。

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

出力

 False False True True False False 4 3 3 3 

シリーズ関数

Series で使用される関数には次のようなものがあります。

機能 説明
パンダシリーズ.map() 共通の列を持つ 2 つの系列の値をマップします。
パンダシリーズ.std() 指定された数値セット、DataFrame、列、行の標準偏差を計算します。
パンダシリーズ.to_frame() シリーズ オブジェクトをデータフレームに変換します。
パンダ Series.value_counts() 一意の値の数を含む Series を返します。