logo

Python のカウントプロット

この記事では、 カウントプロット seaborn ライブラリの使用方法と、さまざまなパラメーターを使用してデータセットの特徴から結果を推測する方法について説明します。

シーボーン図書館

Seaborn ライブラリはデータ アナリストの間で広く使用されており、そこに含まれるプロットの銀河系はデータを可能な限り最良に表現します。

バブルソート

seaborn ライブラリは、以下を使用して作業環境にインポートできます。

 import seaborn as sns 

ここで、countplot を使用する理由とそのパラメーターの重要性について説明します。

カウントプロット

countplot は、カテゴリ変数に存在する観測値の発生 (カウント) を表すために使用されます。

視覚的な表現に棒グラフの概念を使用します。

パラメーター-

次のパラメータは countplot を作成するときに指定されます。それらについて簡単に理解しましょう。

    x と y-このパラメータは、表現のために参照するデータを指定し、強調表示されたパターンを観察します。色-このパラメータは、プロットの見栄えを良くする色を指定します。パレット-パレットの値を受け取ります。主に色相変数を表示するために使用されます。色合い-このパラメータは列名を指定します。データ-このパラメータは、表現に使用するデータ フレームを指定します。たとえば、データは配列にすることができます。かわして~このパラメータはオプションであり、入力としてブール値を受け入れます。飽和-このパラメータは浮動小数点値を受け入れます。これを指定すると、色の強度の変化が観察されます。色相_順序-パラメータ hue_order は文字列を入力として受け取ります。クワーグス-パラメータ kwargs は、キーと値のマッピングを指定します。斧-パラメータ ax はオプションであり、プロットを作成する軸を取得するために使用されます。オリエント-パラメータ orient はオプションであり、必要なプロットの方向 (水平または垂直) を示します。

次に、属性を表すさまざまな方法が何であるかを見てみましょう。

最初の例では、単一の変数の countplot を作成します。同じことを実装するためにデータセットの「ヒント」を採用しました。

1. 単一変数の値のカウント

例 -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',data=df) plt.show() 

出力:

Python のカウントプロット

次の例では、hue パラメーターを使用して countplot を作成します。

次のプログラムは同じことを示しています。

2. 色相パラメータを使用した 2 つのカテゴリ変数の表現

例 -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',hue='smoker',data=df) plt.show() 

出力:

Python のカウントプロット

次の例では、y 軸を考慮して、水平方向のカウントプロットを作成します。

次のプログラムは同じことを示しています。

3. 水平方向のプロットの作成

例 -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(y='sex',hue='smoker',data=df) plt.show() 

出力:

Python のカウントプロット

次に、カラー パレットがデータのプレゼンテーションをどのように強化できるかを見てみましょう。

次の例では、パラメータ「palette」を使用します。

次のプログラムは同じことを示しています。

4. カラーパレットの使用

入力-

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex', data=df, palette='Set1') plt.show() 

出力:

Python のカウントプロット

次の例では、パラメータ color を使用して、それがどのように機能するかを見てみましょう。

次のプログラムは同じことを示しています。

5. パラメータ「color」の使用

例 -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',hue='Sex', data=df, color='green') plt.show() 

出力:

Python のカウントプロット

次に、パラメーター「saturation」を使用して、それがデータの表現にどのような影響を与えるかを見てみましょう。

次のプログラムは同じことを示しています。

マークダウン脚注

6. パラメータ「彩度」の使用

例 -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',data=df, color='green', saturation=0.1) plt.show() 

出力:

Python のカウントプロット

そして最後の例では、パラメータを使用します。 線幅 そして エッジカラー。

    matplotlib.axes.Axes.bar() の使用

例 -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') sns.countplot(x='Sex', data=df, color='green', facecolor=(0,0,0,0), linewidth=5, edgecolor=sns.color_palette('BrBG',2)) plt.show() 

出力:

Python のカウントプロット