この記事では、 カウントプロット seaborn ライブラリの使用方法と、さまざまなパラメーターを使用してデータセットの特徴から結果を推測する方法について説明します。
シーボーン図書館
Seaborn ライブラリはデータ アナリストの間で広く使用されており、そこに含まれるプロットの銀河系はデータを可能な限り最良に表現します。
バブルソート
seaborn ライブラリは、以下を使用して作業環境にインポートできます。
import seaborn as sns
ここで、countplot を使用する理由とそのパラメーターの重要性について説明します。
カウントプロット
countplot は、カテゴリ変数に存在する観測値の発生 (カウント) を表すために使用されます。
視覚的な表現に棒グラフの概念を使用します。
パラメーター-
次のパラメータは countplot を作成するときに指定されます。それらについて簡単に理解しましょう。
次に、属性を表すさまざまな方法が何であるかを見てみましょう。
最初の例では、単一の変数の countplot を作成します。同じことを実装するためにデータセットの「ヒント」を採用しました。
1. 単一変数の値のカウント
例 -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',data=df) plt.show()
出力:
次の例では、hue パラメーターを使用して countplot を作成します。
次のプログラムは同じことを示しています。
2. 色相パラメータを使用した 2 つのカテゴリ変数の表現
例 -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',hue='smoker',data=df) plt.show()
出力:
次の例では、y 軸を考慮して、水平方向のカウントプロットを作成します。
次のプログラムは同じことを示しています。
3. 水平方向のプロットの作成
例 -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(y='sex',hue='smoker',data=df) plt.show()
出力:
次に、カラー パレットがデータのプレゼンテーションをどのように強化できるかを見てみましょう。
次の例では、パラメータ「palette」を使用します。
次のプログラムは同じことを示しています。
4. カラーパレットの使用
入力-
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex', data=df, palette='Set1') plt.show()
出力:
次の例では、パラメータ color を使用して、それがどのように機能するかを見てみましょう。
次のプログラムは同じことを示しています。
5. パラメータ「color」の使用
例 -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',hue='Sex', data=df, color='green') plt.show()
出力:
次に、パラメーター「saturation」を使用して、それがデータの表現にどのような影響を与えるかを見てみましょう。
次のプログラムは同じことを示しています。
マークダウン脚注
6. パラメータ「彩度」の使用
例 -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',data=df, color='green', saturation=0.1) plt.show()
出力:
そして最後の例では、パラメータを使用します。 線幅 そして エッジカラー。
例 -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') sns.countplot(x='Sex', data=df, color='green', facecolor=(0,0,0,0), linewidth=5, edgecolor=sns.color_palette('BrBG',2)) plt.show()
出力: