データ視覚化は、グラフ、チャート、地図などの視覚的な手がかりを使用してデータに関する洞察を提供するために使用される手法です。これは、大量のデータを直感的かつ簡単に理解できるため、データに関してより適切な意思決定を行うのに役立ちます。大量のデータセットを印刷すると、切り詰められてしまいます。この記事では、全体を印刷する方法を見ていきます。 パンダのデータフレーム または切り捨てのないシリーズ。
Python で Pandas DataFrame 全体を出力する
デフォルトでは、長さがデフォルトの長さを超える場合、完全なデータ フレームは印刷されず、出力は次のように切り詰められます。
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> # Loading irirs dataset> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> display(df)> |
>
>
出力:
がある pandas データフレーム全体を印刷する 4 つの方法:
- to_string() メソッドを使用する
- pd.option_context() メソッドを使用する
- pd.set_options() メソッドを使用する
- pd.to_markdown() メソッドを使用する
方法 1: to_string() を使用する
この方法は最も単純ですが、データ フレーム全体を文字列オブジェクトに変換するため、非常に巨大なデータセット (数百万のオーダー) にはお勧めできませんが、サイズが数千のオーダーのデータ フレームには非常にうまく機能します。
構文: DataFrame.to_string(buf=None、columns=None、col_space=None、header=True、index=True、na_rep='NaN'、formatters=None、float_format=None、index_names=True、justify=None、max_rows=None、 max_cols=なし、show_dimensions=False、10進数='.'、line_width=なし)
例: この例では、load_iris>scikit-learn の関数で Iris データセットをロードし、pandas DataFrame を作成します (df>) データセットの特徴を含み、最後に、データフレーム全体を次を使用して文字列表現に変換します。 to_string()> そしてそれを表示します。
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> # Convert the whole dataframe as a string and display> display(df.to_string())> |
フィボナッチコードJava
>
>
出力:
方法 2: pd.option_context() を使用する
パンダでは、 オプションコンテキスト() 方法と set_option() メソッド。どちらの方法も同じですが、後者は設定を永続的に変更し、前者はコンテキスト マネージャーのスコープ内でのみ変更を行うという 1 つの違いがあります。
構文: pandas.option_context(*args)
文字列を整数に変換する
例: この例では、scikit-learn の Iris データセットを使用し、pandas DataFrame (df>) を指定した書式設定オプションで作成し、最大行、列、精度などの表示設定がローカル スコープのみで変更される一時コンテキスト内で DataFrame を印刷します。
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> # The scope of these changes made to> # pandas settings are local to with statement.> with pd.option_context(>'display.max_rows'>,>None>,> >'display.max_columns'>,>None>,> >'display.precision'>,>3>,> >):> >print>(df)> |
>
>
出力:
方法 3: pd.set_option() を使用する
このメソッドは pd.option_context() メソッドに似ており、メソッド 2 で説明したのと同じパラメータを受け取りますが、pd.option_context() とは異なります。 スコープと効果はスクリプト全体にあります。つまり、すべてのデータ フレーム設定が永続的に変更されます。
値を明示的にリセットするには、使用します pd.reset_option('すべて') 変更を元に戻すには、メソッドを使用する必要があります。
構文: pandas.set_option(パット, 値)
例: このコードは、グローバル パンダの表示オプションを変更して、指定された DataFrame の無制限の幅と精度ですべての行と列を表示します (df>)。次に、オプションをデフォルト値にリセットし、デフォルト設定の復元を示すデータフレームを再度表示します。
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> # Permanently changes the pandas settings> pd.set_option(>'display.max_rows'>,>None>)> pd.set_option(>'display.max_columns'>,>None>)> pd.set_option(>'display.width'>,>None>)> pd.set_option(>'display.max_colwidth'>,>->1>)> # All dataframes hereafter reflect these changes.> display(df)> print>(>'**RESET_OPTIONS**'>)> # Resets the options> pd.reset_option(>'all'>)> display(df)> |
>
>
出力:
分数として .04
方法 4: to_markdown() を使用する
このメソッドは、データ フレームを文字列オブジェクトに変換し、それにスタイルと書式設定を追加する点で、to_string() メソッドに似ています。
構文: DataFrame.to_markdown(buf=None、mode='wt'、index=True、、**kwargs)
例: このコードは、scikit-learn の Iris データセットを使用して pandas DataFrame (df>)、次に、 to_markdown()>方法 。
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=>data.feature_names)> # Converts the dataframe into str object with formatting> print>(df.to_markdown())> |
>
>
出力: