logo

R プログラミングで CSV ファイルの内容を読み取る – read.csv() 関数

read.csv() R 言語の関数は、カンマ区切り値ファイルを読み取るために使用されます。データを次の形式でインポートします。 データフレーム。

構文: read.csv(ファイル、ヘッダー、9月、12月) パラメーター: ファイル: R にインポートするデータを含むファイルへのパス。 ヘッダ: 論理値。 TRUE の場合、read.csv() はファイルにヘッダー行があると想定するため、行 1 が各列の名前になります。そうでない場合は、引数 header = FALSE を追加できます。 9月: フィールド区切り文字 12月: ファイル内で小数点として使用される文字。



read.csv() 関数を使用すると、data 変数には CSV ファイルの内容が保持されますが、別の変数を自由に使用することもできます。

read.csv() 関数は、インポート手順を変更するために使用できる多数のオプションの引数も受け入れます。最初の行を列名として扱うか、区切り文字を選択するかなどを選択できます。これらのオプションの詳細については、read.csv() ドキュメントを参照してください。

read.csv() メソッドに正しいファイル パスまたは URL を指定して、ファイルが正しい CSV 形式であり、正しい区切り文字と引用符が含まれていることを確認します。



例 1: 同じフォルダーからファイルを読み取る

R




Javaそれ以外の場合



# R program to read a csv file> # Get content into a data frame> data <->read.csv>(>'CSVFileExample.csv'>,> >header =>FALSE>, sep =>' '>)> > # Printing content of Text File> print>(data)>

>

>

出力:

 V1 V2 V3 1 100 AB ab 2 200 CD cd 3 300 EF ef 4 400 GH gh 5 500 IJ ij>

例 2: 異なるディレクトリからファイルを読み取る

R




# Simple R program to read csv file> x <->read.csv>(>' D://Datas//myfile.csv '>)> > # print x> print>(x)>

>

オブジェクトJavaとは何ですか

>

出力:

 X V1 V2 V3 1 1 100 a1 b1 2 2 200 a2 b2 3 3 300 a3 b3>

例3: 区切り文字が異なるCSVファイルの読み込み

R




data <->read.csv>(>'path/to/your/file.csv'>, sep =>';'>)>

>

>

sep オプションは ; に設定されます。この例では、CSV ファイルが標準のカンマ (,) ではなくセミコロン (;) を区切り文字として使用していることを示しています。

例 4: 最初の行を列名として扱う

R




ラテックスリスト
data <->read.csv>(>'path/to/your/file.csv'>, header =>TRUE>)>

>

>

header 引数が TRUE に設定されているため、CSV ファイルの最初の行はデフォルトで列名として処理されます。 CSV ファイルの最初の行に列名が含まれていない場合は、header = FALSE を設定することで列名なしでデータをインポートできます。

例 4: 列クラスの指定

R




data <->read.csv>(>'path/to/your/file.csv'>,> >colClasses =>c>(>'character'>,>'numeric'>,>'integer'>))>

>

Javaでデータベースに接続する

>

ColClasses オプションを使用して、CSV ファイルの各列のクラスを定義できます。この説明のために、最初の列は文字、2 番目の列は数値、3 番目の列は整数として解釈されます。特定の列のデータ型を管理したい場合。

例 5: 行をスキップして欠損値を指定する

R




data <->read.csv>(>'path/to/your/file.csv'>, skip = 3, na.strings =>c>(>''>,>'NA'>))>

>

>

Skip 引数を使用すると、CSV ファイルの先頭で特定の行数をスキップできます。この図の最初の 3 行は省略されています。欠損値 (NA) として考慮されるべき値は、an によって指定されます。文字列引数。この状況では、文字列 NA と空の文字列は両方とも欠損値として認識されます。