logo

Python で文字列を分割して解析する

パイソン、 文字列の操作はプログラミングの基本的な側面です。 文字列 は一連の文字であり、多くの場合、処理または分析が必要な構造化データが含まれています。文字列に対して実行される一般的な操作は、分割と解析です。

Python での文字列の分割

Python では、次のコマンドを使用して文字列を小さな部分に分割できます。 split()> 方法と split()> このメソッドは区切り文字を引数として受け取り、区切り文字が出現するたびに文字列を分割し、部分文字列のリストを返します。



構文:

string.split(区切り文字)

パラメーター:



  • delimiter> : 文字列が分割される文字または部分文字列。これはオプションのパラメータです。

戻り値:

split()> 方法 区切り文字の出現箇所で元の文字列を分割することによって取得された部分文字列のリストを返します。

str.split() メソッド

このメソッドは、指定された区切り文字に基づいて文字列を部分文字列のリストに分割します。文字列 こんにちは、techcodeview.com へようこそ カンマ (「,」) を区切り文字として使用します。の スプリット()関数 デリミタを使用して文字列を部分文字列のリストに分割すると、リスト A には [Hello Welcome to techcodeview.com] が含まれます。



例 :

パイソン




# Define a string containing> string>=> 'Hello,Welcome,to,techcodeview.com'> # Use the split() method to split the string into> A>=> string.split(>','>)> # Print the resulting list> print>(A)>

>

>

出力:

['Hello', 'Welcome', 'to', 'techcodeview.com']>

str.rsplit() メソッド

これは次のようなものです str.split() ですが、文字列の右側から分割されます。指定されたコードは、rsplit() 関数を使用して、最後に出現したカンマ (「,」) に基づいて文字列 S を 2 つの部分に分割します。結果は、分割前後の部分を含むリストになります。 Aは [「Hello to World」、「Python」] ここで、最後のカンマ区切り部分は パイソン 文字列の残りの部分から分離されたものです ハロー・トゥ・ワールド

例 :

パイソン




# Given string> S>=> 'Hello,to,World,Python'> A>=> S.rsplit(>','>,>1>)> # Printing the result> print>(A)>

ラテックス製のテーブル

>

>

出力:

['Hello,to,World', 'Python']>

str.splitlines() メソッド

このメソッドは、文字列を改行で分割し、行のリストを返します。このコードは、改行文字で区切られた 3 行のテキストを含む文字列 M を定義します。次に、 splitlines() メソッド 文字列を line というリストに分割します。各要素は元の文字列の 1 行を表します。最後に、コードは行リストの内容を出力します。

例 :

パイソン




# Define a string with three lines of> # text separated by newline characters> M>=> 'GFG 1 GFG 2 GFG 3'> # Use the splitlines() method to split> line>=> M.splitlines()> print>(line)>

データ構造内のハッシュ化
>

>

出力:

['GFG 1', 'GFG 2', 'GFG 3']>

str.partition() メソッド

この方法 文字列を分割します 最初の区切り文字に基づいて 3 つの部分に分割されます。コードでは、 パーティション() 最初に区切り文字が出現した時点で文字列 Text を分割するメソッド。セパレータの前の部分を変数 before に代入し、セパレータ自体を変数 sep に代入し、セパレータの後の部分を変数 after に代入します。

例 :

パイソン




# Input string> Text>=> 'Mango,Orange,apple'> before, sep, after>=> Text.partition(>','>)> # Printing the part of the string before the separator> print>(before)> print>(after)>

>

>

出力:

Mango Orange,apple>

re.split() メソッド

re モジュールは、正規表現を使用したより強力な文字列分割を提供します。コードでは、 re.split() Python の re モジュールの関数を使用して、数字の存在に基づいてテキスト文字列を分割します。要素が数字で区切られた Text の部分文字列であるリスト P を作成します。出力は [‘Mango,Orange’, ‘Banana’] となり、文字列が数字「1」で分割されたことを示します。

例 :

パイソン




import> re> # Input text containing a mix of> # alphabetic characters and digits> Text>=> 'Mango,Orange1Banana'> P>=> re.split(r>'d'>, Text)> # Printing the resulting list of substrings> print>(P)>

>

>

出力:

['Mango,Orange', 'Banana']>

リスト内包表記の使用

使用できます リストの内包表記 文字列を分割し、空の文字列を除外します。このコードは、split(‘,’) を使用して文字列 Text をコンマで分割し、リスト内包表記を使用して、先頭または末尾の空白を削除した後、空ではない部分を含むリスト P を作成します。出力は、次の内容を含むリスト P です。 [「マンゴー」、「オレンジ」、「バナナ」]。 このコードは、分割結果から空の部分を効果的に削除し、余分なスペースをトリミングします。

例 :

パイソン




# Given input string> Text>=> 'Mango,Orange,Banana'> # Split the input string by commas and filter out empty parts using list comprehension> P>=> [part>for> part>in> Text.split(>','>)>if> part.strip()]> # print> print>(P)>

>

>

出力:

['Mango', 'Orange', 'Banana']>

パイソン , 文字列の解析とは、指定された文字列から意味のある情報を抽出することを指します。このプロセスには、文字列を目的のデータ型に変換するか、文字列から特定のデータ パターンを抽出することが含まれます。

整数または浮動小数点への変換

文字列に数値データが含まれている場合。を使用して、整数または浮動小数点データ型に解析できます。int()>そしてfloat()>それぞれ機能します。指定されたコードは、文字列 52 を整数に変換し、結果 (52) を出力します。同様に、文字列 4.17 を浮動小数点数に変換し、結果 (4.17) を出力します。これは、Python で int() 関数と float() 関数を使用して文字列を対応する数値データ型に変換する方法を示しています。

パイソン




Arduinoの機能

# Convert a string to an integer> number_str>=> '52'> number_int>=> int>(number_str)> print>(number_int)> # Convert a string to a floating-point number> decimal_str>=> '4.17'> decimal_float>=> float>(decimal_str)> print>(decimal_float)>

>

>

出力:

52 4.17>

結論

上記のこれらのメソッドを使用すると、文字列を分割して解析できるようになります。また、split() メソッドを使用して整数を浮動小数点数に変換する方法についても説明します。 文字列をより小さな部分に分割する方法 区切り文字に基づいて。