logo

機械学習の種類

機械学習は AI のサブセットであり、機械がデータから自動的に学習し、過去の経験からパフォーマンスを向上させ、予測を行うことができます。 。機械学習には、膨大な量のデータを処理する一連のアルゴリズムが含まれています。これらのアルゴリズムにデータが供給されてトレーニングされ、トレーニングに基づいてモデルが構築され、特定のタスクが実行されます。

機械学習の種類

これらの ML アルゴリズムは、回帰、分類、予測、クラスタリング、関連付けなどのさまざまなビジネス上の問題を解決するのに役立ちます。

機械学習は学習方法や方法に基づいて、主に次の 4 つのタイプに分類されます。

  1. 教師あり機械学習
  2. 教師なし機械学習
  3. 半教師あり機械学習
  4. 強化学習
機械学習の種類

このトピックでは、機械学習の種類とそれぞれのアルゴリズムについて詳しく説明します。

1.教師あり機械学習

その名の通り、 教師あり機械学習 監修に基づいています。つまり、教師あり学習手法では、「ラベル付き」データセットを使用してマシンをトレーニングし、そのトレーニングに基づいてマシンが出力を予測します。ここで、ラベル付きデータは、入力の一部がすでに出力にマップされていることを指定します。さらに貴重なことに、次のように言えます。まず、入力と対応する出力を使用してマシンをトレーニングし、次にテスト データセットを使用して出力を予測するようにマシンに依頼します。

例を挙げて教師あり学習を理解しましょう。猫と犬の画像の入力データセットがあるとします。したがって、最初に、次のような画像を理解するためのトレーニングをマシンに提供します。 猫と犬の尻尾の形と大きさ、目の形、色、身長(犬の方が背が高く、猫の方が小さい)など。 トレーニングの完了後、猫の写真を入力し、機械にオブジェクトを識別して出力を予測させます。さて、機械はよく訓練されているので、高さ、形、色、目、耳、尻尾など、物体のあらゆる特徴をチェックし、それが猫であることを発見します。ということで、猫カテゴリーに入れさせていただきます。これは、機械が教師あり学習でオブジェクトを識別する方法のプロセスです。

教師あり学習手法の主な目的は、入力変数 (x) を出力変数 (y) にマッピングすることです。 教師あり学習の実際の応用例としては、次のようなものがあります。 リスク評価、不正行為検出、スパムフィルタリング、

教師あり機械学習のカテゴリ

教師あり機械学習は、次の 2 種類の問題に分類できます。

    分類 回帰

a) 分類

分類アルゴリズムは、出力変数がカテゴリカルである分類問題を解決するために使用されます。 YesかNo、男性か女性か、赤か青など 。分類アルゴリズムは、データセット内に存在するカテゴリを予測します。分類アルゴリズムの実際の例をいくつか示します。 スパム検出、メールフィルタリングなど

一般的な分類アルゴリズムのいくつかを以下に示します。

    ランダムフォレストアルゴリズム デシジョン ツリー アルゴリズム ロジスティック回帰アルゴリズム サポートベクターマシンアルゴリズム

b) 回帰

回帰アルゴリズムは、入力変数と出力変数の間に線形関係がある回帰問題を解決するために使用されます。これらは、市場動向や天気予報などの連続的な出力変数を予測するために使用されます。

一般的な回帰アルゴリズムのいくつかを以下に示します。

    単純な線形回帰アルゴリズム 多変量回帰アルゴリズム デシジョン ツリー アルゴリズム なげなわ回帰

教師あり学習の長所と短所

利点:

  • 教師あり学習はラベル付きデータセットを使用するため、オブジェクトのクラスについて正確に把握できます。
  • これらのアルゴリズムは、以前の経験に基づいて出力を予測するのに役立ちます。

短所:

  • これらのアルゴリズムは複雑なタスクを解決できません。
  • テスト データがトレーニング データと異なる場合、誤った出力が予測される可能性があります。
  • アルゴリズムをトレーニングするには多くの計算時間が必要です。

教師あり学習の応用

教師あり学習の一般的なアプリケーションのいくつかを以下に示します。

    画像の分割:
    教師あり学習アルゴリズムは画像のセグメンテーションに使用されます。このプロセスでは、事前に定義されたラベルを使用して、さまざまな画像データに対して画像分類が実行されます。医学的診断:
    教師ありアルゴリズムは、医療分野でも診断目的で使用されます。これは、医療画像と病状のラベルが付いた過去のラベル付きデータを使用して行われます。このようなプロセスにより、機械は新しい患者の病気を識別することができます。不正行為の検出 -教師あり学習分類アルゴリズムは、詐欺取引や詐欺顧客などを特定するために使用されます。これは、履歴データを使用して、詐欺につながる可能性のあるパターンを特定することによって行われます。スパム検出 -スパムの検出とフィルタリングでは、分類アルゴリズムが使用されます。これらのアルゴリズムは、電子メールをスパムまたはスパムではないものとして分類します。スパムメールはスパムフォルダーに送信されます。音声認識 -教師あり学習アルゴリズムは音声認識でも使用されます。このアルゴリズムは音声データでトレーニングされており、音声で起動するパスワードや音声コマンドなど、さまざまな識別を同じものを使用して行うことができます。

2.教師なし機械学習

教師なし学習 g は教師あり学習手法とは異なります。その名前が示すように、監視は必要ありません。つまり、教師なし機械学習では、ラベルなしのデータセットを使用してマシンがトレーニングされ、教師なしで出力を予測します。

教師なし学習では、分類もラベルも付けられていないデータを使用してモデルがトレーニングされ、モデルは監視なしでそのデータに基づいて動作します。

教師なし学習アルゴリズムの主な目的は、類似性、パターン、相違点に従って未分類のデータセットをグループ化またはカテゴリー化することです。 マシンは、入力データセットから隠れたパターンを見つけるように指示されます。

これをさらに理解するために例を挙げてみましょう。果物の画像が入ったバスケットがあり、それを機械学習モデルに入力するとします。画像はモデルにとってまったく未知のものであり、機械の仕事はオブジェクトのパターンとカテゴリを見つけることです。

したがって、マシンは色の違い、形状の違いなどのパターンと違いを検出し、テスト データセットでテストされるときに出力を予測します。

教師なし機械学習のカテゴリ

教師なし学習はさらに次の 2 つのタイプに分類できます。

    クラスタリング 協会

1) クラスタリング

クラスタリング手法は、データから固有のグループを見つけたい場合に使用されます。これは、最も類似性の高いオブジェクトが 1 つのグループに残り、他のグループのオブジェクトとの類似性が少ない、またはまったくないように、オブジェクトをクラスターにグループ化する方法です。クラスタリング アルゴリズムの例としては、顧客を購買行動に基づいてグループ化することが挙げられます。

一般的なクラスタリング アルゴリズムの一部を以下に示します。

    K-Means クラスタリング アルゴリズム 平均値シフトアルゴリズム DBSCAN アルゴリズム 主成分分析 独立成分分析

2) 協会

相関ルール学習は教師なし学習手法であり、大規模なデータセット内の変数間の興味深い関係を見つけます。この学習アルゴリズムの主な目的は、あるデータ項目の別のデータ項目への依存関係を見つけ、それに応じてそれらの変数をマッピングして、最大の利益を生み出すことができるようにすることです。このアルゴリズムは主に次の用途に適用されます。 マーケットバスケット分析、Web利用マイニング、継続的生産 、など。

アソシエーション ルール学習の一般的なアルゴリズムには、次のようなものがあります。 アプリオリ アルゴリズム、エクラ、FP 成長アルゴリズム。

教師なし学習アルゴリズムの長所と短所

利点:

  • これらのアルゴリズムはラベルのないデータセットで動作するため、教師ありアルゴリズムと比較して複雑なタスクに使用できます。
  • 教師なしアルゴリズムは、ラベル付きデータセットと比較してラベルなしデータセットの取得が簡単であるため、さまざまなタスクに適しています。

短所:

  • 教師なしアルゴリズムの出力は、データセットにラベルが付けられておらず、アルゴリズムが事前に正確な出力でトレーニングされていないため、精度が低くなる可能性があります。
  • 教師なし学習の操作は、出力とマッピングされないラベルのないデータセットを操作するため、より困難になります。

教師なし学習の応用

    ネットワーク分析:教師なし学習は、学術論文のテキストデータの文書ネットワーク分析において、盗作や著作権を特定するために使用されます。レコメンデーションシステム:レコメンデーション システムでは、さまざまな Web アプリケーションや電子商取引 Web サイト用のレコメンデーション アプリケーションを構築するために、教師なし学習手法が広く使用されています。異常検出:異常検出は教師なし学習の一般的なアプリケーションであり、データセット内の異常なデータ ポイントを識別できます。不正取引を発見するために使用されます。特異値分解:特異値分解 (SVD) は、データベースから特定の情報を抽出するために使用されます。たとえば、特定の場所にいる各ユーザーの情報を抽出します。

3. 半教師あり学習

半教師あり学習は、教師あり機械学習と教師なし機械学習の間にある機械学習アルゴリズムの一種です。 。これは、教師あり (ラベル付きトレーニング データあり) アルゴリズムと教師なし学習 (ラベル付きトレーニング データなし) アルゴリズムの間の中間基盤を表し、トレーニング期間中にラベル付きデータセットとラベルなしデータセットの組み合わせを使用します。

半教師あり学習は教師あり学習と教師なし学習の中間であり、いくつかのラベルで構成されるデータを操作しますが、ほとんどはラベルのないデータで構成されます。ラベルにはコストがかかりますが、企業目的の場合はラベルが少ない場合があります。ラベルの有無に基づいているため、教師あり学習や教師なし学習とはまったく異なります。

教師あり学習アルゴリズムと教師なし学習アルゴリズムの欠点を克服するために、半教師あり学習の概念が導入されています。 。半教師あり学習の主な目的は、教師あり学習のようにラベル付きデータのみを使用するのではなく、利用可能なすべてのデータを効果的に使用することです。最初に、同様のデータが教師なし学習アルゴリズムとともにクラスター化され、さらに、ラベルなしデータをラベル付きデータにラベル付けするのに役立ちます。ラベル付きデータは、ラベルなしデータに比べて取得に比較的高価であるためです。

例を挙げてこれらのアルゴリズムを想像してみましょう。教師あり学習とは、生徒が自宅や大学で講師の監督下に置かれる学習です。さらに、その生徒が講師の助けを借りずに同じ概念を自己分析している場合、それは教師なし学習に該当します。半教師あり学習では、学生は大学の講師の指導の下、同じ概念を分析した後、自分自身を修正する必要があります。

半教師あり学習の長所と短所

利点:

  • シンプルでアルゴリズムが理解しやすいです。
  • 非常に効率的です。
  • これは、教師あり学習アルゴリズムと教師なし学習アルゴリズムの欠点を解決するために使用されます。

短所:

  • 反復の結果が安定しない可能性があります。
  • これらのアルゴリズムをネットワーク レベルのデータに適用することはできません。
  • 精度が低いです。

4. 強化学習

強化学習はフィードバックベースのプロセスで機能し、AI エージェント (ソフトウェア コンポーネント) がヒット アンド トレイルによって周囲を自動的に探索し、行動を起こし、経験から学習し、パフォーマンスを向上させます。 エージェントは良い行動ごとに報酬を受け取り、悪い行動ごとに罰を受けます。したがって、強化学習エージェントの目標は、報酬を最大化することです。

強化学習では、教師あり学習のようなラベル付きデータはなく、エージェントは自分の経験からのみ学習します。

強化学習のプロセスは人間と似ています。たとえば、子供は日常生活の中でさまざまな経験を通してさまざまなことを学びます。強化学習の例は、ゲームをプレイすることです。ゲームは環境であり、各ステップでのエージェントの動きが状態を定義し、エージェントの目標は高スコアを取得することです。エージェントは罰と報酬に関するフィードバックを受け取ります。

強化学習はその仕組みにより、次のようなさまざまな分野で採用されています。 ゲーム理論、オペレーションリサーチ、情報理論、マルチエージェントシステム。

強化学習の問題は次のように形式化できます。 マルコフ決定プロセス(MDP)。 MDP では、エージェントは常に環境と対話し、アクションを実行します。アクションのたびに、環境が応答して新しい状態を生成します。

強化学習のカテゴリ

強化学習は主に 2 種類の手法/アルゴリズムに分類されます。

    ポジティブ強化学習:正の強化学習では、何かを追加することで必要な動作が再び発生する傾向が高まることを指定します。これはエージェントの行動の強さを強化し、ポジティブな影響を与えます。負の強化学習:負の強化学習は、正の RL とは正反対に機能します。ネガティブな状態を回避することで、特定の行動が再び発生する傾向が高まります。

強化学習の実世界の使用例

    ビデオゲーム:
    RL アルゴリズムは、ゲーム アプリケーションで非常に人気があります。超人的なパフォーマンスを得るために使用されます。 RL アルゴリズムを使用する人気のあるゲームには、次のようなものがあります。 AlphaGO そして AlphaGO ゼロ 。資源管理:
    「深層強化学習によるリソース管理」の論文では、コンピューターで RL を使用して、ジョブの平均速度の低下を最小限に抑えるために、さまざまなジョブを待機するリソースを自動的に学習およびスケジュールする方法が示されています。ロボット工学:
    RL はロボット工学アプリケーションで広く使用されています。ロボットは産業および製造分野で使用されており、これらのロボットは強化学習によってさらに強力になります。 AI と機械学習テクノロジーを使用してインテリジェント ロボットを構築するというビジョンを持っているさまざまな業界があります。テキストマイニング
    NLP の優れたアプリケーションの 1 つであるテキストマイニングは、Salesforce 社によって強化学習の助けを借りて実装されています。

強化学習の長所と短所

利点

  • 一般的な手法では解決することが難しい現実世界の複雑な問題の解決に役立ちます。
  • RL の学習モデルは人間の学習に似ています。したがって、最も正確な結果を見つけることができます。
  • 長期的な結果を達成するのに役立ちます。

不利益

  • RL アルゴリズムは単純な問題には適していません。
  • RL アルゴリズムには膨大なデータと計算が必要です。
  • 強化学習が多すぎると、状態が過負荷になり、結果が弱くなる可能性があります。

次元の呪いにより、実際の物理システムの強化学習が制限されます。

意味不明