機械学習は AI のサブセットであり、機械がデータから自動的に学習し、過去の経験からパフォーマンスを向上させ、予測を行うことができます。 。機械学習には、膨大な量のデータを処理する一連のアルゴリズムが含まれています。これらのアルゴリズムにデータが供給されてトレーニングされ、トレーニングに基づいてモデルが構築され、特定のタスクが実行されます。
これらの ML アルゴリズムは、回帰、分類、予測、クラスタリング、関連付けなどのさまざまなビジネス上の問題を解決するのに役立ちます。
機械学習は学習方法や方法に基づいて、主に次の 4 つのタイプに分類されます。
- 教師あり機械学習
- 教師なし機械学習
- 半教師あり機械学習
- 強化学習
このトピックでは、機械学習の種類とそれぞれのアルゴリズムについて詳しく説明します。
1.教師あり機械学習
その名の通り、 教師あり機械学習 監修に基づいています。つまり、教師あり学習手法では、「ラベル付き」データセットを使用してマシンをトレーニングし、そのトレーニングに基づいてマシンが出力を予測します。ここで、ラベル付きデータは、入力の一部がすでに出力にマップされていることを指定します。さらに貴重なことに、次のように言えます。まず、入力と対応する出力を使用してマシンをトレーニングし、次にテスト データセットを使用して出力を予測するようにマシンに依頼します。
例を挙げて教師あり学習を理解しましょう。猫と犬の画像の入力データセットがあるとします。したがって、最初に、次のような画像を理解するためのトレーニングをマシンに提供します。 猫と犬の尻尾の形と大きさ、目の形、色、身長(犬の方が背が高く、猫の方が小さい)など。 トレーニングの完了後、猫の写真を入力し、機械にオブジェクトを識別して出力を予測させます。さて、機械はよく訓練されているので、高さ、形、色、目、耳、尻尾など、物体のあらゆる特徴をチェックし、それが猫であることを発見します。ということで、猫カテゴリーに入れさせていただきます。これは、機械が教師あり学習でオブジェクトを識別する方法のプロセスです。
教師あり学習手法の主な目的は、入力変数 (x) を出力変数 (y) にマッピングすることです。 教師あり学習の実際の応用例としては、次のようなものがあります。 リスク評価、不正行為検出、スパムフィルタリング、 等
教師あり機械学習のカテゴリ
教師あり機械学習は、次の 2 種類の問題に分類できます。
a) 分類
分類アルゴリズムは、出力変数がカテゴリカルである分類問題を解決するために使用されます。 YesかNo、男性か女性か、赤か青など 。分類アルゴリズムは、データセット内に存在するカテゴリを予測します。分類アルゴリズムの実際の例をいくつか示します。 スパム検出、メールフィルタリングなど
一般的な分類アルゴリズムのいくつかを以下に示します。
b) 回帰
回帰アルゴリズムは、入力変数と出力変数の間に線形関係がある回帰問題を解決するために使用されます。これらは、市場動向や天気予報などの連続的な出力変数を予測するために使用されます。
一般的な回帰アルゴリズムのいくつかを以下に示します。
教師あり学習の長所と短所
利点:
- 教師あり学習はラベル付きデータセットを使用するため、オブジェクトのクラスについて正確に把握できます。
- これらのアルゴリズムは、以前の経験に基づいて出力を予測するのに役立ちます。
短所:
- これらのアルゴリズムは複雑なタスクを解決できません。
- テスト データがトレーニング データと異なる場合、誤った出力が予測される可能性があります。
- アルゴリズムをトレーニングするには多くの計算時間が必要です。
教師あり学習の応用
教師あり学習の一般的なアプリケーションのいくつかを以下に示します。
教師あり学習アルゴリズムは画像のセグメンテーションに使用されます。このプロセスでは、事前に定義されたラベルを使用して、さまざまな画像データに対して画像分類が実行されます。
教師ありアルゴリズムは、医療分野でも診断目的で使用されます。これは、医療画像と病状のラベルが付いた過去のラベル付きデータを使用して行われます。このようなプロセスにより、機械は新しい患者の病気を識別することができます。
2.教師なし機械学習
教師なし学習 g は教師あり学習手法とは異なります。その名前が示すように、監視は必要ありません。つまり、教師なし機械学習では、ラベルなしのデータセットを使用してマシンがトレーニングされ、教師なしで出力を予測します。
教師なし学習では、分類もラベルも付けられていないデータを使用してモデルがトレーニングされ、モデルは監視なしでそのデータに基づいて動作します。
教師なし学習アルゴリズムの主な目的は、類似性、パターン、相違点に従って未分類のデータセットをグループ化またはカテゴリー化することです。 マシンは、入力データセットから隠れたパターンを見つけるように指示されます。
これをさらに理解するために例を挙げてみましょう。果物の画像が入ったバスケットがあり、それを機械学習モデルに入力するとします。画像はモデルにとってまったく未知のものであり、機械の仕事はオブジェクトのパターンとカテゴリを見つけることです。
したがって、マシンは色の違い、形状の違いなどのパターンと違いを検出し、テスト データセットでテストされるときに出力を予測します。
教師なし機械学習のカテゴリ
教師なし学習はさらに次の 2 つのタイプに分類できます。
1) クラスタリング
クラスタリング手法は、データから固有のグループを見つけたい場合に使用されます。これは、最も類似性の高いオブジェクトが 1 つのグループに残り、他のグループのオブジェクトとの類似性が少ない、またはまったくないように、オブジェクトをクラスターにグループ化する方法です。クラスタリング アルゴリズムの例としては、顧客を購買行動に基づいてグループ化することが挙げられます。
一般的なクラスタリング アルゴリズムの一部を以下に示します。
2) 協会
相関ルール学習は教師なし学習手法であり、大規模なデータセット内の変数間の興味深い関係を見つけます。この学習アルゴリズムの主な目的は、あるデータ項目の別のデータ項目への依存関係を見つけ、それに応じてそれらの変数をマッピングして、最大の利益を生み出すことができるようにすることです。このアルゴリズムは主に次の用途に適用されます。 マーケットバスケット分析、Web利用マイニング、継続的生産 、など。
アソシエーション ルール学習の一般的なアルゴリズムには、次のようなものがあります。 アプリオリ アルゴリズム、エクラ、FP 成長アルゴリズム。
教師なし学習アルゴリズムの長所と短所
利点:
- これらのアルゴリズムはラベルのないデータセットで動作するため、教師ありアルゴリズムと比較して複雑なタスクに使用できます。
- 教師なしアルゴリズムは、ラベル付きデータセットと比較してラベルなしデータセットの取得が簡単であるため、さまざまなタスクに適しています。
短所:
- 教師なしアルゴリズムの出力は、データセットにラベルが付けられておらず、アルゴリズムが事前に正確な出力でトレーニングされていないため、精度が低くなる可能性があります。
- 教師なし学習の操作は、出力とマッピングされないラベルのないデータセットを操作するため、より困難になります。
教師なし学習の応用
3. 半教師あり学習
半教師あり学習は、教師あり機械学習と教師なし機械学習の間にある機械学習アルゴリズムの一種です。 。これは、教師あり (ラベル付きトレーニング データあり) アルゴリズムと教師なし学習 (ラベル付きトレーニング データなし) アルゴリズムの間の中間基盤を表し、トレーニング期間中にラベル付きデータセットとラベルなしデータセットの組み合わせを使用します。
あ 半教師あり学習は教師あり学習と教師なし学習の中間であり、いくつかのラベルで構成されるデータを操作しますが、ほとんどはラベルのないデータで構成されます。ラベルにはコストがかかりますが、企業目的の場合はラベルが少ない場合があります。ラベルの有無に基づいているため、教師あり学習や教師なし学習とはまったく異なります。
教師あり学習アルゴリズムと教師なし学習アルゴリズムの欠点を克服するために、半教師あり学習の概念が導入されています。 。半教師あり学習の主な目的は、教師あり学習のようにラベル付きデータのみを使用するのではなく、利用可能なすべてのデータを効果的に使用することです。最初に、同様のデータが教師なし学習アルゴリズムとともにクラスター化され、さらに、ラベルなしデータをラベル付きデータにラベル付けするのに役立ちます。ラベル付きデータは、ラベルなしデータに比べて取得に比較的高価であるためです。
例を挙げてこれらのアルゴリズムを想像してみましょう。教師あり学習とは、生徒が自宅や大学で講師の監督下に置かれる学習です。さらに、その生徒が講師の助けを借りずに同じ概念を自己分析している場合、それは教師なし学習に該当します。半教師あり学習では、学生は大学の講師の指導の下、同じ概念を分析した後、自分自身を修正する必要があります。
半教師あり学習の長所と短所
利点:
- シンプルでアルゴリズムが理解しやすいです。
- 非常に効率的です。
- これは、教師あり学習アルゴリズムと教師なし学習アルゴリズムの欠点を解決するために使用されます。
短所:
- 反復の結果が安定しない可能性があります。
- これらのアルゴリズムをネットワーク レベルのデータに適用することはできません。
- 精度が低いです。
4. 強化学習
強化学習はフィードバックベースのプロセスで機能し、AI エージェント (ソフトウェア コンポーネント) がヒット アンド トレイルによって周囲を自動的に探索し、行動を起こし、経験から学習し、パフォーマンスを向上させます。 エージェントは良い行動ごとに報酬を受け取り、悪い行動ごとに罰を受けます。したがって、強化学習エージェントの目標は、報酬を最大化することです。
強化学習では、教師あり学習のようなラベル付きデータはなく、エージェントは自分の経験からのみ学習します。
強化学習のプロセスは人間と似ています。たとえば、子供は日常生活の中でさまざまな経験を通してさまざまなことを学びます。強化学習の例は、ゲームをプレイすることです。ゲームは環境であり、各ステップでのエージェントの動きが状態を定義し、エージェントの目標は高スコアを取得することです。エージェントは罰と報酬に関するフィードバックを受け取ります。
強化学習はその仕組みにより、次のようなさまざまな分野で採用されています。 ゲーム理論、オペレーションリサーチ、情報理論、マルチエージェントシステム。
強化学習の問題は次のように形式化できます。 マルコフ決定プロセス(MDP)。 MDP では、エージェントは常に環境と対話し、アクションを実行します。アクションのたびに、環境が応答して新しい状態を生成します。
強化学習のカテゴリ
強化学習は主に 2 種類の手法/アルゴリズムに分類されます。
強化学習の実世界の使用例
RL アルゴリズムは、ゲーム アプリケーションで非常に人気があります。超人的なパフォーマンスを得るために使用されます。 RL アルゴリズムを使用する人気のあるゲームには、次のようなものがあります。 AlphaGO そして AlphaGO ゼロ 。
「深層強化学習によるリソース管理」の論文では、コンピューターで RL を使用して、ジョブの平均速度の低下を最小限に抑えるために、さまざまなジョブを待機するリソースを自動的に学習およびスケジュールする方法が示されています。
RL はロボット工学アプリケーションで広く使用されています。ロボットは産業および製造分野で使用されており、これらのロボットは強化学習によってさらに強力になります。 AI と機械学習テクノロジーを使用してインテリジェント ロボットを構築するというビジョンを持っているさまざまな業界があります。
NLP の優れたアプリケーションの 1 つであるテキストマイニングは、Salesforce 社によって強化学習の助けを借りて実装されています。
強化学習の長所と短所
利点
- 一般的な手法では解決することが難しい現実世界の複雑な問題の解決に役立ちます。
- RL の学習モデルは人間の学習に似ています。したがって、最も正確な結果を見つけることができます。
- 長期的な結果を達成するのに役立ちます。
不利益
- RL アルゴリズムは単純な問題には適していません。
- RL アルゴリズムには膨大なデータと計算が必要です。
- 強化学習が多すぎると、状態が過負荷になり、結果が弱くなる可能性があります。
次元の呪いにより、実際の物理システムの強化学習が制限されます。
意味不明