logo

教師あり機械学習

教師あり学習は、適切に「ラベル付けされた」トレーニング データを使用してマシンをトレーニングし、そのデータに基づいてマシンが出力を予測するタイプの機械学習です。ラベル付きデータは、一部の入力データがすでに正しい出力でタグ付けされていることを意味します。

教師あり学習では、マシンに提供されたトレーニング データが、出力を正しく予測するようにマシンに教えるスーパーバイザーとして機能します。生徒が教師の監督の下で学習するのと同じ概念が適用されます。

教師あり学習は、入力データと正しい出力データを機械学習モデルに提供するプロセスです。教師あり学習アルゴリズムの目的は、 入力変数(x)を出力変数(y)にマッピングするマッピング関数を見つけます。

autocad 2019 英語版をダウンロードします。

現実の世界では、教師あり学習は次の目的で使用できます。 リスク評価、画像分類、不正行為検出、スパムフィルタリング 、など。

教師あり学習はどのように機能するのでしょうか?

教師あり学習では、モデルはラベル付きデータセットを使用してトレーニングされ、モデルは各タイプのデータについて学習します。トレーニング プロセスが完了すると、テスト データ (トレーニング セットのサブセット) に基づいてモデルがテストされ、出力が予測されます。

教師あり学習の仕組みは、以下の例と図で簡単に理解できます。

教師あり機械学習

正方形、長方形、三角形、多角形などのさまざまな種類の形状のデータセットがあるとします。最初のステップは、形状ごとにモデルをトレーニングする必要があることです。

  • 指定された形状に 4 つの辺があり、すべての辺が等しい場合、その形状は としてラベル付けされます。 四角
  • 指定された形状に 3 つの側面がある場合、その形状は としてラベル付けされます。 三角形
  • 指定された形状に 6 つの等しい辺がある場合、次のようにラベル付けされます。 六角形

さて、トレーニング後、テスト セットを使用してモデルをテストします。モデルのタスクは形状を識別することです。

このマシンはあらゆるタイプの形状についてすでにトレーニングされており、新しい形状を見つけると、その形状を多数の側面に基づいて分類し、出力を予測します。

教師あり学習に含まれる手順:

  • まずトレーニング データセットの種類を決定します
  • ラベル付きトレーニング データを収集/収集します。
  • トレーニング データセットをトレーニングに分割する データセット、テスト データセット、および検証データセット
  • トレーニング データセットの入力特徴を決定します。これには、モデルが出力を正確に予測できるように十分な知識が必要です。
  • サポート ベクター マシン、デシジョン ツリーなど、モデルに適したアルゴリズムを決定します。
  • トレーニング データセットに対してアルゴリズムを実行します。場合によっては、トレーニング データセットのサブセットである検証セットが制御パラメーターとして必要になることがあります。
  • テスト セットを提供してモデルの精度を評価します。モデルが正しい出力を予測する場合、それはモデルが正確であることを意味します。

教師あり機械学習アルゴリズムの種類:

教師あり学習はさらに 2 つのタイプの問題に分類できます。

文字列から整数Javaに変換します
教師あり機械学習

1. 回帰

回帰アルゴリズムは、入力変数と出力変数の間に関係がある場合に使用されます。これは、天気予報や市場動向などの連続変数の予測に使用されます。以下は、教師あり学習の対象となる一般的な回帰アルゴリズムの一部です。

  • 線形回帰
  • 回帰木
  • 非線形回帰
  • ベイジアン線形回帰
  • 多項式回帰

2. 分類

VLCでYouTubeビデオをダウンロード

分類アルゴリズムは、出力変数がカテゴリカルである場合に使用されます。つまり、Yes-No、男性-女性、True-false などの 2 つのクラスが存在します。

スパムフィルタリング、

  • ランダムフォレスト
  • ディシジョン ツリー
  • ロジスティック回帰
  • サポートベクターマシン

注: これらのアルゴリズムについては後の章で詳しく説明します。

教師あり学習の利点:

  • 教師あり学習の助けを借りて、モデルは以前の経験に基づいて出力を予測できます。
  • 教師あり学習では、オブジェクトのクラスについて正確に把握できます。
  • 教師あり学習モデルは、次のような現実世界のさまざまな問題を解決するのに役立ちます。 不正行為検出、スパムフィルタリング 、など。

教師あり学習の欠点:

  • 教師あり学習モデルは、複雑なタスクの処理には適していません。
  • テスト データがトレーニング データセットと異なる場合、教師あり学習では正しい出力を予測できません。
  • トレーニングには多くの計算時間が必要でした。
  • 教師あり学習では、オブジェクトのクラスに関する十分な知識が必要です。