logo

人工知能における Wumpus の世界

ワンパスワールド:

Wumpus ワールドは、知識ベースのエージェントの価値を示し、知識の表現を表すための単純な世界の例です。ビデオゲームからインスピレーションを得たものでした ワンパスを狩る グレゴリー・ヨブ著、1973年。

SSH 完全形式

ワンパスワールドは4/4の部屋が通路でつながった洞窟です。つまり、合計16の部屋が互いにつながっています。私たちには、この世界で前進する知識ベースのエージェントがいます。洞窟にはワンパスと呼ばれる獣がいる部屋があり、部屋に入った者を食べます。ワンパスはエージェントによって撃たれることができますが、エージェントには白羽の矢が立っています。ワンパスの世界には底なしのピットの部屋がいくつかあり、エージェントがピットに落ちた場合、彼は永遠にそこから立ち往生することになります。この洞窟の面白いところは、ある部屋で金の山が見つかる可能性があることです。したがって、エージェントの目標は、金を見つけて、ピットに落ちたり、ワンパスに食べられたりすることなく、洞窟を登ることです。エージェントはゴールドを獲得すると報酬を受け取り、ワンパスに食べられたり、穴に落ちたりするとペナルティを受けます。

注: ここでは、Wumpus は静止しており、移動できません。

以下は、Wumpus の世界を表すサンプル図です。世界の (1, 1) 平方の場所にあるピットのいるいくつかの部屋、ワンパスのいる部屋 1 つ、およびエージェント 1 人が表示されています。

人工知能における Wumpus の世界

エージェントが洞窟を移動するのに役立つコンポーネントもいくつかあります。これらのコンポーネントは次のように与えられます。

  1. ワンパスの部屋の隣の部屋は臭いので、多少の臭いはあるだろう。
  2. PIT に隣接する部屋には風が吹いており、エージェントが PIT に近づくと風を感じます。
  3. 部屋にゴールドがある場合にのみ、部屋に輝きが生まれます。
  4. エージェントがウンパスに面している場合、ワンパスはエージェントによって殺される可能性があり、ワンパスは洞窟のどこにでも聞こえる恐ろしい叫び声を上げます。

Wumpus ワールドの PEAS 説明:

Wumpus の世界を説明するために、以下のように PEAS を説明しました。

パフォーマンスの測定:

  • エージェントがゴールドを持って洞窟から出てきた場合、+1000 報酬ポイント。
  • ワンパスに食べられたり、穴に落ちたりすると -1000 ポイントのペナルティ。
  • アクションごとに -1、矢印を使用すると -10。
  • どちらかのエージェントが死亡するか、洞窟から出てきた場合、ゲームは終了します。

環境:

  • 4*4 グリッドの部屋。
  • エージェントは最初、正方形の部屋 [1, 1] にいて、右を向いています。
  • ウンパスとゴールドの位置は、最初のマス [1,1] を除いてランダムに選択されます。
  • 洞窟の各マスは、最初のマスを除き、確率 0.2 で穴になる可能性があります。

アクチュエーター:

  • 左折、
  • 右折
  • 前進する
  • 掴む
  • リリース
  • シュート。

センサー:

  • エージェントはそれを認識します 悪臭 彼がワンパスの隣の部屋にいる場合。 (斜めではありません)。
  • エージェントは認識します 彼がピットのすぐ隣の部屋にいる場合。
  • エージェントはそれを認識します キラキラ 黄金がある部屋で。
  • エージェントはそれを認識します バンプ 彼が壁にぶつかった場合。
  • ワンパスが撃たれると恐ろしい音を発します 悲鳴 それは洞窟のどこにいても確認できます。
  • これらの知覚は 5 つの要素リストとして表すことができ、センサーごとに異なる指標が存在します。
  • たとえば、エージェントが悪臭、そよ風を知覚するが、輝き、衝撃、叫び声を知覚しない場合、それは次のように表すことができます。
    [悪臭、風、なし、なし、なし]

ワンパスワールドのプロパティ:

    部分的に観察可能:エージェントは隣接する部屋などの近い環境しか認識できないため、Wumpus の世界は部分的に観察可能です。決定論的:世界の結果と結末はすでにわかっているので、それは決定論的です。一連:順序が重要なので、連続しています。静的:ワンパスとピットは動いていないので、静止しています。離散:環境は離散的です。あるエージェント:エージェントが 1 つしかなく、Wumpus はエージェントとみなされないため、環境は単一エージェントです。

ワンパスの世界を探索する:

ここで、Wumpus の世界を探索し、論理的推論を適用してエージェントがどのように目標を見つけるかを決定します。

エージェントの最初のステップ:

最初、エージェントは最初の部屋または正方形 [1,1] にいます。この部屋がエージェントにとって安全であることはすでにわかっているため、下の図 (a) でその部屋が安全であることを表すために、シンボルを追加します。わかりました。記号 A はエージェント、記号 B はそよ風、G はグリッターまたはゴールド、V は訪問した部屋、P はピット、W はワンパスを表すために使用されます。

部屋 [1,1] では、エージェントは風も悪臭も感じません。これは、隣接するマス目も問題がないことを意味します。

人工知能における Wumpus の世界

エージェントの 2 番目のステップ:

ここでエージェントは前進する必要があるため、[1, 2] または [2,1] に移動します。エージェントが部屋 [2, 1] に移動したとします。この部屋でエージェントは風を感じます。これは、ピットがこの部屋の周りにいることを意味します。ピットは [3, 1] または [2,2] にある可能性があるため、記号 P? を追加します。と言うと、ここはピットルームですか?

これで、エージェントは立ち止まって考え、有害な動きをすることはなくなります。エージェントは [1, 1] ルームに戻ります。部屋 [1,1] と [2,1] はエージェントによって訪問されるため、訪問したマス目を表すために記号 V を使用します。

エージェントの 3 番目のステップ:

3 番目のステップでは、エージェントは部屋 [1,2] に移動しますが、これは問題ありません。部屋 [1,2] でエージェントは異臭を感じました。これは近くにウンパスがいるに違いありません。しかし、ゲームのルールにより、Wumpus は部屋 [1,1] にいることができず、[2,2] にもいることはできません (エージェントは [2,1] にいたとき、悪臭を検出しませんでした)。したがって、エージェントは、Wumpus が部屋 [1,3] にいて、現在の状態では風がない、つまり [2,2] ではピットも Wumpus も存在しないと推測します。したがって、安全であるため、OK とマークし、エージェントは [2,2] に進みます。

人工知能における Wumpus の世界

エージェントの 4 番目のステップ:

部屋 [2,2] では、悪臭も風も存在しないため、エージェントが [2,3] に移動することに決めたとします。部屋 [2,3] でエージェントは輝きを感知するので、金を掴んで洞窟から出る必要があります。