ワンパスワールド:
Wumpus ワールドは、知識ベースのエージェントの価値を示し、知識の表現を表すための単純な世界の例です。ビデオゲームからインスピレーションを得たものでした ワンパスを狩る グレゴリー・ヨブ著、1973年。
SSH 完全形式
ワンパスワールドは4/4の部屋が通路でつながった洞窟です。つまり、合計16の部屋が互いにつながっています。私たちには、この世界で前進する知識ベースのエージェントがいます。洞窟にはワンパスと呼ばれる獣がいる部屋があり、部屋に入った者を食べます。ワンパスはエージェントによって撃たれることができますが、エージェントには白羽の矢が立っています。ワンパスの世界には底なしのピットの部屋がいくつかあり、エージェントがピットに落ちた場合、彼は永遠にそこから立ち往生することになります。この洞窟の面白いところは、ある部屋で金の山が見つかる可能性があることです。したがって、エージェントの目標は、金を見つけて、ピットに落ちたり、ワンパスに食べられたりすることなく、洞窟を登ることです。エージェントはゴールドを獲得すると報酬を受け取り、ワンパスに食べられたり、穴に落ちたりするとペナルティを受けます。
注: ここでは、Wumpus は静止しており、移動できません。
以下は、Wumpus の世界を表すサンプル図です。世界の (1, 1) 平方の場所にあるピットのいるいくつかの部屋、ワンパスのいる部屋 1 つ、およびエージェント 1 人が表示されています。
エージェントが洞窟を移動するのに役立つコンポーネントもいくつかあります。これらのコンポーネントは次のように与えられます。
- ワンパスの部屋の隣の部屋は臭いので、多少の臭いはあるだろう。
- PIT に隣接する部屋には風が吹いており、エージェントが PIT に近づくと風を感じます。
- 部屋にゴールドがある場合にのみ、部屋に輝きが生まれます。
- エージェントがウンパスに面している場合、ワンパスはエージェントによって殺される可能性があり、ワンパスは洞窟のどこにでも聞こえる恐ろしい叫び声を上げます。
Wumpus ワールドの PEAS 説明:
Wumpus の世界を説明するために、以下のように PEAS を説明しました。
パフォーマンスの測定:
- エージェントがゴールドを持って洞窟から出てきた場合、+1000 報酬ポイント。
- ワンパスに食べられたり、穴に落ちたりすると -1000 ポイントのペナルティ。
- アクションごとに -1、矢印を使用すると -10。
- どちらかのエージェントが死亡するか、洞窟から出てきた場合、ゲームは終了します。
環境:
- 4*4 グリッドの部屋。
- エージェントは最初、正方形の部屋 [1, 1] にいて、右を向いています。
- ウンパスとゴールドの位置は、最初のマス [1,1] を除いてランダムに選択されます。
- 洞窟の各マスは、最初のマスを除き、確率 0.2 で穴になる可能性があります。
アクチュエーター:
- 左折、
- 右折
- 前進する
- 掴む
- リリース
- シュート。
センサー:
- エージェントはそれを認識します 悪臭 彼がワンパスの隣の部屋にいる場合。 (斜めではありません)。
- エージェントは認識します 風 彼がピットのすぐ隣の部屋にいる場合。
- エージェントはそれを認識します キラキラ 黄金がある部屋で。
- エージェントはそれを認識します バンプ 彼が壁にぶつかった場合。
- ワンパスが撃たれると恐ろしい音を発します 悲鳴 それは洞窟のどこにいても確認できます。
- これらの知覚は 5 つの要素リストとして表すことができ、センサーごとに異なる指標が存在します。
- たとえば、エージェントが悪臭、そよ風を知覚するが、輝き、衝撃、叫び声を知覚しない場合、それは次のように表すことができます。
[悪臭、風、なし、なし、なし] 。
ワンパスワールドのプロパティ:
ワンパスの世界を探索する:
ここで、Wumpus の世界を探索し、論理的推論を適用してエージェントがどのように目標を見つけるかを決定します。
エージェントの最初のステップ:
最初、エージェントは最初の部屋または正方形 [1,1] にいます。この部屋がエージェントにとって安全であることはすでにわかっているため、下の図 (a) でその部屋が安全であることを表すために、シンボルを追加します。わかりました。記号 A はエージェント、記号 B はそよ風、G はグリッターまたはゴールド、V は訪問した部屋、P はピット、W はワンパスを表すために使用されます。
部屋 [1,1] では、エージェントは風も悪臭も感じません。これは、隣接するマス目も問題がないことを意味します。
エージェントの 2 番目のステップ:
ここでエージェントは前進する必要があるため、[1, 2] または [2,1] に移動します。エージェントが部屋 [2, 1] に移動したとします。この部屋でエージェントは風を感じます。これは、ピットがこの部屋の周りにいることを意味します。ピットは [3, 1] または [2,2] にある可能性があるため、記号 P? を追加します。と言うと、ここはピットルームですか?
これで、エージェントは立ち止まって考え、有害な動きをすることはなくなります。エージェントは [1, 1] ルームに戻ります。部屋 [1,1] と [2,1] はエージェントによって訪問されるため、訪問したマス目を表すために記号 V を使用します。
エージェントの 3 番目のステップ:
3 番目のステップでは、エージェントは部屋 [1,2] に移動しますが、これは問題ありません。部屋 [1,2] でエージェントは異臭を感じました。これは近くにウンパスがいるに違いありません。しかし、ゲームのルールにより、Wumpus は部屋 [1,1] にいることができず、[2,2] にもいることはできません (エージェントは [2,1] にいたとき、悪臭を検出しませんでした)。したがって、エージェントは、Wumpus が部屋 [1,3] にいて、現在の状態では風がない、つまり [2,2] ではピットも Wumpus も存在しないと推測します。したがって、安全であるため、OK とマークし、エージェントは [2,2] に進みます。
エージェントの 4 番目のステップ:
部屋 [2,2] では、悪臭も風も存在しないため、エージェントが [2,3] に移動することに決めたとします。部屋 [2,3] でエージェントは輝きを感知するので、金を掴んで洞窟から出る必要があります。