웜퍼스 월드:
Wumpus 세계는 지식 기반 에이전트의 가치를 설명하고 지식 표현을 나타내는 간단한 세계 예입니다. 비디오 게임에서 영감을 얻었습니다 웜퍼스 사냥 1973년 그레고리 욥(Gregory Yob)에 의해.
Wumpus 세계는 4/4개의 방이 통로로 연결된 동굴입니다. 그래서 총 16개의 방이 서로 연결되어 있습니다. 우리에게는 이 세상에서 앞으로 나아갈 지식 기반 에이전트가 있습니다. 동굴에는 방에 들어오는 사람을 잡아먹는 Wumpus라는 짐승이 있는 방이 있습니다. Wumpus는 에이전트가 쏠 수 있지만 에이전트에는 화살이 하나 있습니다. Wumpus 세계에는 바닥이 없는 구덩이 방이 몇 개 있으며, 에이전트가 구덩이에 빠지면 영원히 거기에 갇히게 됩니다. 이 동굴의 흥미로운 점은 한 방에서 엄청난 양의 금을 발견할 가능성이 있다는 것입니다. 따라서 에이전트의 목표는 구덩이에 빠지거나 Wumpus에게 잡아먹히지 않고 금을 찾아 동굴을 빠져나가는 것입니다. 에이전트는 골드를 가지고 나오면 보상을 받고, 웜퍼스에게 먹히거나 구덩이에 빠지면 페널티를 받습니다.
참고: 여기서 Wumpus는 정적이며 이동할 수 없습니다.
다음은 Wumpus 세계를 표현하기 위한 샘플 다이어그램입니다. 월드의 (1, 1) 평방 위치에 Pits가 있는 일부 방, Wumpus가 있는 방 1개 및 에이전트 1개가 표시됩니다.
라텍스의 부분 차별화
에이전트가 동굴을 탐색하는 데 도움이 될 수 있는 몇 가지 구성 요소도 있습니다. 이러한 구성 요소는 다음과 같이 제공됩니다.
- Wumpus 방에 인접한 방은 냄새가 나기 때문에 약간의 악취가 날 것입니다.
- PIT에 인접한 방은 바람이 불기 때문에 에이전트가 PIT에 가까이 다가가면 바람을 감지하게 됩니다.
- 방에 금이 있을 경우에만 방에 반짝임이 있을 것입니다.
- Wumpus는 에이전트가 그것을 바라보고 있으면 죽을 수 있으며, Wumpus는 동굴 어디에서나 들을 수 있는 끔찍한 비명을 지를 것입니다.
Wumpus 세계에 대한 PEAS 설명:
Wumpus 세계를 설명하기 위해 우리는 아래와 같이 PEAS 설명을 제공했습니다.
성능 측정:
- 요원이 금을 가지고 동굴에서 나오면 +1000 보상 포인트.
- Wumpus에게 먹히거나 구덩이에 빠지면 -1000 포인트 페널티가 발생합니다.
- 각 동작에는 -1, 화살표 사용에는 -10입니다.
- 요원 중 한 명이 죽거나 동굴에서 나오면 게임이 종료됩니다.
환경:
- 4*4 그리드의 방입니다.
- 에이전트는 처음에 방 광장 [1, 1]에 있으며 오른쪽을 향하고 있습니다.
- Wumpus와 금의 위치는 첫 번째 사각형 [1,1]을 제외하고 무작위로 선택됩니다.
- 동굴의 각 사각형은 첫 번째 사각형을 제외하고 확률 0.2의 구덩이가 될 수 있습니다.
액추에이터:
- 좌회전,
- 우회전
- 앞으로 움직이다
- 붙잡다
- 풀어 주다
- 사격.
센서:
- 에이전트는 다음을 인식합니다. 고약한 냄새 그가 Wumpus 옆 방에 있다면. (대각선으로는 안됨)
- 상담원이 인식할 것입니다. 미풍 그가 구덩이 바로 옆 방에 있다면.
- 에이전트는 다음을 인식합니다. 반짝임 금이 있는 방에서.
- 에이전트는 다음을 인식합니다. 충돌 그가 벽에 들어가면.
- Wumpus가 총에 맞으면 끔찍한 소리를 냅니다. 비명 동굴 안 어디에서나 감지될 수 있습니다.
- 이러한 인식은 5가지 요소 목록으로 표현될 수 있으며, 여기에는 각 센서에 대해 서로 다른 지표가 있습니다.
- 예를 들어 에이전트가 악취, 미풍을 감지하지만 반짝이거나 부딪히거나 비명을 지르지 않는 경우 다음과 같이 표현할 수 있습니다.
[악취, 미풍, 없음, 없음, 없음] .
Wumpus 세계 속성:
Wumpus 세계 탐험하기:
이제 Wumpus 세계를 탐색하고 논리적 추론을 적용하여 에이전트가 목표를 찾는 방법을 결정하겠습니다.
상담원의 첫 번째 단계:
처음에 에이전트는 첫 번째 방이나 사각형[1,1]에 있으며 이 방이 에이전트에게 안전하다는 것을 이미 알고 있으므로 아래 다이어그램(a)에서 방이 안전하다는 것을 나타내기 위해 기호를 추가합니다. 좋아요. 기호 A는 에이전트를 나타내고 기호 B는 미풍, G는 반짝이 또는 금, V는 방문한 방, P는 구덩이, W는 Wumpus를 나타냅니다.
방 [1,1]에서 에이전트는 미풍이나 악취를 느끼지 않으며 이는 인접한 사각형도 괜찮다는 것을 의미합니다.
상담원의 두 번째 단계:
자바 부울 문자열
이제 에이전트는 앞으로 이동해야 하므로 [1, 2] 또는 [2,1]로 이동합니다. 에이전트가 [2, 1] 방으로 이동하고 이 방에서 에이전트가 약간의 바람을 감지한다고 가정해 보겠습니다. 이는 Pit이 이 방 주위에 있음을 의미합니다. 피트는 [3, 1] 또는 [2,2]에 있을 수 있으므로 기호 P?를 추가하겠습니다. 말하자면, 여기가 피트룸인가요?
이제 에이전트는 멈추고 생각하며 해로운 움직임을 취하지 않을 것입니다. 에이전트는 [1, 1] 방으로 돌아갑니다. 방 [1,1], [2,1]은 에이전트가 방문하므로 V 기호를 사용하여 방문한 사각형을 나타냅니다.
상담원의 세 번째 단계:
세 번째 단계에서는 이제 에이전트가 방 [1,2]로 이동합니다. 이는 괜찮습니다. 방 [1,2]에서 요원은 악취를 감지하는데, 이는 근처에 Wumpus가 있음을 의미합니다. 그러나 Wumpus는 게임 규칙에 따라 [1,1] 방에 있을 수 없으며 [2,2] 방에도 있을 수 없습니다(에이전트는 [2,1]에 있을 때 어떤 악취도 감지하지 못했습니다). 따라서 에이전트는 Wumpus가 방 [1,3]에 있고 현재 상태에서는 바람이 불지 않는다고 추론합니다. 이는 [2,2]에 구덩이도 Wumpus도 없다는 의미입니다. 따라서 안전하므로 OK로 표시하고 에이전트는 [2,2]에서 더 멀리 이동합니다.
웹드라이버
상담원의 네 번째 단계:
방 [2,2]에는 악취도 없고 바람도 없으므로 에이전트가 [2,3]으로 이동하기로 결정했다고 가정해 보겠습니다. 방 [2,3]에서 에이전트는 반짝이를 감지하므로 금을 잡고 동굴 밖으로 올라와야 합니다.