마르코프2 3. 강화학습을 위한 순차 결정 문제 소개 1. 순차 결정 문제(Sequential Decision Problem)순차 결정 문제는 시간의 흐름에 따라 순간순간 결정을 내려야 하는 문제를 말합니다. 이 문제 유형은 각각의 순간에 취하는 행동이 이후의 결과에 영향을 미치기 때문에, 매 순간 최적의 결정을 내려야 하는 상황에서 주로 나타납니다. 이러한 문제는 연속적으로 이어지지만, 각각의 결정 포인트가 분리되어 있어 수학적 모델링이 가능하며, 이를 통해 문제를 해결할 수 있습니다.순차 결정 문제는 일상생활에서 흔히 볼 수 있습니다. 예를 들어, 출근할 때 자동차를 운전하며 신호에 맞춰 속도와 경로를 조정하는 상황도 순차 결정 문제입니다. 운전 중에는 도로 상황, 교통 신호, 다른 차량의 움직임 등에 따라 순간적으로 결정을 내리게 되는데, 이러한 일련.. 2024. 11. 10. #1521 랜덤 소트(dynamic programming) 이번 문제는 꽤 재미있는 주제입니다. 인공지능 마르코프 체인을 이야기하다보면, 기대값을 계산하는 부분이 있습니다. 이 부분을 잘 활용하고, 그리고 잦은 중복 호출이 발생하니 동적 계획법도 이용해야 합니다. 문제는 아래와 같습니다. https://www.acmicpc.net/problem/1521 1521번: 랜덤 소트 첫째 줄에 순열의 크기 N이 주어진다. 둘째 줄에 순열에 들어있는 수 N개가 주어진다. 이 수는 모두 1보다 크거나 같고, N보나 작거나 같으며, 같은 수는 2번 이상 주어지지 않는다. 또, N은 8보다 www.acmicpc.net 마르코프 프로세스에 의하면 우리가 현재 상태(\(S_c\))의 기대값은 다음과 같이 구할 수 있습니다. \[ E(S_c) = \sum_{p} P_{c, p} \.. 2022. 8. 31. 이전 1 다음