본문 바로가기
반응형

Lecture/파이썬으로 만드는 AI 오델로 게임7

5 랜덤시도를 통하여 순차 결정 문제 해결 1. MDP 문제 풀기 MDP(Markov Decision Process, 마르코프 의사결정 과정) 문제를 해결하기 위한 주요 방법들을 각각의 특징과 작동 원리를 중심으로 서술해 보겠습니다.1) 몬테 카를로 기법(Monte-Carlo Method) • 핵심 개념: 몬테 카를로 기법은 샘플링을 통해 MDP의 상태 가치나 행동 가치를 추정하는 방법입니다. 환경 모델에 대한 사전 지식이 필요하지 않고, 시뮬레이션을 통해 상태-행동 쌍에 대한 경험 데이터를 수집합니다.• 작동 방식:• 에피소드를 여러 번 시뮬레이션하여, 각 상태에 대한 평균 보상을 계산합니다.• 에피소드 종료 후 얻은 보상 데이터를 기반으로 상태 가치나 행동 가치를 업데이트합니다.• 주로 에피소드 단위로 학습이 이루어집니다.• 장점:• 환경의 .. 2024. 11. 24.
4. 파이썬을 이용한 데이터 과학 소개(part 3) 4. MatplotLibmatplotlib.pyplot은 데이터를 시각화하는 도구로, MATLAB과 비슷한 스타일의 그래프를 생성할 수 있습니다. 데이터를 그래프로 나타내는 기본적인 방법은 아래와 같습니다: 1. plot() 함수• 데이터 리스트를 입력하여 선 그래프를 그립니다.• plot([y 값 리스트]): y축 데이터만 지정하면, x축 값은 자동으로 인덱스(0, 1, 2, …)로 설정됩니다.• plot([x 값 리스트], [y 값 리스트]): x축과 y축 데이터를 명시적으로 지정하여 그래프를 그립니다. 2. xlabel() 및 ylabel() 함수• 각각 x축과 y축의 레이블(이름)을 설정합니다. 3. show() 함수• 설정한 그래프를 출력합니다.예제 코드import matplotlib.pyplo.. 2024. 11. 22.
4. 파이썬을 이용한 데이터 과학 소개(part 2) 3. Pandas Pandas는 Python에서 데이터를 분석하고 조작하기 위한 강력한 라이브러리로, 행과 열로 이루어진 구조화된 데이터를 처리하는 데 최적화되어 있습니다. 주요 데이터 구조로는 1차원 데이터를 다루는 Series와 2차원 테이블 형태의 데이터를 다루는 DataFrame이 있습니다. 이 데이터 구조는 데이터베이스의 테이블이나 스프레드시트와 유사해 직관적으로 사용할 수 있습니다. Pandas는 다양한 데이터 포맷을 지원하며, CSV, Excel, SQL, JSON 등 여러 소스의 데이터를 손쉽게 읽고 쓸 수 있습니다. 또한 데이터를 정렬하거나 필터링할 수 있는 인덱스 기능과 그룹화, 피벗 테이블 생성, 데이터 병합과 같은 고급 데이터 조작 기능을 제공합니다. 결측치 처리나 중복 제거 같은 .. 2024. 11. 20.
4. 파이썬을 이용한 데이터 과학 소개(part 1) 1. 데이터 과학 데이터 과학은 다양한 데이터로부터 유용한 지식과 인사이트를 도출하기 위해 데이터 처리 과정, 과학적 방법론, 알고리즘, 시스템 등을 결합하는 분야입니다. 이 과정에서는 정형, 비정형, 반정형 데이터 모두가 사용됩니다.• 정형 데이터는 표나 데이터베이스처럼 일정한 형식을 갖춘 데이터로, 예를 들어 엑셀 파일이나 관계형 데이터베이스의 자료가 포함됩니다.• 비정형 데이터는 특정한 형식 없이 인간 언어처럼 자연스럽게 표현된 데이터로, 웹 페이지나 뉴스 기사처럼 구문 분석이 필요한 데이터가 해당됩니다.• 반정형 데이터는 JSON 파일과 같이 문자열 기반으로 부분적으로 형식화된 데이터를 의미하며, 구조와 비구조적 요소가 혼재된 형태를 띱니다. 데이터 과학자는 이러한 다양한 유형의 데이터를 적절히 .. 2024. 11. 15.
3. 강화학습을 위한 순차 결정 문제 소개 1. 순차 결정 문제(Sequential Decision Problem)순차 결정 문제는 시간의 흐름에 따라 순간순간 결정을 내려야 하는 문제를 말합니다. 이 문제 유형은 각각의 순간에 취하는 행동이 이후의 결과에 영향을 미치기 때문에, 매 순간 최적의 결정을 내려야 하는 상황에서 주로 나타납니다. 이러한 문제는 연속적으로 이어지지만, 각각의 결정 포인트가 분리되어 있어 수학적 모델링이 가능하며, 이를 통해 문제를 해결할 수 있습니다.순차 결정 문제는 일상생활에서 흔히 볼 수 있습니다. 예를 들어, 출근할 때 자동차를 운전하며 신호에 맞춰 속도와 경로를 조정하는 상황도 순차 결정 문제입니다. 운전 중에는 도로 상황, 교통 신호, 다른 차량의 움직임 등에 따라 순간적으로 결정을 내리게 되는데, 이러한 일련.. 2024. 11. 10.
2. 인공지능과 강화학습 소개 1. 인공지능 소개 1) 인공지능이란 인공지능(artificial intelligence, A.I.)은 인간의 지적 능력 중 일부 또는 전체를 인공적으로 구현하는 기술을 말합니다. 최근에 많이 언급되고 있지만, 인공지능의 역사는 오래되었습니다. 일반적으로 인공지능은 강 인공지능과 약 인공지능으로 분류됩니다. 강 인공지능은 인간의 지적 능력을 완벽하게 모방한 것을 말하며, 현재는 아직까지 이를 달성한 인공지능은 없습니다. 반면, 약 인공지능은 특정한 목적을 위해 제한된 인공지능을 말합니다. 현재의 인공지능은 대부분 약 인공지능에 해당합니다. 2) 인공지능과 기계학습 인공지능은 인간의 지능을 대신해서 일을 할 수 있는 소프트웨어나 하드웨어를 모두 포함하는 큰 개념입니다. 예를 들어 제품을 분류하거나 세탁물의.. 2022. 9. 25.
728x90