[1] What is Reinforcement Learning(RL)
🧠 강화학습이란?강화학습은 **시행착오(trial-and-error)**를 통해 **최적의 행동(=전략)**을 학습하는 인공지능 방식이에요.아주 간단한 목표는 이거예요:어떤 행동을 해야, 내가 앞으로 더 많은 보상을 받을 수 있을까?💡 현실 예시로 시작해볼게요🎮 예시 1: 마리오 게임에이전트(agent): 마리오환경(environment): 게임 화면 (몬스터, 점프대, 구멍 등)상태(state): 현재 마리오의 위치, 속도, 남은 생명 등행동(action): 점프, 앞으로 걷기, 뒤로 가기보상(reward): 코인 먹으면 +1, 죽으면 -100, 클리어하면 +500마리오는 처음엔 아무것도 모르지만, 게임을 여러 번 하다 보면 “구멍 앞에서 점프하면 죽지 않네?” 같은 패턴을 발견하고 자신만의 전략..
2025. 7. 4.