Yak Shaving: 야크 털 깎기
close
프로필 배경
프로필 로고

Yak Shaving: 야크 털 깎기

  • 분류 전체보기 (589)
    • 개발 이야기 (274)
      • C++ (121)
      • CUDA (10)
      • Vulkan (20)
      • OpenCL (10)
      • SYCL (시클) (7)
      • CMake (19)
      • Rust (러스트) (29)
      • Python (파이썬) (22)
      • PyTorch (파이토치) (27)
      • 기타 (8)
    • 미국 빅테크 (176)
      • 코드 인터뷰 (11)
      • 빅테크 커리어 (37)
      • 일일 영어 (113)
      • 개발자 영어 (15)
    • 과학 | 테크 (11)
    • 수학 (4)
    • 미국 생활 (107)
      • 비자 이민 (10)
      • 재테크 (43)
      • 이곳, 저곳 (0)
      • 기타 (52)
    • IT 뉴스 (3)
    • 스크랩 (2)
    • 혼잣말 (6)
      • 블로깅 (3)
      • TIL (1)
    • 관리 (0)
  • 홈
  • C++
  • Rust (러스트)
  • 빅테크
  • 개발자 영어
  • 재테크
  • 태그
  • 글쓰기
[PyTorch로 시작하는 강화학습 입문] 2편: 가치 기반 접근과 Q함수 개념, PyTorch 신경망으로 Q함수 근사하기

[PyTorch로 시작하는 강화학습 입문] 2편: 가치 기반 접근과 Q함수 개념, PyTorch 신경망으로 Q함수 근사하기

강화학습에서는 에이전트가 상태(State)마다 어떤 행동(Action)을 취해야 하는지 결정하기 위해 정책(Policy)을 개선해나갑니다. 앞서 1편에서 살펴본 랜덤 정책 에이전트는 전혀 학습을 하지 않고, 그저 무작위로 행동을 선택하기 때문에 성능이 저조했습니다. 이제는 "가치(Value)" 개념을 도입하여, 각 상태-행동 쌍이 얼마나 좋은지(미래 보상을 많이 얻을 수 있는지)를 평가하는 방식으로 정책을 개선할 실마리를 잡아봅시다.이번 글의 목표는 다음과 같습니다.가치기반(Value-based) 접근 개념 정리: Q함수(Q-value)를 통해 상태-행동 쌍의 가치를 정의Q학습(Q-learning) 아이디어 소개: 벨만(Bellman) 방정식을 이용한 Q함수 업데이트 개념(이론적 상세는 추가 자료 참조)..

  • format_list_bulleted PyTorch (파이토치)
  • · 2024. 12. 11.
  • textsms
반응형
  • navigate_before
  • 1
  • navigate_next
전체 카테고리
  • 분류 전체보기 (589)
    • 개발 이야기 (274)
      • C++ (121)
      • CUDA (10)
      • Vulkan (20)
      • OpenCL (10)
      • SYCL (시클) (7)
      • CMake (19)
      • Rust (러스트) (29)
      • Python (파이썬) (22)
      • PyTorch (파이토치) (27)
      • 기타 (8)
    • 미국 빅테크 (176)
      • 코드 인터뷰 (11)
      • 빅테크 커리어 (37)
      • 일일 영어 (113)
      • 개발자 영어 (15)
    • 과학 | 테크 (11)
    • 수학 (4)
    • 미국 생활 (107)
      • 비자 이민 (10)
      • 재테크 (43)
      • 이곳, 저곳 (0)
      • 기타 (52)
    • IT 뉴스 (3)
    • 스크랩 (2)
    • 혼잣말 (6)
      • 블로깅 (3)
      • TIL (1)
    • 관리 (0)
반응형
KoreanEnglishFrenchGermanJapaneseSpanishChinese (Simplified)
최근 글
인기 글
태그
  • #Design Patterns
  • #modern C++
  • #Software Development
  • #concepts
  • #c++23
  • #C++
  • #c++20
  • #python
  • #expected
  • #개발자 영어
전체 방문자
오늘
어제
전체
Copyright © Yak Shaving: 야크 털 깎기 All rights reserved.
Designed by JJuum

티스토리툴바

개인정보

  • 티스토리 홈
  • 포럼
  • 로그인

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.