Quiz RL - Temporal Difference Algorithm

Quiz
•
Computers
•
University
•
Hard
meilana siswanto
Used 2+ times
FREE Resource
10 questions
Show all answers
1.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Dalam lingkup kajian Reinforcement Learning, Temporal Difference
Learning termasuk ...
Model-based algorithm
Model free algorithm
Reward based algorithm
Environment-based algorithm
2.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Berikut pernyataan yang benar tentang Temporal Difference
Learning adalah...
Model-based environment
Agent belajar dari lingkungan melalui pemodelan lengkap
Kombinasi dari Monte Carlo dan Dynamic Programming
Tidak ada jawaban yang benar
3.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Mengapa dikatakan bahwa Monte Carlo adalah ide dasar dari Temporal Difference Learning?
Karena dalam Monte Carlo, value-nya dievaluasi tiap episode
Karena pada algoritma Monte Carlo tidak perlu ada termination
Karena Monte Carlo merupakan model free algorithm
Karena setiap episode dalam Monte Carlo tidak independent
4.
MULTIPLE CHOICE QUESTION
45 sec • 1 pt
Berikut merupakan pernyataan yang benar tentang Temporal Difference Learning adalah...
Bersifat episodik dalam melakukan evaluasi value-nya
Bersifat non-episodik dalam melakukan evaluasi value-nya
Tidak memiliki learning rate
Bersifat independent, tidak bootstrapping
5.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Apa yang menyebabkan Dynamic Programming (DP) merupakan ide dari Temporal Difference Learning (TDL)?
DP dalam meng-update value-state harus menyelesaikan 1 episode
DP dapat meng-update value-state per-step dari episode
Semua kemungkinan transisi state tidak dipertimbangkan pada setiap step
TDL tidak bersifat bootstrapping sebagaimana DP
6.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Dua diantara pilihan berikut mana yang merupakan Temporal Difference Control adalah...
Monte Carlo dan Dynamic Programming
Markov Decision Process dan Monte Carlo
SARSA dan Q-Learning
SARSA dan Monte Carlo
7.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Apa yang dimaksud dengan SARSA pada Temporal Difference Learning?
Merupakan Action-Value function
Off policy
Update value secara episodik
Semua jawaban benar
Create a free account and access millions of resources
Similar Resources on Wayground
15 questions
AIML

Quiz
•
University
10 questions
Educação para os média

Quiz
•
University
15 questions
SOM - Comandos LINUX

Quiz
•
9th Grade - University
10 questions
Machine Learning

Quiz
•
12th Grade - University
8 questions
MACHINE LEARNING TERMINOLOGY

Quiz
•
University
9 questions
ECOP04 - Display de 7 segmentos

Quiz
•
University - Professi...
5 questions
Monte Carlo Simulation

Quiz
•
University
15 questions
Pretest Introduction to Machine Learning

Quiz
•
University
Popular Resources on Wayground
18 questions
Writing Launch Day 1

Lesson
•
3rd Grade
11 questions
Hallway & Bathroom Expectations

Quiz
•
6th - 8th Grade
11 questions
Standard Response Protocol

Quiz
•
6th - 8th Grade
40 questions
Algebra Review Topics

Quiz
•
9th - 12th Grade
4 questions
Exit Ticket 7/29

Quiz
•
8th Grade
10 questions
Lab Safety Procedures and Guidelines

Interactive video
•
6th - 10th Grade
19 questions
Handbook Overview

Lesson
•
9th - 12th Grade
20 questions
Subject-Verb Agreement

Quiz
•
9th Grade