Dalam lingkup kajian Reinforcement Learning, Temporal Difference
Learning termasuk ...
Quiz RL - Temporal Difference Algorithm
Quiz
•
Computers
•
University
•
Hard
meilana siswanto
Used 2+ times
FREE Resource
10 questions
Show all answers
1.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Dalam lingkup kajian Reinforcement Learning, Temporal Difference
Learning termasuk ...
Model-based algorithm
Model free algorithm
Reward based algorithm
Environment-based algorithm
2.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Berikut pernyataan yang benar tentang Temporal Difference
Learning adalah...
Model-based environment
Agent belajar dari lingkungan melalui pemodelan lengkap
Kombinasi dari Monte Carlo dan Dynamic Programming
Tidak ada jawaban yang benar
3.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Mengapa dikatakan bahwa Monte Carlo adalah ide dasar dari Temporal Difference Learning?
Karena dalam Monte Carlo, value-nya dievaluasi tiap episode
Karena pada algoritma Monte Carlo tidak perlu ada termination
Karena Monte Carlo merupakan model free algorithm
Karena setiap episode dalam Monte Carlo tidak independent
4.
MULTIPLE CHOICE QUESTION
45 sec • 1 pt
Berikut merupakan pernyataan yang benar tentang Temporal Difference Learning adalah...
Bersifat episodik dalam melakukan evaluasi value-nya
Bersifat non-episodik dalam melakukan evaluasi value-nya
Tidak memiliki learning rate
Bersifat independent, tidak bootstrapping
5.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Apa yang menyebabkan Dynamic Programming (DP) merupakan ide dari Temporal Difference Learning (TDL)?
DP dalam meng-update value-state harus menyelesaikan 1 episode
DP dapat meng-update value-state per-step dari episode
Semua kemungkinan transisi state tidak dipertimbangkan pada setiap step
TDL tidak bersifat bootstrapping sebagaimana DP
6.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Dua diantara pilihan berikut mana yang merupakan Temporal Difference Control adalah...
Monte Carlo dan Dynamic Programming
Markov Decision Process dan Monte Carlo
SARSA dan Q-Learning
SARSA dan Monte Carlo
7.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Apa yang dimaksud dengan SARSA pada Temporal Difference Learning?
Merupakan Action-Value function
Off policy
Update value secara episodik
Semua jawaban benar
10 questions
Machine Learning
Quiz
•
12th Grade - University
15 questions
AIML
Quiz
•
University
15 questions
Applying AI Techniques
Quiz
•
University
5 questions
Monte Carlo Simulation
Quiz
•
University
14 questions
Bloque1 IA
Quiz
•
University
15 questions
Pretest Introduction to Machine Learning
Quiz
•
University
10 questions
Educação para os média
Quiz
•
University
15 questions
SOM - Comandos LINUX
Quiz
•
9th Grade - University
15 questions
Character Analysis
Quiz
•
4th Grade
17 questions
Chapter 12 - Doing the Right Thing
Quiz
•
9th - 12th Grade
10 questions
American Flag
Quiz
•
1st - 2nd Grade
20 questions
Reading Comprehension
Quiz
•
5th Grade
30 questions
Linear Inequalities
Quiz
•
9th - 12th Grade
20 questions
Types of Credit
Quiz
•
9th - 12th Grade
18 questions
Full S.T.E.A.M. Ahead Summer Academy Pre-Test 24-25
Quiz
•
5th Grade
14 questions
Misplaced and Dangling Modifiers
Quiz
•
6th - 8th Grade