Search Header Logo

Quiz RL - Temporal Difference Algorithm

Authored by meilana siswanto

Computers

University

Used 2+ times

Quiz RL - Temporal Difference Algorithm
AI

AI Actions

Add similar questions

Adjust reading levels

Convert to real-world scenario

Translate activity

More...

    Content View

    Student View

10 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Dalam lingkup kajian Reinforcement Learning, Temporal Difference

Learning termasuk ...

Model-based algorithm

Model free algorithm

Reward based algorithm

Environment-based algorithm

2.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Berikut pernyataan yang benar tentang Temporal Difference

Learning adalah...

Model-based environment

Agent belajar dari lingkungan melalui pemodelan lengkap

Kombinasi dari Monte Carlo dan Dynamic Programming

Tidak ada jawaban yang benar

3.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Mengapa dikatakan bahwa Monte Carlo adalah ide dasar dari Temporal Difference Learning?

Karena dalam Monte Carlo, value-nya dievaluasi tiap episode

Karena pada algoritma Monte Carlo tidak perlu ada termination

Karena Monte Carlo merupakan model free algorithm

Karena setiap episode dalam Monte Carlo tidak independent

4.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

Berikut merupakan pernyataan yang benar tentang Temporal Difference Learning adalah...

Bersifat episodik dalam melakukan evaluasi value-nya

Bersifat non-episodik dalam melakukan evaluasi value-nya

Tidak memiliki learning rate

Bersifat independent, tidak bootstrapping

5.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Apa yang menyebabkan Dynamic Programming (DP) merupakan ide dari Temporal Difference Learning (TDL)?

DP dalam meng-update value-state harus menyelesaikan 1 episode

DP dapat meng-update value-state per-step dari episode

Semua kemungkinan transisi state tidak dipertimbangkan pada setiap step

TDL tidak bersifat bootstrapping sebagaimana DP

6.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Dua diantara pilihan berikut mana yang merupakan Temporal Difference Control adalah...

Monte Carlo dan Dynamic Programming

Markov Decision Process dan Monte Carlo

SARSA dan Q-Learning

SARSA dan Monte Carlo

7.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Apa yang dimaksud dengan SARSA pada Temporal Difference Learning?

Merupakan Action-Value function

Off policy

Update value secara episodik

Semua jawaban benar

Access all questions and much more by creating a free account

Create resources

Host any resource

Get auto-graded reports

Google

Continue with Google

Email

Continue with Email

Classlink

Continue with Classlink

Clever

Continue with Clever

or continue with

Microsoft

Microsoft

Apple

Apple

Others

Others

Already have an account?

Discover more resources for Computers