Aprendizado Por Reforço: TBL Aplicação dos Conhecimentos

Aprendizado Por Reforço: TBL Aplicação dos Conhecimentos

University

5 Qs

quiz-placeholder

Similar activities

Nearest Neighbor

Nearest Neighbor

University

5 Qs

Engenharia de Software #4

Engenharia de Software #4

University

8 Qs

LC - 1DS - termos técnicos da TI

LC - 1DS - termos técnicos da TI

10th Grade - University

10 Qs

Puxirum Quiz

Puxirum Quiz

University

10 Qs

C# - Ficheiros 1

C# - Ficheiros 1

10th Grade - University

9 Qs

Java 3I3

Java 3I3

University

10 Qs

Crianças VS Digital

Crianças VS Digital

5th Grade - University

6 Qs

AA3 - Aprendizaje por refuerzo

AA3 - Aprendizaje por refuerzo

University

10 Qs

Aprendizado Por Reforço: TBL Aplicação dos Conhecimentos

Aprendizado Por Reforço: TBL Aplicação dos Conhecimentos

Assessment

Quiz

Computers

University

Easy

Created by

ADM_CMX ADM_CMX

Used 1+ times

FREE Resource

5 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Um Agente em Aprendizagem por Reforço decide quais ações tomar seguindo uma sequência predeterminada.

Verdadeiro

Falso

2.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Conforme é previsto pela Cadeia de Markov, o próximo estado em que Mario vai estar apenas depende do estado atual dele.

Verdadeiro

Falso

3.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Mario saberá quais as melhores Ações para se realizar em cada Estado ao receber uma Recompensa por ela. Recompensas nada mais são que números inteiros ou flutuantes, e o Agente sempre irá tentar coletar o máximo possível de Recompensa.

Verdadeiro

Falso

4.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

O propósito de uma Matriz de Transição na Aprendizagem por Reforço é calcular a probabilidade de transição de um estado para outro.

Verdadeiro

Falso

5.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Um Processo de Decisão Markov (MDP) no contexto da Aprendizagem por Reforço é uma fórmula matemática para calcular probabilidades.

Verdadeiro

Falso