Search Header Logo

Aprendizado Por Reforço: TBL Aplicação dos Conhecimentos

Authored by ADM_CMX ADM_CMX

Computers

University

Used 1+ times

Aprendizado Por Reforço: TBL Aplicação dos Conhecimentos
AI

AI Actions

Add similar questions

Adjust reading levels

Convert to real-world scenario

Translate activity

More...

    Content View

    Student View

5 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Um Agente em Aprendizagem por Reforço decide quais ações tomar seguindo uma sequência predeterminada.

Verdadeiro

Falso

2.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Conforme é previsto pela Cadeia de Markov, o próximo estado em que Mario vai estar apenas depende do estado atual dele.

Verdadeiro

Falso

3.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Mario saberá quais as melhores Ações para se realizar em cada Estado ao receber uma Recompensa por ela. Recompensas nada mais são que números inteiros ou flutuantes, e o Agente sempre irá tentar coletar o máximo possível de Recompensa.

Verdadeiro

Falso

4.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

O propósito de uma Matriz de Transição na Aprendizagem por Reforço é calcular a probabilidade de transição de um estado para outro.

Verdadeiro

Falso

5.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Um Processo de Decisão Markov (MDP) no contexto da Aprendizagem por Reforço é uma fórmula matemática para calcular probabilidades.

Verdadeiro

Falso

Access all questions and much more by creating a free account

Create resources

Host any resource

Get auto-graded reports

Google

Continue with Google

Email

Continue with Email

Classlink

Continue with Classlink

Clever

Continue with Clever

or continue with

Microsoft

Microsoft

Apple

Apple

Others

Others

Already have an account?