Search Header Logo

Aprendizado Por Reforço: TBL Aplicação dos Conhecimentos

Authored by ADM_CMX ADM_CMX

Computers

University

Used 1+ times

Aprendizado Por Reforço: TBL Aplicação dos Conhecimentos
AI

AI Actions

Add similar questions

Adjust reading levels

Convert to real-world scenario

Translate activity

More...

    Content View

    Student View

5 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Um Agente em Aprendizagem por Reforço decide quais ações tomar seguindo uma sequência predeterminada.

Verdadeiro

Falso

2.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Conforme é previsto pela Cadeia de Markov, o próximo estado em que Mario vai estar apenas depende do estado atual dele.

Verdadeiro

Falso

3.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Mario saberá quais as melhores Ações para se realizar em cada Estado ao receber uma Recompensa por ela. Recompensas nada mais são que números inteiros ou flutuantes, e o Agente sempre irá tentar coletar o máximo possível de Recompensa.

Verdadeiro

Falso

4.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

O propósito de uma Matriz de Transição na Aprendizagem por Reforço é calcular a probabilidade de transição de um estado para outro.

Verdadeiro

Falso

5.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Um Processo de Decisão Markov (MDP) no contexto da Aprendizagem por Reforço é uma fórmula matemática para calcular probabilidades.

Verdadeiro

Falso

Access all questions and much more by creating a free account

Create resources

Host any resource

Get auto-graded reports

Google

Continue with Google

Email

Continue with Email

Microsoft

Continue with Microsoft

or continue with

Facebook

Facebook

Apple

Apple

Others

Others

Already have an account?