
Aprendizado Por Reforço: TBL Aplicação dos Conhecimentos
Authored by ADM_CMX ADM_CMX
Computers
University
Used 1+ times

AI Actions
Add similar questions
Adjust reading levels
Convert to real-world scenario
Translate activity
More...
Content View
Student View
5 questions
Show all answers
1.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Um Agente em Aprendizagem por Reforço decide quais ações tomar seguindo uma sequência predeterminada.
Verdadeiro
Falso
2.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Conforme é previsto pela Cadeia de Markov, o próximo estado em que Mario vai estar apenas depende do estado atual dele.
Verdadeiro
Falso
3.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Mario saberá quais as melhores Ações para se realizar em cada Estado ao receber uma Recompensa por ela. Recompensas nada mais são que números inteiros ou flutuantes, e o Agente sempre irá tentar coletar o máximo possível de Recompensa.
Verdadeiro
Falso
4.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
O propósito de uma Matriz de Transição na Aprendizagem por Reforço é calcular a probabilidade de transição de um estado para outro.
Verdadeiro
Falso
5.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Um Processo de Decisão Markov (MDP) no contexto da Aprendizagem por Reforço é uma fórmula matemática para calcular probabilidades.
Verdadeiro
Falso
Access all questions and much more by creating a free account
Create resources
Host any resource
Get auto-graded reports

Continue with Google

Continue with Email

Continue with Classlink

Continue with Clever
or continue with

Microsoft
%20(1).png)
Apple
Others
Already have an account?