Cuestionario 2 - NLP

Cuestionario 2 - NLP

Professional Development

15 Qs

quiz-placeholder

Similar activities

Partes Externas e Internas de un Computador

Partes Externas e Internas de un Computador

Professional Development

10 Qs

Arquitectura de computadoras

Arquitectura de computadoras

Professional Development

12 Qs

Eval Introducción Inf. Enf.

Eval Introducción Inf. Enf.

Professional Development

17 Qs

CAP3

CAP3

University - Professional Development

20 Qs

FUNCIONES EXCEL

FUNCIONES EXCEL

Professional Development

10 Qs

NLP Quiz

NLP Quiz

Professional Development

12 Qs

U.T. 1: Arquitectura por capas: Modelos OSI y TCP/IP

U.T. 1: Arquitectura por capas: Modelos OSI y TCP/IP

Professional Development

20 Qs

UT5 - ARP - DNS - DHCP

UT5 - ARP - DNS - DHCP

Professional Development

18 Qs

Cuestionario 2 - NLP

Cuestionario 2 - NLP

Assessment

Quiz

Computers

Professional Development

Easy

Created by

Lautaro Perez

Used 1+ times

FREE Resource

15 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

¿Cuál es la idea central de la metodología Bag-of-Words (BoW)?

Crear vectores que capturen el significado semántico de las palabras.

Representar un documento contando la frecuencia de cada palabra, ignorando el orden.

Agrupar palabras en entidades como "Persona" o "Lugar".

Answer explanation

Justificación: BoW se enfoca únicamente en la frecuencia de las palabras (cuántas veces aparecen), tratando el documento como una "bolsa" donde el orden no importa.

2.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

¿Cuál es la principal limitación de los modelos basados en frecuencia como BoW y TF-IDF?

Son muy lentos para procesar textos cortos.

Solo funcionan para el idioma inglés.

No entienden el significado (semántica) de las palabras ni su contexto.

Answer explanation

Justificación: Estos modelos no saben que "coche" y "auto" son sinónimos, ya que tratan cada palabra como un token único sin comprender su significado.

3.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

En el modelo TF-IDF, ¿qué mide el componente IDF (Inverse Document Frequency)?

La frecuencia de una palabra dentro de un único documento.

La importancia de una palabra, dándole más peso a las que son raras en todo el corpus.

El número total de palabras en todo el corpus.

Answer explanation

Justificación: El IDF penaliza las palabras que son muy comunes en todos los documentos (como las stopwords) y premia a las que son raras y distintivas.

4.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

¿Para qué se utiliza TfidfVectorizer de Scikit-learn?

Para entrenar un modelo de clasificación de texto.

Para realizar el etiquetado gramatical (POS Tagging) de un texto.

Para automatizar la creación de una matriz TF-IDF a partir de un corpus de texto.

Answer explanation

Justificación: TfidfVectorizer encapsula todo el proceso de tokenización, conteo y cálculo de pesos TF-IDF en un solo objeto.

5.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

¿Cuál es el objetivo principal del Reconocimiento de Entidades Nombradas (NER)?

Reducir las palabras a su raíz o lema.

Identificar y clasificar entidades como personas, lugares y organizaciones en un texto.

Contar la frecuencia de los nombres propios en un documento.

Answer explanation

Justificación: NER se enfoca en extraer información estructurada (entidades con sus categorías) de texto no estructurado.

6.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

¿Cuál es la principal ventaja de spaCy sobre NLTK para realizar NER en español?

NLTK no puede tokenizar texto.

spaCy ofrece modelos pre-entrenados de alto rendimiento para español, mientras que el NER de NLTK es principalmente para inglés.

El código de spaCy es más difícil de entender que el de NLTK.

Answer explanation

Justificación: La fortaleza de spaCy es su enfoque multilingüe y sus modelos listos para usar en producción para muchos idiomas, incluido el español.

7.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

En el contexto de NER, ¿qué significa la etiqueta B-ORG?

Que el token está fuera (Outside) de una entidad de tipo Organización.

Que el token está dentro (Inside) de una entidad de tipo Persona.

Que el token es el comienzo (Beginning) de una entidad de tipo Organización.

Answer explanation

Justificación: El esquema BIO utiliza 'B' para el inicio, 'I' para el interior de una entidad, y el sufijo (ORG) para indicar el tipo de entidad.

Create a free account and access millions of resources

Create resources
Host any resource
Get auto-graded reports
or continue with
Microsoft
Apple
Others
By signing up, you agree to our Terms of Service & Privacy Policy
Already have an account?