Cuestionario 2 - NLP

Cuestionario 2 - NLP

Professional Development

15 Qs

quiz-placeholder

Similar activities

Evaluacion de resultados - 1er ciclo

Evaluacion de resultados - 1er ciclo

Professional Development

20 Qs

REDES

REDES

Professional Development

20 Qs

S2 - 4P Postura correcta frente al computador

S2 - 4P Postura correcta frente al computador

Professional Development

15 Qs

Partes Externas e Internas de un Computador

Partes Externas e Internas de un Computador

Professional Development

10 Qs

SOM 2.2 Funciones de un SO

SOM 2.2 Funciones de un SO

Professional Development

10 Qs

MODULO 2 - PUERTOS Y CONEXION DE DISPOSITIVOS

MODULO 2 - PUERTOS Y CONEXION DE DISPOSITIVOS

Professional Development

17 Qs

Capa de Enlace de Datos

Capa de Enlace de Datos

Professional Development

20 Qs

Tecnologìa y comunicacion

Tecnologìa y comunicacion

3rd Grade - Professional Development

20 Qs

Cuestionario 2 - NLP

Cuestionario 2 - NLP

Assessment

Quiz

Computers

Professional Development

Easy

Created by

Lautaro Perez

Used 1+ times

FREE Resource

15 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

¿Cuál es la idea central de la metodología Bag-of-Words (BoW)?

Crear vectores que capturen el significado semántico de las palabras.

Representar un documento contando la frecuencia de cada palabra, ignorando el orden.

Agrupar palabras en entidades como "Persona" o "Lugar".

Answer explanation

Justificación: BoW se enfoca únicamente en la frecuencia de las palabras (cuántas veces aparecen), tratando el documento como una "bolsa" donde el orden no importa.

2.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

¿Cuál es la principal limitación de los modelos basados en frecuencia como BoW y TF-IDF?

Son muy lentos para procesar textos cortos.

Solo funcionan para el idioma inglés.

No entienden el significado (semántica) de las palabras ni su contexto.

Answer explanation

Justificación: Estos modelos no saben que "coche" y "auto" son sinónimos, ya que tratan cada palabra como un token único sin comprender su significado.

3.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

En el modelo TF-IDF, ¿qué mide el componente IDF (Inverse Document Frequency)?

La frecuencia de una palabra dentro de un único documento.

La importancia de una palabra, dándole más peso a las que son raras en todo el corpus.

El número total de palabras en todo el corpus.

Answer explanation

Justificación: El IDF penaliza las palabras que son muy comunes en todos los documentos (como las stopwords) y premia a las que son raras y distintivas.

4.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

¿Para qué se utiliza TfidfVectorizer de Scikit-learn?

Para entrenar un modelo de clasificación de texto.

Para realizar el etiquetado gramatical (POS Tagging) de un texto.

Para automatizar la creación de una matriz TF-IDF a partir de un corpus de texto.

Answer explanation

Justificación: TfidfVectorizer encapsula todo el proceso de tokenización, conteo y cálculo de pesos TF-IDF en un solo objeto.

5.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

¿Cuál es el objetivo principal del Reconocimiento de Entidades Nombradas (NER)?

Reducir las palabras a su raíz o lema.

Identificar y clasificar entidades como personas, lugares y organizaciones en un texto.

Contar la frecuencia de los nombres propios en un documento.

Answer explanation

Justificación: NER se enfoca en extraer información estructurada (entidades con sus categorías) de texto no estructurado.

6.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

¿Cuál es la principal ventaja de spaCy sobre NLTK para realizar NER en español?

NLTK no puede tokenizar texto.

spaCy ofrece modelos pre-entrenados de alto rendimiento para español, mientras que el NER de NLTK es principalmente para inglés.

El código de spaCy es más difícil de entender que el de NLTK.

Answer explanation

Justificación: La fortaleza de spaCy es su enfoque multilingüe y sus modelos listos para usar en producción para muchos idiomas, incluido el español.

7.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

En el contexto de NER, ¿qué significa la etiqueta B-ORG?

Que el token está fuera (Outside) de una entidad de tipo Organización.

Que el token está dentro (Inside) de una entidad de tipo Persona.

Que el token es el comienzo (Beginning) de una entidad de tipo Organización.

Answer explanation

Justificación: El esquema BIO utiliza 'B' para el inicio, 'I' para el interior de una entidad, y el sufijo (ORG) para indicar el tipo de entidad.

Create a free account and access millions of resources

Create resources
Host any resource
Get auto-graded reports
or continue with
Microsoft
Apple
Others
By signing up, you agree to our Terms of Service & Privacy Policy
Already have an account?