Cuestionario 2 - NLP

Cuestionario 2 - NLP

Professional Development

15 Qs

quiz-placeholder

Similar activities

vectores,matrices,funciones

vectores,matrices,funciones

Professional Development

10 Qs

Función CONTAR

Función CONTAR

KG - Professional Development

10 Qs

Google Classroom

Google Classroom

Professional Development

18 Qs

Tarjetas gráficas

Tarjetas gráficas

Professional Development

10 Qs

Smart Draw 12

Smart Draw 12

Professional Development

20 Qs

STIN (EM24) - Tecnologías 4.0 (T13)

STIN (EM24) - Tecnologías 4.0 (T13)

University - Professional Development

17 Qs

Mantenimiento 2°2

Mantenimiento 2°2

Professional Development

15 Qs

2 Les bases de l'informatique

2 Les bases de l'informatique

Professional Development

15 Qs

Cuestionario 2 - NLP

Cuestionario 2 - NLP

Assessment

Quiz

Computers

Professional Development

Easy

Created by

Lautaro Perez

Used 1+ times

FREE Resource

AI

Enhance your content in a minute

Add similar questions
Adjust reading levels
Convert to real-world scenario
Translate activity
More...

15 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

¿Cuál es la idea central de la metodología Bag-of-Words (BoW)?

Crear vectores que capturen el significado semántico de las palabras.

Representar un documento contando la frecuencia de cada palabra, ignorando el orden.

Agrupar palabras en entidades como "Persona" o "Lugar".

Answer explanation

Justificación: BoW se enfoca únicamente en la frecuencia de las palabras (cuántas veces aparecen), tratando el documento como una "bolsa" donde el orden no importa.

2.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

¿Cuál es la principal limitación de los modelos basados en frecuencia como BoW y TF-IDF?

Son muy lentos para procesar textos cortos.

Solo funcionan para el idioma inglés.

No entienden el significado (semántica) de las palabras ni su contexto.

Answer explanation

Justificación: Estos modelos no saben que "coche" y "auto" son sinónimos, ya que tratan cada palabra como un token único sin comprender su significado.

3.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

En el modelo TF-IDF, ¿qué mide el componente IDF (Inverse Document Frequency)?

La frecuencia de una palabra dentro de un único documento.

La importancia de una palabra, dándole más peso a las que son raras en todo el corpus.

El número total de palabras en todo el corpus.

Answer explanation

Justificación: El IDF penaliza las palabras que son muy comunes en todos los documentos (como las stopwords) y premia a las que son raras y distintivas.

4.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

¿Para qué se utiliza TfidfVectorizer de Scikit-learn?

Para entrenar un modelo de clasificación de texto.

Para realizar el etiquetado gramatical (POS Tagging) de un texto.

Para automatizar la creación de una matriz TF-IDF a partir de un corpus de texto.

Answer explanation

Justificación: TfidfVectorizer encapsula todo el proceso de tokenización, conteo y cálculo de pesos TF-IDF en un solo objeto.

5.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

¿Cuál es el objetivo principal del Reconocimiento de Entidades Nombradas (NER)?

Reducir las palabras a su raíz o lema.

Identificar y clasificar entidades como personas, lugares y organizaciones en un texto.

Contar la frecuencia de los nombres propios en un documento.

Answer explanation

Justificación: NER se enfoca en extraer información estructurada (entidades con sus categorías) de texto no estructurado.

6.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

¿Cuál es la principal ventaja de spaCy sobre NLTK para realizar NER en español?

NLTK no puede tokenizar texto.

spaCy ofrece modelos pre-entrenados de alto rendimiento para español, mientras que el NER de NLTK es principalmente para inglés.

El código de spaCy es más difícil de entender que el de NLTK.

Answer explanation

Justificación: La fortaleza de spaCy es su enfoque multilingüe y sus modelos listos para usar en producción para muchos idiomas, incluido el español.

7.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

En el contexto de NER, ¿qué significa la etiqueta B-ORG?

Que el token está fuera (Outside) de una entidad de tipo Organización.

Que el token está dentro (Inside) de una entidad de tipo Persona.

Que el token es el comienzo (Beginning) de una entidad de tipo Organización.

Answer explanation

Justificación: El esquema BIO utiliza 'B' para el inicio, 'I' para el interior de una entidad, y el sufijo (ORG) para indicar el tipo de entidad.

Create a free account and access millions of resources

Create resources

Host any resource

Get auto-graded reports

Google

Continue with Google

Email

Continue with Email

Classlink

Continue with Classlink

Clever

Continue with Clever

or continue with

Microsoft

Microsoft

Apple

Apple

Others

Others

By signing up, you agree to our Terms of Service & Privacy Policy

Already have an account?