Search Header Logo

PJN-1-Tokenizacja

Authored by Agata Dobrzyniewicz

others

Used 3+ times

PJN-1-Tokenizacja
AI

AI Actions

Add similar questions

Adjust reading levels

Convert to real-world scenario

Translate activity

More...

    Content View

    Student View

12 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Czym jest tokenizacja w NLP?

Podziałem tekstu na mniejsze jednostki (np. słowa)
Procesem szyfrowania danych tekstowych
Usuwaniem znaków interpunkcyjnych
Analizą składniową zdań

2.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Prawda czy fałsz? Tokenizacja zawsze dzieli tekst na pojedyncze słowa.

Fałsz
Prawda

3.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Która metoda tokenizacji NIE istnieje?

Tokenizacja na paragrafy
Tokenizacja na słowa
Tokenizacja na zdania
Tokenizacja na morfemy

4.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

W jakim języku tokenizacja jest szczególnie trudna, ponieważ nie ma spacji między słowami?

Chiński
Niemiecki
Hiszpański
Angielski

5.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Dlaczego tokenizacja na poziomie podsłów (morfemów) jest korzystna w porównaniu z tokenizacją na słowa?

Pozwala obsłużyć słowa spoza słownika (OOV)
Zawsze przyspiesza trenowanie modeli
Rozwiązuje problem wieloznaczności słów
Eliminuje konieczność embeddingów

6.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Który z modeli językowych korzysta z tokenizacji opartej na WordPiece?

BERT
GPT-2
FastText
Word2Vec

7.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Co oznacza pojęcie “out-of-vocabulary” (OOV)?

Słowa, które nie znajdują się w słowniku modelu
Słowa z błędami ortograficznymi
Tokeny specjalne, np. [CLS] i [SEP]
Wszelkie liczby w tekście

Access all questions and much more by creating a free account

Create resources

Host any resource

Get auto-graded reports

Google

Continue with Google

Email

Continue with Email

Classlink

Continue with Classlink

Clever

Continue with Clever

or continue with

Microsoft

Microsoft

Apple

Apple

Others

Others

Already have an account?