Search Header Logo

TR Evals - 1

Authored by Nihan Cetin

Other

Professional Development

Used 1+ times

TR Evals - 1
AI

AI Actions

Add similar questions

Adjust reading levels

Convert to real-world scenario

Translate activity

More...

    Content View

    Student View

5 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

Senaryo:
- Prompt'ta verilen core ask karşılanmadı.
- Bilgi yanlışı yok.
- Restatement yok.

IF ve Truthfulness nasıl puanlarız?

IF - Major issues
TF - No issues

IF - Major issues
TF - Major issues

IF - Minor issues
TF - Minor issues

IF - No issues
TF - Major issues

2.

MULTIPLE CHOICE QUESTION

1 min • 1 pt

Aşağıdaki sistem prompt ile karşılaşırsak ne yapıyoruz?

A conversation between a user and a helpful assistant. The user's locale is tr_TR.

Modelden daha arkadaş canlısı cevaplar bekliyoruz.

Model ile iki sohbetin belini kırıyoruz.

Pleasantry yoksa puan kırıyoruz.

Bu genel bir ifade. Yani normal bir şekilde rate'liyoruz.

3.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

Türkiye Cumhuriyeti 1930 yılında kurulmuştur.

Bu ifade için Localization puanı kırılır.

Doğru

Yanlış

4.

MULTIPLE CHOICE QUESTION

1 min • 1 pt

Aşağıdakilerden hangisinde task invalid olur?

Ref text olması gereken bir task'te ref text yok

User prompt + Response1 + Response2 = 1050+ words

Harmful olduğundan emin olduğumuz bir user prompt

User propmt'ta desteklenmeyen format talebinde bulunulması

5.

MULTIPLE SELECT QUESTION

1 min • 1 pt

Senaryo:

Prompt: 3 kıtalık bir şiir talebi
Response: 1 kıtalık şiir (restatement yok)

Hangilerinden puan kırılır?

Instruction Following

Truthfulness

Response Length

Localization

Access all questions and much more by creating a free account

Create resources

Host any resource

Get auto-graded reports

Google

Continue with Google

Email

Continue with Email

Classlink

Continue with Classlink

Clever

Continue with Clever

or continue with

Microsoft

Microsoft

Apple

Apple

Others

Others

Already have an account?