Search Header Logo
big_2_1_2

big_2_1_2

Assessment

Presentation

Professional Development

Professional Development

Hard

Created by

KS K

FREE Resource

0 Slides • 50 Questions

1

Multiple Choice

다음 중 회귀모형의 변수선택 방법으로 사용할 수 있는 것으로 부적절한 것은?

1

모든 가능한 조합의 회귀분석

2

단계적 변수 선택 방법

3

Lasso 회귀분석

4

주성분분석

2

Multiple Choice

회귀분석에서 결정계수(R2)에 한 설명으로 부적절한 것은?

1

총 변동 중에서 설명이 되지 않는 오차에 의한 변동이 차지하는 비율이다.

2

회귀모형에서 입력 변수가 증가하면 결정계수도 증가한다.

3

다중회귀분석에서는 최적 모형의 선정기준으로 결정계수 값보다는 수정된 결정계수 값을 사용하는 것이 적절하다.

4

수정된 결정계수는 유의하지 않은 독립변수들이 회귀식에 포함되었을 때 그 값이 감소한다.

3

Multiple Choice

Question image

Default 데이터셋은 10,000명의 신용카드 고객에 대한 카드대금 연체여부(default = Yes/No), 카드 대금납입 후 남은 평균 카드잔고(Balance), 연봉(Income), 학생여부(student = Yes/No)를 포함한다. 아래는 연체 가능성을 모형화하기 위한 로지스틱 회귀분석 결과이다. 다음 중 유의수준 0.05하에서 아래에 대한 설명으로 가장 부적절한 것은?

1

balance는 default를 설명하는 데 통계적으로 유의하다.

2

income default를 설명하는 데 통계적으로 유의하다.

3

student는 default를 설명하는 데 통계적으로 유의하다.

4

balance는 income이 동일할 때 학생일수록 default 가능성이 낮다.

4

Multiple Choice

다중회귀분석에서 가장 적합한 회귀모형을 찾기 위한 과정의 설명으로 가장 부적절한 것은?

1

독립변수의 수가 많아지면 모델의 설명력이 증가하지만 모형이 복잡해지고, 독립변수들 간에 서로 영향을 미치는 다중공선성의 문제가 발생하므로 상대적인 조정이 필요하다.

2

회귀식에 대한 검정은 독립변수의 기울기 (회귀계수)가 0이 아니라는 가정을 귀무가설. 기울기가 0인 것을 대립가설로 놓는다.

3

잔차의 독립성, 등분산성 그리고 정규성을 만족하는지 확인해야 한다.

4

회귀분석의 가설검정에서 p값이 0.05보다 작은 값이 나와야 통계적으로 유의한 결과로 받아들일 수 있다.

5

Multiple Choice

다음 중 회귀분석의 오차에 대한 기본가정 중 데이터의 정규성을 확인하기 위한 방법으로 부적절한 것은?

1

히스토그램

2

Q-Q plot

3

Shapiro-Wilks test

4

Durbin Watson test

6

Multiple Choice

Question image

Hitters 데이터셋은 메이저리그의 선수 322명에 대한 타자기록으로 20여개의 변수를 포함하고 있다. 아래 회귀모형에서 변수선택을 하기 위한 결과물의 일부이다. 다음 중 결과물에 대한 설명으로 부적절한 것은?

1

전진선택법을 통한 변수선택을 하고 있다.

2

모든 설명변수가 포함된 모형에서 시작한다.

3

매 단계에서 가장 설명력이 낮은 변수를 제거한다.

4

한번 제거된 변수는 다시 모형에 포함될 수 없다.

7

Multiple Choice

Question image

아래는 스위스의 47개 프랑스어 사용지역의 출산율(Fertility)과 관련된 변수들을 사용하여 얻은 결과이다. 다음 중 회귀모형에 관한 설명을 옳지 않은 것은?

1

유의수준 0.05하에서 위의 회귀모형은 유의적으로 출산율을 설명한다.

2

위의 설명변수들은 출산율 변동의 원인임을 보여준다.

3

위의 회귀모형은 출산율 변동의 70.67% 를 설명한다.

4

수정결정계수는 0.671 이다.

8

Multiple Choice

다음 중 회귀 모형에 사용된 독립 변수 간의 상관관계가 존재하여 회귀 계수 추정치가 불안하고 해석하기 어려워지는 현상을 나타내는 것은?

1

다중공선성

2

등분산성

3

정상성

4

독립성

9

Multiple Choice

다음 다중회귀분석을 위해 사용되는 변수선택방법에 대한 설명 중 변수선택방법과 설명이 잘못 연결되어 있는 것은?

1

전진선택법(forward selection)은 상수항만 포함된 모형에서 출발하여 설명력이 좋은 변수를 하나씩 추가하는 방법이다.

2

단계적 방법(stepwise method)은 설명력이 나쁜 변수를 제거하거나 모형에서 제외된 변수 중 모형의 설명력을 가장 잘 개선하는 변수를 추가하는 방법이다.

3

후진제거법(backward elimination)은 모든 변수가 포함된 모형에서 설명력이 나쁜 변수를 하나씩 제거하는 방법이다.

4

전진선택법(forward selection)은 이해하기에는 어렵지만 변수값의 작은 변동에 민감하지 않아 안정성이 높은 방법이다.

10

Multiple Choice

다중회귀분석 시 고려할 점에 대한 다음 설명 중 옳지 않은 것은?

1

회귀모형의 설명력은 결정계수 혹은 수정된 결정계수를 통해 확인한다.

2

회귀분석의 결과로 산출되는 통계량의 p-value값이 0.05보다 크더라도 회귀계수에 대한 t통계량의 p-value가 0.05 보다 작으면 해당 회귀모형은 통계적으로 유의하다고 볼 수 있다.

3

회귀계수 절대값이 클수록 종속변수에 더 큰 영향을 주므로 회귀분석 결과를 통해 여러 변수 중 어떤 독립변수가 종속변수에 대한 영향력이 큰지를 파악할 수 있다.

4

회귀분석을 수행하기 전에 데이터의 독립변수와 종속변수 간 선형성, 오차의 독립성/등분산성 / 정규성 등을 만족하고 있는지 확인해야 한다.

11

Multiple Choice

Question image

아래는 단순회귀분석의 결과이다. 다음 설명 중 부적절한 것은?

1

종속변수는 Height이다.

2

독립변수는 Bodyweight이다.

3

모형의 설명력은 약 64.66%이다.

4

해당 회귀모형은 통계적으로 유의하지 않다.

12

Multiple Choice

Question image

College 데이터프레임은 777개의 미국 소재 대학의 각종 통계치를 포함하고 있다. 각 대학에 재학하는데 필요한 비용이 졸업률(Grad.Rate)에 미치는 영향을 알아보기 위해 등록금(Outstate), 기숙사비(Room.board), 교재구입비(Books), 그 외 개인지출비용(Personal)을 활용하기로 했다. 다음 중 아래의 결과물에 대한 설명으로 가장 부적절한 것은?

1

모든 설명변수에 대한 회귀계수 값이 유익하다.

2

위의 회귀모형은 대학의 졸업률을 설명하는데 유의하다.

3

위의 회귀모형은 대학의 졸업률의 변동성은 약 34.16%를 설명한다.

4

회귀모형의 가정을 만족하는지는 판단할 수 없다.

13

Multiple Choice

다음 중 반응변수(또는 종.속변수)가 범주형인 경우에 적용되는 회귀형분석 모형으로 적절한 것은?

1

로지스틱 회귀분석

2

단순회귀분석

3

다중 회귀분석

4

더미변수를 이용한 회귀분석

14

Multiple Choice

다음 중 lasso 회귀모형에 대한 설명으로 부적절한 것은?

1

모형에 포함된 회귀계수들의 절대값의 크기가 클수록 penalty를 부여하는 방식이다.

2

자동적으로 변수선택을 하는 효과가 있다.

3

Lambda 값으로 penalty의 정도를 조정한다.

4

L2 penalty를 사용한다.

15

Multiple Choice

다음 중 추정된 다중회귀모형이 통계적으로 유의미한지 확인하는 방법으로 적절한 것은?

1

F- 통계량을 확인한다.

2

결정계수를 확인한다.

3

t- 통계량을 확인한다.

4

잔차를 그래프로 그리고 회귀진단을 한다.

16

Multiple Choice

회귀모형의 계수를 추정하는 방법으로써 잔차제곱합(RSS:아래 참조)을 최소화하는 계수를 찾는 방법을 무엇이라고 하는가?

======================================================================

RSS = i=1n[yi  (β0 + β1x1++βpxp)]2\sum_{i=1}^n\left[y_i\ -\ \left(\beta_0\ +\ \beta_1x_1+\ldots+\beta_px_p\right)\right]^2  

1

회귀제곱법

2

오차제곱법

3

최대 우도 추정법

4

최소제곱법

17

Multiple Choice

변수 선택(variable selection)은 필요한 변수들을 선택하여 최적화된 모형을 만드는 방법이다. 다음 중 변수 선택 기준으로 사용되는 통계량들에 대한 설명으로 가장 부적절한 것은?

1

수정결정계수(Adjusted R square)는 평균제곱오차가 가장 작은 축소모형을 선택하는 방법으로 모형의 간명성과 설명력을 동시에 고려한 기준이다.

2

Mallows's Cp는 예측식이 가진 수행능력을 예측 값의 변이를 기준으로 평가하기 위해 예측값에 대한 MSE를 고려하는 방법이다.

3

Akaike 정보통계량은 정확도와 간명성 사이의 상충을 조절하려는 방법으로 비슷한 SSE를 갖는 두 모형에 대해 AIC는 적은 변수를 갖는 모형에 대해 가산점을 부여한다.

4

AIC의 경우 BIC에 비해 변수가 많을수록 더 많은 페널티를 가하는 성격을 가진다.

18

Multiple Choice

적합된 회귀모형의 안정성을 평가하기 위한 통계적 방법을 영향력 진단이라 한다. 자료에서 특정 관측치가 제외됨에 따라 분석 결과의 주요 부분에 많은 변동이 있다면 안정성이 약하다고 판단된다. 다음 중 각 개체의 영향력 진단에 대한 설명으로 가장 부적절한 것은?

1

쿡의 거리 (Cook's distance)는 관측 개체 하나가 제외되었을 때, 최소제곱추정치 벡터의 변화를 표준화한 측도이다.

2

영향점은 비교할 대상이 있어 그 값들에 비해 값이 매우 크거나 작아 회귀 계수 추정값을 변화 시키는 관측개체를 말한다.

3

DFBETAS의 절대값이 유난히 큰 관측개체는 해당 회귀계수의 추정에 대하여 큰 영향력을 행사하는 것으로 간주한다.

4

DFFITS(Difference between fits)의 절대값이 매우 큰 관측개체는 y의 예측에 영향력이 크다고 간주한다.

19

Multiple Choice

Question image

각 대학을 다니는데 필요한 비용이 졸업률(grade Rate)에 미치는 영향을 알아보기 위해 Outstate, Room Board, Books, Personal 데이터를 활용하여 회귀분석을 실시했으며 추진제거법(backward elimination)으로 변수 선택법을 택했다. 아래의 결과물을 바탕으로 변수 선택을 할 때 첫 단계에서 제거되는 변수는 무엇인가?

1

Books

2

Outstate

3

Personal

4

Room.Board

20

Multiple Choice

다음 중 최적회귀방정식을 선택하기 위한 방법에 대한 설명으로 가장 부적절한 것은?

1

가능한 범위 내에서 적은 수의 설명변수를 포함시킨다.

2

AIC나 BIC의 값이 가장 작은 모형을 선택하는 방법으로 모든 가능한 조합의 회귀분석을 실시한다.

3

전진선택법이나 후진선택법과 동일한 최적 모형을 선택하는 것이 단계적 방법이다.

4

전진선택법은 설명변수를 추가했을 때 제곱합의 기준으로 가장 설명을 잘하는 변수를 고려하여 그 변수가 유의하면 추가한다.

21

Multiple Choice

다음 중 시계열 예측에서 정상성(Stationary)을 만족한다는 것이 의미하는 것은?

1

평균이 시점에 의존한다.

2

분산이 시점에 의존한다.

3

공분산이 시차에 의존하지 않는다.

4

분산이 시점에 의존하지 않는다.

22

Multiple Choice

아래는 자기회귀누적이동평균모형(ARIMA 모형)을 나타낸 것이다. 아래 모형은 ARIMA에서 ARMA로 정상화할 때 몇 번 차분을 하였는가?

=======================================================================

ARIMA(1, 2, 3)

1

1번

2

2번

3

3번

4

4번

23

Multiple Choice

시계열의 요소분해법은 시계열 자료가 몇 가지 변동들의 결합으로 이루어져 있다고 보고 변동 요소별로 분해하여 쉽게 분석하기 위한 것이다. 다음 중 분해 요소에 대한 설명이 부적절한 것은?

1

추세분석은 장기적으로 변해가는 큰 흐름을 나타내는 것으로 자료가 장기적으로 커지거나 작아지는 변화를 나타내는 요소이다.

2

계절변동은 일정한 주기를 가지고 반복적으로 같은 패턴을 보이는 변화를 나타내는 요소이다.

3

순환변동은 경제 전반이나 특정 산업의 부침(ups and downs)을 나타내 주는 것을 말한다.

4

불규칙변동은 불규칙하게 변동하는 급격한 환경변화, 천재지변 같은 것으로 발생하는 변동을 말한다.

24

Multiple Choice

시계열분석 모델링은 크게 모델링에 기반한 방법과 데이터에 기반한 방법으로 나눌 수 있다. 다음 중 시계열 요소에 대한 가정이 없고, 데이터로부터 직접 요소들을 추정하게 되는데 데이터 기반 방법에 대한 설명으로 가장 부적절한 것은?

1

데이터의 패턴이 시간에 따라 자주 바뀌는 경우 유용하게 사용할 수 있는 방법으로 모델이 상대적으로 간단하고 계산량이 많지 않다.

2

이 방법의 장점은 데이터가 가정에 잘 맞을 경우 신뢰성이 있는 예측값을 얻을 수 있다는 것이다.

3

특별한 모형의 형태 없이 데이터로부터 직접 예측값을 추정하는 방법이므로 시계열 내 잡음을 제거함으로써 숨겨진 패턴을 볼 수 있다.

4

단순이동평균법은 데이터가 추세나 계절성을 가질 때 적합한 방법이다.

25

Multiple Choice

아래는 시계열 데이터를 분석하기 위한 절차들이다. 다음 중 시계열 데이터의 분석 절차 분서로 가장 적절한 것은?

======================================================================

시간 그래프 그리기

㉡ 추세와 계절성을 제거하기

㉢ 잔차를 예측하기

㉣ 잔차에 대한 모델 적합하기

예측된 잔차에 추세와 계절성을 더하여 미래를 예측하기

1

㉠-㉡-㉣-㉢-㉤

2

㉠-㉢-㉡-㉣-㉤

3

㉠-㉡-㉢-㉣-㉤

4

㉠-㉣-㉢-㉡-㉤

26

Multiple Choice

다음 중 시계열 데이터에 대한 설명으로 가장 부적절한 것은?

1

시계열 데이터의 모델링은 다른 분석모형과 같이 탐색 목적과 예측 목적으로 나눌 수 있다.

2

짧은 기간 동안의 주기적인 패턴을 계절변동이라 한다.

3

잡음(noise)은 무작위적인 변동이지만 일반적으로 원인은 알려져 있다.

4

시계열분석의 주목적은 외부인자와 관련해 계절적인 패턴, 추세와 같은 요소를 설명할 수 있는 모델을 결정하는 것이다.

27

Multiple Choice

시계열 변동은 다음 4가지로 구분된다. 다음의 보기 중 장기적인 변동에 해당하는 것은?

1

계절변동

2

추세변동

3

순환변동

4

불규칙변동

28

Multiple Choice

시계열의 형태에 대한 다음의 보기 중 옳지 않은 것은?

1

계절변동이 순환변동과 다른 점은 순환주기가 길다는 점이다.

2

불규칙변동은 시계열 자료에서 어떤 규칙성이 없이 예측이 불가능하게 우연적으로 발생하는 변동을 의미한다.

3

추세변동, 순환변동, 계절변동은 체계적 변동에 해당한다.

4

추세변동은 장기적으로 나타나는 추세경향이지만, 순환변동은 대체로 일정한 주기를 두고 순환적으로 나타난다.

29

Multiple Choice

다음 중 다변량 분석에 대한 설명으로 옳지 않은 것은 무엇인가?

1

여러 현상이나 사건에 대한 측정치를 개별적으로 분석하지 않고 한 번에 분석하는 통계적 기법이다.

2

다변량 분포는 평면상의 면적이 아니라 공간상의 입체적 표현이 필요하게 된다.

3

4차원 이상의 데이터를 시각적으로 표현이 가능하다.

4

여러 변인들의 효과를 동시에 분석하기에 종속변인에 대한 효과가 개별평균이 아니라,

여러 변인들 간의 선형조합으로 해석한다.

30

Multiple Choice

다음 중 차원축소를 위한 기법이 아닌 것은?

1

주성분 분석

2

인분석

3

다차원 척도법

4

군집분석

31

Multiple Choice

Question image

아래는 단순회귀분석의 결과이다. 다음 설명 중 옳지 않은 것은?

1

독립변수는 Bodyweight이고, 종속변수는 Height이다.

2

해당 회귀모형은 전체 데이터 변동의 약 64.66%를 설명할 수 있다.

3

상수항과 독립변수 Bodyweight는 통계적으로 유의하다고 판단할 수 있다.

4

Bodyweight 변수가 1 증가하면 Height는 3.2만큼 증가한다.

32

Multiple Choice

다음 중 주성분분석에 대한 설명으로 부적절한 것은?

1

차원축소 방법 중 하나이다.

2

비지도학습(unsupervised learning)에 해당한다.

3

이론적으로 주성분 간 상관관계가 없다.

4

원변수의 선형결합 중 가장 분산이 작은 것을 제1주성분(PC1)으로 설정한다.

33

Multiple Choice

Question image

아래 주성분 분석을 시행한 결과에 대한 설명으로 부적절한 것은?

1

두 번째 주성분은 0.230*Room.Board + 0.812* Books + 0.532* Personal로 계산된다.

2

두 번째 주성분에 가장 큰 영향을 미치는 원변수는 Books이다.

3

Personal 값이 클수록 첫 번째 주성분은 작아진다.

4

첫 번째 주성분과 두 번째 주성분을 이용하면 전체 데이터 변동의 약 20%를 설명할 수 있다.

34

Multiple Choice

Question image

Data는 메이저리그에서 활약하는 263명의 선수에 대한 타자기록으로 연봉(Salary)을 비롯한 17개의 변수를 포함하고 있다. 아래는 17개의 변수들을 사용하여 주성분분석을 시행한 결과이다. 다음 설명 중 잘못된 것은?

1

최소 80% 이상의 분산설명력을 갖기 위해서는 4개 이상의 주성분을 사용해야 한다.

2

가장 큰 분산설명력을 가지는 주성분은 전체 분산의 45.25%를 설명한다.

3

공분산행렬을 사용하여 주성분분석을 시행한 것이다.

4

17차원을 2차원으로 축소한다면 잃게 되는 정보량은 약 30.5%이다.

35

Multiple Choice

차원 감소 방법의 주된 목적은 추출된 데이터에서 적은 수의 특징만으로 특정현상을 설명하고자 하는 것이다. 주성분 분석은 차원 감소의 한 방법인 feature extraction 방법으로, 차원의 단순화를 통해 서로 상관되어 있는 변수들 간 복잡한 구조를 분석하는 것이 목적이다. 다음 중 주성분 분석에 대한 설명으로 부적절한 것은?

1

p개의 변수들을 중요한 m(<P)개의 주성분으로 표현하여 전체 변동을 설명하는 것으로 m개의 주성분은 원래 변수들의 선형결합으로 표현된다.

2

차원 감소폭의 결정은 전체 변이의 공헌도, 평균고유값, scree plot 등을 이용하는 방법이 있다.

3

주성분분석을 이용하는 주된 동기로 언급되는 것 중 차원의 저주가 있다. 데이터의 차원이 증가할 때, 데이터의 구조를 변환하여 불필요한 정보를 최대한 줄이는 차원 감소 방법이 필요하다.

4

변수들이 서로 상관이 있는 경우, 해석상의 복잡한 구조적 문제가 발생하며 이때 변수들 사이의 구조를 쉽게 이해하기 위해 주성분분석이 필요하다.

36

Multiple Choice

Question image

아래는 주성분분석의 결과로 생성되는 biplot이다. 다음 중 설명이 가장 부적절한 것은?

1

Rape의 분산이 가장 크다.

2

첫 번째 주성분과 murder은 음의 상관관계를 가진다.

3

UrbanPop의 첫 번째 주성분이 미치는 영향은 상대적으로 작다.

4

UrbanPop의 두 번째 주성분이 미치는 영향은 다른 원 변수들보다 크다.

37

Multiple Choice

주성분분석은 p개의 변수들을 중요한 m(p)개의 주성분으로 표현하여 전체 변동을 설명하는 방법을 사용한다. 다음 중 주성분 개수(m)를 선택 방법에 대한 설명으로 가장 부적절한 것은?

1

전체 변이 공헌도(percentage of total variance) 방법은 전체 변이의 70~90% 정도가 되도록 주성분의 수를 결정한다.

2

평균 고유값(average eigenvalue)방법은 고유값들의 평균을 구한 후 고유값이 평균값 이상이 되는 주성분을 제거하는 방법이다.

3

Scree graph를 이용하는 방법은 고유값의 크기순으로 산점도를 그린 그래프에서 감소하는 추세가 원만해지는 지점에서 1을 뺀 개수를 주성분의 개수로 선택한다.

4

주성분은 주성분을 구성하는 변수들의 계수 구조를 파악하여 적절하게 해석되어야 하며, 명확하게 정의된 해석 방법이 있는 것은 아니다.

38

Multiple Choice

주성분분석은 차원의 단순화를 통해 서로 상관되어 있는 변수들 간의 복잡한 구조를 분석하는 것이 목적이다. 다음 중 주성분분석에 대한 설명으로 적절하지 않은 것은 무엇인가?

1

회귀분석에서 다중공선성(Multicollinearity)의 문제를 해결하기 위해 활용한다.

2

변수들끼리 상관성이 있는 경우, 해석상의 복잡한 구조적 문제가 발생하는데 이를 해결하기 위해 사용한다.

3

다변량 자료를 저차원의 그래프로 표시하여 이상치(Outlier) 탐색에 사용한다.

4

p개의 변수들을 중요한 mp)개의 주성분으로 표현하여 전체 변동을 설명하는 것으로 m개의 주성분은 원래 변수와는 관계없이 생성된 변수들이다.

39

Multiple Choice

요인분석(Factor analysis)에서 공통성(communality)에 대한 설명으로 옳지 않은 것은?

1

공통성은 변수와 해당 요인간의 상관계수를 나타낸다.

2

요인 적재값의 제곱은 해당 변수가 요인에 의해 설명되는 분산의 비율이다.

3

요인행렬이란 요인들에 대한 모든 변수의 요인 적재값을 모은 행렬이다.

4

고유값은 각 요인에 대한 모든 변수들의 요인 적재값 제곱의 합을 의미한다.

40

Multiple Choice

요인분석과 주성분분석을 비교한 것으로 옳지 않은 것은?

1

주성분분석은 생성된 변수를 제1주성분, 제2주성분 등으로 표현하지만, 요인분석은 분석자가 요인의 이름을 명명한다.

2

요인분석에서는 생성된 변수들이 모두 대등한 관계를 갖는다.

3

주성분분석에서는 기여율은 원 변수의 총 변동(각 변수들의 분산값 총합) 분의 주성분 변수의 분산으로, 총 변동에 대한 주성분의 설명력을 의미한다.

4

요인분석은 목표변수를 고려하여 기존 변수들의 선형 결합으로 이루어진 새로운 잠재변수를 찾아낸다.

41

Multiple Choice

판별분석과 군집분석을 비교한 것으로 옳지 않은 것은?

1

판별분석은 두 개 이상의 모집단에서 추출된 표본들의 정보를 활용하여 이 표본들이 어떤 집단에서 추출된 것인지를 결정할 수 있는 기준을 찾는 분석법이다.

2

군집분석은 그룹들의 특성을 파악하여 새로운 대상이 어디에 속할 것인지를 결정하는데 사용된다.

3

판별분석과 군집분석은 모두 관측값을 분류한다는 공통점을 가지고 있다.

4

군집분석은 동일 집단 내에서는 유사성이 크고, 다른 집단 간에는 차이성이 크도록 데이터를 분류하는 통계기법이다.

42

Multiple Choice

요인분석에 대한 설명으로 옳지 않은 것은?

1

요인분석을 수행하기 위해서는 변수가 간격척도 혹은 비율척도로 측정되어야 한다.

2

요인분석을 통해 생성되는 변수에는 지정된 개수가 없다.

3

요인을 추출하는 방법에는 주성분분석과 공통요인분석이 있다.

4

공통성은 추출된 요인들이 그 변수의 정보(분산)를 얼마만큼 설명할 수 있는지를 의미하며, 0과 100 사이의 값을 가진다.

43

Multiple Choice

다음 설명 중 판별분석에 대한 설명으로 옳지 않은 것은?

1

판별함수는 '집단의 수-1'과 '독립변수의 수' 중 더 큰 값만큼 만들어진다.

2

판별분석은 독립변수가 다변량 정규분포를 이룬다는 가정을 가지고 있다.

3

판별분석을 수행할 데이터의 종속변수에 의해 범주화되는 그룹들의 분산-공분산행렬(variance-covariance matrix)이 동일해야 한다.

4

판별함수에 포함된 독립변수를 선택하기 위한 방법 중 동시입력방식은 모든 독립변수들에 대한 계수를 동시에 계산한다.

44

Multiple Choice

판별분석에서 독립변수의 수가 5이고 집단의 수가 9일때 사용되는 판별식의 수는?

1

3

2

5

3

7

4

9

45

Multiple Choice

다음 중 비모수검정 방법 중 하나로 표본들이 서로 관련되어 있는 경우 짝지어진 두 개의 관찰치 들의 크고 작음을 표시하여 그 개수를 가지고 두 분포의 차이가 있는지에 대한 가설을 검증하는 방법은?

1

런 검정(run test)

2

만 - 위트니의 U검정

3

부호 검정(sign test)

4

스피어만 순위상관계수

46

Multiple Choice

통계적 추론에서 모집단의 모수를 검증하기 위해 사용하는 모수적 방법과 비교하여 비모수적 방법의 특징으로 가장 부적절한 것은?

1

비모수적 검정은 모집단의 분포에 대해 아무런 제약을 가하지 않는다.

2

관측된 자료가 특정 분포를 따른다고 가정할 수 없는 경우에 이용된다.

3

분포 모수에 대한 가설을 설정하지 않고 포의 형태에 대해 가설을 정한다.

4

비모수 검정에서는 관측값의 절대적 크기에 의존하여 평균, 분산 등을 이용해 검정을 실시한다.

47

Multiple Choice

다음 중 비모수 검정 방법으로 부적절한 것은?

1

만 - 위트니 U검정

2

런 검정

3

윌콕슨의 순위합 검정

4

카이제곱 검정

48

Multiple Choice

다음 중 비모수적 추론방법(Nonparametric Inference)에 대한 설명으로 적절하지 않은 것은무엇인가?

1

표본의 크기가 작거나 순서형 자료를 포함하는 범주형 자료에 적용이 가능하다.

2

비모수적 추론은 자료가 정규분포가 아니거나 표본의 크기가 작은 경우, 분포에 대한 가정을 필요로 하지 않는 통계적 기법이다.

3

많은 표본을 추출하기 어려운 경우에 사용하기 적합하다.

4

이상치(Outlier)의 영향이 적으며, 이상치 자료의 파악에 효과적이다.

49

Multiple Choice

짝을 이룬 표본(paired sample)의 t검증과 유사한 비모수 통계기법은?

1

Mann-Whitney 검증

2

Kruskal-Walls 검증

3

Kolmogorov-Smirnov 검증

4

Willcoxon 검증

50

Multiple Choice

Runs 검정은 일련의 연속적인 관측값들이 임의적(random)으로 나타난 것인지를 검정하는 방법으로서 우연성 검정이라고도 한다. 어느 모집단으로부터 15명의 학생들을 표본추출하여 얻은 성별자료는 아래와 같다. 이 때 Runs 검정에 사용되는 런(Run)의 개수는?

========================================================================

남 여 여 여 남 남 여 남 여 여 남 남 여 여

1

7

2

8

3

9

4

10

다음 중 회귀모형의 변수선택 방법으로 사용할 수 있는 것으로 부적절한 것은?

1

모든 가능한 조합의 회귀분석

2

단계적 변수 선택 방법

3

Lasso 회귀분석

4

주성분분석

Show answer

Auto Play

Slide 1 / 50

MULTIPLE CHOICE