빅분기필기 4

4_3_2 분석결과 시각화 - 이기적 오답

1. 데이터 시각화 주요 용어 탐색적 자료 분석 (Exploratory Data Analysis) 주어진 자료에 대해서 다양한 탐색기법을 이용해 자료에 대한 충분한 이해를 하는 방법 데이터 셋에 대한 주요 특징을 주로 시각적 방법을 이용해 분석 차트 (Chart) 원그래프, 막대그래프, 선그래프, 면적 그래프 등 데이터의 특성에 따라 다른 종류의 차트를 선택 데이터 셋 (Data Set) 데이터의 집합 축(Axis) 데이터가 표시될 위치에 대한 기준선 2차원 그래프는 2개 3차원 그래프는 3개의 축으로 구성 스케일 (Scale) 그래프에 표현되는 데이터 값의 범위 각각의 축에 일정한 간격을 가짐 범례 (Legend) 차트에 표현되고 있는 기호나 선 등이 어떤 의미인지 설명하는 역할 이상치 (Outlier..

4_1_2 분석모형개선 - 이기적 오답

1. 과대적합 방지를 위한 기법에 해당되지 않는 것 답 : 매개변수 최적화 - 모델과 실제 값의 차이가 손실함수로 표현될 때 손실함수의 값을 최소화하도록 하는 매개변수를 탐색하는 과정이다. 과대적합 방지 드롭아웃 : 신경망 모델에서 은닉층의 뉴런을 임의로 삭제하면서 학습하는 방법 L2 규제 : 규제란 과대적합이 되지 않도록 모델을 제한하는 의미. 손실함수에 가중치에 대한 L2 norm 의 제곱을 더한 패널티를 부여하여 가중치 값을 비용함수 모델에 비해 작게 만듦. L1 규제 : 손실함수에 가중치의 절대값인 L1 norm 을 추가 적용하여 대부분의 특성 가중치를 0 으로 만듦. 2. # SGD : 확률적 경사 하강법(Stochastic Gradient Descent) -손실함수의 기울기를 따라 조금씩 아래..

4_1_1 분석모형평가 - 이기적 오답

1. 암에 대해 양성과 음성 데이터를 분류할 시 예측 경우로 적합한 설명을 고른다면? 1) 양성인데 음성으로 검출되면 False Negative 2) 음성인데 양성으로 검출되면 True Negative 3) 음성인데 음성으로 검출되면 False Negative 4) 양성인데 양성으로 검출되면 False Positive 답 : 1 실제답 true false 예측 true True Positive False Positive 결과 false False Negative True Negative 1) 양성인데 => 실제값 True, 음성으로 검출-> 예측결과 False : False Negative 2) 음성-> 실제값 False , 양성을 검출-> True : False Positive 3) 음성-> 실제값 F..

3_2_2 고급 분석기법 - 이기적 오답

1. 자료의 형태에 따른 분석방법 독립변수 종속변수 분석방법 범주형 범주형 빈도분석, 카이제곱검정, 로그선형모형 연속형 범주형 로지스틱 회귀분석 범주형 연속형 T검정(2그룹), 분산분석(2그룹이상) 연속형 연속형 상관분석, 회귀분석 2. 범주형 분석방법에 대한 설명 1) 빈도분석 : 질적 자료를 대상으로 빈도와 비율을 계산할 때 쓰인다. 2) 로지스틱분석 : 분석하고자 하는 대상들이 두 집단 또는 그 이상의 집단으로 나누어진 경우 개별 관측치들이 어느 집단으로 분류될 수 있는지를 분석할 때 사용한다. 3) 카이제곱검정 : 두 범주형 변수가 서로 상관이 있는지 독립인지 판단하는 통계적 검정방법이다. 4) T 검정 : 독립변수가 범주형(두개의 집단)이고 종속변수가 연속형인경우 사용되는 검정 방법으로 두 집단..