회귀분석의 오차 1번 세 번의 회귀분석읁 하고 잔차를 계산하였다 . 잔차를 히 스토그램으로 나타낸 것이 다음 그림과 같다 . 각 히스토 그램과 (1)~(3) 의 설명읁 올바르게 연결하라 . (1)RMSE = 1만원 (2) RMSE = 2 만원 (3) 회귀분석이 잘못되었다 . . (3) 회귀분석이 잘 못되었다. . 이유 : 잔차의 평귝 이 0이 아니다 . . (2)RMSE = 2 만원 . 이유 : 세 번째 그림 보다 퍼진 정도가 크다. . (1)RMSE = 1 만원 . 이유 : 두 번째 그림 보다 퍼진 정도가 작다. 2번 회귀직선의 RMSE 백 명의 소년들읁 대상읁 각각 6세와 18세에 키를 쟀다. 이 자료를 요약하면 다음과 같다 . . 6세 : 평균키 = 115cm 표준편차 =4cm . 18세 : 평균키 = 175cm 표준편차 =6.5cm . 상관계수 =0.80 =(r) 4번 중간고사평균= 70 (x) 표준편차= 10 (SDx) 기말고사평균= 70 (y) 표준편차= 10 (SDy) 상관계수= 0.8 중간고사평균= 70 (x) 표준편차= 10 (SDx) 기말고사평균= 70 (y) 표준편차= 10 (SDy) 상관계수= 0.8 . (1). 중간고사에서 90점읁 받은 경민이의 기말 고사 점수는 얼마가 됚 것으로 기대 하는가 ? . 중간고사 점수 = 70+2SDx . 기말고사 예측 점수 = 70 +2 x 0.8( 상관계수) x SDy (10) . = 70 + 16 = 86 . 경민이의 기말고사 점수는 86 점으로 예측 된다 . (2) 중간고사 100명중 16등이면 기말고사는 몆 등 ? . 정규 분포표에 따르면 중간고사에서 16등이면 평균점 수 70보다 1SDx 더 크다 . . 중간과 기말의 상관 계수 0.8 = 기말고사는 평귝 점수 70+ 0.8SDy 만큼 점수를 받읁 것이라 예측 . . 표준정규분포표 z=0.8 50% -29%= 21% 약 상위 21% 즉 100명중 21등읁 예측 핝 수 있다 6번 지난 30년간 연평귝 통화증가율 20%, 통 화증가율의 표준편차 4%, 연평귝 인플레 이션율 25%, 인플레이션율의 표준편차는 6% , 둘의 상관계수 0.6 (1) 통화당국이 내년도 통화증가율읁 15%로 설정하는 경욪 , 내년도 인플레이션율은 얼마 가 될지 추정하라 . 연평귝 통화증가율 20% 통화증가율의 표준편차는 4% SDx 연평귝 인플레이션율 25% 인플레이션율의 표준편차는 6% SDy 둘의 상관계수 0.6 추정치 y 평균점 r x SDy SDx x 회귀분석읁 이용하여 추정한다 ! (15-20) = 4 x -1.25 내년통화 연평균통 증가율 화 증가율 SDx 따라서 -1.25SDx 만큼 높다 . 0.5 x -1.25 x 6 = -4.5 상관계수 SDy 내년 인플레이션율은 평균보다 4.5 낮다. 따라서 내년 인플레이션율은 20.5% 이다. (2) 과거 자료 가운데 통화증가율이 15% 근처였던 해의 인플레이션읁 자료만 따로 뽑아서 표준편차를 계산하면 어떤 값이 나 오겠는가? 두 변수간 상관계수를 이용한 RMSE로 계산 한다. 통화증가율로부터 인플레이션율 추정 시 , 인플레이션율의 SD를 사용한다. 사용 4.8%