[Session 01] 숫자 예측
숫자 예측
학습 목표
인과관계 또는 선형관계를 가지는 숫자 자료를 학습하여 예측 값을 계산할 수 있다.
문제 해결 상황
우리학교 대표 육상선수 키가 170cm 라고 하는데, 그 친구의 몸무게는 얼마나 될까?
문제 해결 방법
우리 학교 학생의 키와 몸무게는 선형관계를 가지고 있다. 우리 학교 학생 자료를 학습하여 예측한 회귀식으로 육상선수의 몸무게를 예측해 본다. 이미 알고 있는 설명변수 키 값에 의해 몸무게를 예측하는 것이므로, 예측속성은 몸무게 이다.
1-1 인공지능 예측 모델 학습하기
|   | 1) 데이터분석과 테이블 불러오기를 이용하여 앞 장에서 사용된 몸무게와 키 자료를 그대로 사용한다. | 
|   | 2) ‘데이터분석’ 카테고리를 클릭한 후 ‘데이터 불러오기’ 버튼을 누른다. | 
3) 숫자 데이터를 가지고 예측하고자 하는 문제이므로, 예측:숫자를 선택한다.
 
4) 테이블을 선택해주세요 메시지 옆의 데이터 입력 펼침버튼을 이용하여 데이터를 선택하고 나면, 자료의 열(변수)명이 나타난다.
 
| 5) 핵심 속성에 원인이 되거나 설명이 되는 변수를 추가하고, 예측 속성에 예측하고자 하는 변수를 선택한다. 즉, 핵심속성에는 키를 선택하고, 예측 속성에는 몸무게를 선택한다. 그리고 오른쪽의 모델학습하기를 누르면 학습이 시작된다. | 
| 6) 학습이 완료되면 오른쪽에 산점도 차트와 그 아래 추정 회귀식이 계산되어 있다. 산점도 안에 직선이 바로 추정회귀식이며, 이 추정 회귀식에 의하면 키의 값에 0.83배하고 76.32를 빼면 몸무게를 예측할 수 있다는 뜻이다. | 
|   | 7) 모델학습하기 버튼 아래 학습이 완료되었습니다 부분을 클릭하면 인공 지능 학습조건(세대: 30, 배치크기: 16, 학습률: 0.03, 검증 데이터 비율:0.25)이 펼쳐져서 세부 값을 볼 수 있다. | 
8) 이때 학습 조건에 대한 설명은 엔트리에서 다음과 같이 이해하기 쉽게 제공하고 있다.
 
9) 학습을 완료했습니다 옆의 조건 버튼을 누르면 차트가 나오면서, 학습 세대(가로축)를 반복할 때마다 계산되는 loss(손실함수)와 val_loss(검증손실함수) 그래프를 제공한다. 세로축의 손실함수는 테스트 자료에 대한 예측값과 결과값의 차이를 제곱한 평균값(MSE)으로써, 값이 작을수록 예측력이 좋고 모델이 정확하다고 할수 있다. 그래프에 마우스를 가져다 대면 구체적인 값을 팝업으로 보여준다.
 
1-2 엔트리 프로그래밍
남학생 오브젝트가 추정 회귀식으로부터 예측 몸무게를 계산하여 말하도록 한다. 이때 결정계수 값도 제공하도록 코딩하는데, 결정계수 값은 1에 가까울수록 예측 값의 정확도가 높다고 할 수 있다.