[Session 01] 숫자 예측
숫자 예측
학습 목표
인과관계 또는 선형관계를 가지는 숫자 자료를 학습하여 예측 값을 계산할 수 있다.
문제 해결 상황
우리학교 대표 육상선수 키가 170cm 라고 하는데, 그 친구의 몸무게는 얼마나 될까?
문제 해결 방법
우리 학교 학생의 키와 몸무게는 선형관계를 가지고 있다. 우리 학교 학생 자료를 학습하여 예측한 회귀식으로 육상선수의 몸무게를 예측해 본다. 이미 알고 있는 설명변수 키 값에 의해 몸무게를 예측하는 것이므로, 예측속성은 몸무게 이다.
1-1 인공지능 예측 모델 학습하기
|
1) 데이터분석과 테이블 불러오기를 이용하여 앞 장에서 사용된 몸무게와 키 자료를 그대로 사용한다. |
|
2) ‘데이터분석’ 카테고리를 클릭한 후 ‘데이터 불러오기’ 버튼을 누른다. |
3) 숫자 데이터를 가지고 예측하고자 하는 문제이므로, 예측:숫자를 선택한다.
4) 테이블을 선택해주세요 메시지 옆의 데이터 입력 펼침버튼을 이용하여 데이터를 선택하고 나면, 자료의 열(변수)명이 나타난다.
5) 핵심 속성에 원인이 되거나 설명이 되는 변수를 추가하고, 예측 속성에 예측하고자 하는 변수를 선택한다. 즉, 핵심속성에는 키를 선택하고, 예측 속성에는 몸무게를 선택한다. 그리고 오른쪽의 모델학습하기를 누르면 학습이 시작된다. |
6) 학습이 완료되면 오른쪽에 산점도 차트와 그 아래 추정 회귀식이 계산되어 있다. 산점도 안에 직선이 바로 추정회귀식이며, 이 추정 회귀식에 의하면 키의 값에 0.83배하고 76.32를 빼면 몸무게를 예측할 수 있다는 뜻이다. |
|
7) 모델학습하기 버튼 아래 학습이 완료되었습니다 부분을 클릭하면 인공 지능 학습조건(세대: 30, 배치크기: 16, 학습률: 0.03, 검증 데이터 비율:0.25)이 펼쳐져서 세부 값을 볼 수 있다. |
8) 이때 학습 조건에 대한 설명은 엔트리에서 다음과 같이 이해하기 쉽게 제공하고 있다.
9) 학습을 완료했습니다 옆의 조건 버튼을 누르면 차트가 나오면서, 학습 세대(가로축)를 반복할 때마다 계산되는 loss(손실함수)와 val_loss(검증손실함수) 그래프를 제공한다. 세로축의 손실함수는 테스트 자료에 대한 예측값과 결과값의 차이를 제곱한 평균값(MSE)으로써, 값이 작을수록 예측력이 좋고 모델이 정확하다고 할수 있다. 그래프에 마우스를 가져다 대면 구체적인 값을 팝업으로 보여준다.
1-2 엔트리 프로그래밍
남학생 오브젝트가 추정 회귀식으로부터 예측 몸무게를 계산하여 말하도록 한다. 이때 결정계수 값도 제공하도록 코딩하는데, 결정계수 값은 1에 가까울수록 예측 값의 정확도가 높다고 할 수 있다.