Play with Data 2 > Chapter 1. 데이터과학이란 무엇일까요

[따라하기] 데이터 과학으로 친해져보자!

 데이터 과학으로 친해져보자!

1. 친구들의 데이터 수집하기

그래서 이번 시간에는 친구들의 정보를 수집하면서 친해지는 시간을 가져봅시다. 먼저, 우리 반 친구들의 정보를 수집해보겠습니다.


수업 Tip 

본 활동은 데이터 수집 활동이기도 하지만, 처음 만나는 학생들을 빠르게 친해지게 만들기 위한 아이스브레이킹 활동입니다. 학습자들이 활동에 적극적으로 참여할 수 있도록, 일어나서 움직일 수 있게 해주세요. 온라인 상황에서는 소그룹을 3~4명씩 만들어서, 서로의 정보를 물어보게 하고 소그룹을 5분마다 바꾸는 방식으로 진행 할 수 있습니다. 이때는 엑셀 형태로 학습지를 만들어서 학생들에게 제공하여야 합니다. 

* 미션: 우리 반 친구들의 정보를 수집해보자!

 

 <수집방법>

1) 워크시트를 들고 돌아다니며, 다른 친구와 인사합니다.

2) 인사한 다음 워크시트에 적어야 하는 내용에 대해 질문합니다.

3) 워크시트에 친구가 말해준 답변을 적습니다.

4) 모든 친구들의 정보를 수집할 때까지 돌아다닙니다.

5) 선생님의 정보도 수집합니다.


워크시트를 활용해서 우리 반 친구들의 정보를 수집해봅시다. 우리 반 학생들의 이름, 생일, 좋아하는 색깔, 머리 카락 색, 성별, 좋아하는 과목, 좋아하는 동물을 중심으로 수집해봅시다.


 


2. 친구들의 데이터 분석(시각화)하기

수집된 우리 반 친구들의 데이터에 대해서 질문을 만들어봅시다. 예를 들어 우리 반 친구들의 생일이 가장 많은 달은 무엇인가요? 혹은 우리 반 친구들이 가장 좋아하는 과목은 무엇인가요? 아래와 같은 질문이 있을 수 있겠네요.

 

워크시트에 친구들의 데이터에 대한 질문을 적어봅시다.

 

데이터와 관련해서 다양한 질문들을 만들 수 있습니다. 질문들에 대한 답변을 하기 위해 우리는 데이터를 분석 해보아야 합니다. 데이터를 분석하기 위해서는 데이터를 표현할 수 있어야 하는데요. 데이터를 표현하는 방식은 크게 표와 그래프가 있습니다. 이때 그래프를 만드는 것을 데이터 시각화라고 합니다.

<데이터 시각화> 막대 그래프를 통해 데이터를 시각화해봅시다.

그럼 데이터를 시각화하는 방법을 함께 체험해봅시다. 이번에는 데이터 시각화 방식 중에 막대그래프에 대해서 알아보겠습니다. 막대그래프는 데이터를 막대 형태로 표시하는 것입니다. 먼저, 아래 표를 살펴봅시다.

 

표에는 친구들이 좋아하는 동물에 대한 데이터가 적혀있습니다. 위에서부터 코끼리를 좋아하는 학생이 8명, 기린을 좋아하는 학생이 3명, 사자를 좋아하는 학생이 5명입니다. 전체 학생은 16명이네요. 그럼 이 표를 막대그래프로 그려보겠습니다.

 

막대그래프로 이렇게 표현할 수 있습니다.

이번에는 여러분들이 조사한 데이터를 막대 그래프로 시각화해봅시다. 생일 데이터를 활용해서 워크시트에서 막대 그래프를 그려봅시다.

- 가로는 1월부터 12월을 나타내도록 해봅시다. - 세로는 생일인 사람의 수를 표시해봅시다.

 

데이터를 표로 볼 때와 시각화해서 볼 때는 어떤 차이점이 있었나요? 워크시트에 알게 된 점을 적고 발표해봅시다.


데이터를 표로 볼 때는 숫자를 자세하게 볼 수 있지만, 한 눈에 모든 데이터를 파악하기 어렵습니다. 데이터를 시각화해서 볼 때는 한 눈에 모든 데이터를 볼 수 있고, 데이터의 특징을 쉽게 파악할 수 있습니다. 그러나 하나하나의 숫자를 자세히 보기는 어렵습니다. 그래서 우리는 표와 시각화된 자료를 함께 보면서 데이터를 살펴볼 필요가 있습니다.



 데이터 윤리 - 데이터 3법과 개인정보보호

2020년 8월 데이터 3법이 본격적으로 시행되면서, 우리나라에서도 개인정보를 상업적으로 이용할 수 있게 되었습니다. 이제 우리는 물건을 구매할 때 만들어진 데이터를 은행에 제공해 맞춤형 서비스를 받거나, 건강·신체 정보를 건강관리 업체에 넘겨 활용할 수 있습니다.

미국은 이미 2011년부터 개인정보를 기업이 자유롭게 이용할 수 있도록 하고 있습니다. 미국의 IT 회사인 애플은 헬스앱을 통해 의료 기관의 개인정보를 다운로드 받아 저장하고 이 정보를 다른 건강앱과 공유해 활용하는 기능을 서비스하고 있죠.

그러나 데이터를 통해 개인 맞춤형 서비스 시대가 열릴 것이라는 기대감과 함께 부작용에 대한 우려도 큽니다. 빅데이터를 활용하는 과정에서 개인의 정보가 유출되어, 심각한 개인정보 침해가 될 수 있습니다.


 

데이터는 21세기 석유라고 불립니다. 그러나 데이터가 차별이나 통제의 수단이 아니라 모두에게 도움이 될 수 있게 하려면, 적절한 감시와 독려가 모두 필요합니다.

데이터 라이즈의 김성무 대표는 개인정보를 암호화하여 보관하는 것이 중요하다고 합니다. 그리고 데이터가 외부에 유출되었을 때, 피해를 보는 사람들이 어떠한 피해를 받을지 항상 생각하면서 데이터를 다뤄야 한다고 합니다.

“데이터는 숫자로만 보면 안 되고, 데이터 너머의 사람을 보는 것이 중요합니다.”

데이터는 21세기 석유라고 불립니다. 그러나 데이터가 차별이나 통제의 수단이 아니라 모두에게 도움이 될 수 있게 하려면, 적절한 감시와 독려가 모두 필요합니다.