Play with Data 2 > Chapter 2. 간식 영양 데이터를 분석해보자

[실습하기] 간식 영양 데이터 분석과 의사결정

 데이터 분석을 통한 의사결정

1. 간식 영양 데이터 시각화하기

표를 통해서 데이터를 보았을 때, 데이터가 어떤 정보를 담고 있는지 한눈에 잘 들어왔나요? 이번에는 그래프를 활용하여 간식 영양 데이터를 분석해보겠습니다.

다음 링크 [http://naver.me/FLS4ab5E]에 접속한 후 코드보기를 클릭합니다. 블록 탭의 ‘데이터분석’ 카테고리에서 ‘테이블 불러오기’를 클릭한 후 간식데이터 테이블을 확인합니다.

1-1. 간식 데이터1 시각화하기

먼저, 간식 데이터1을 그래프로 표현해봅시다.

간식 데이터1이 선택된 상태에서 차트를 누르고, + 표시에서 막대를 선택해줍니다.



막대그래프에서 가로축은 ‘간식 이름’ 계열 값은 단백질, 지방, 탄수화물, 비타민C를 선택해줍니다. 간식 데이터1의 그래프를 보고 알 수 있는 것은 무엇인가요?


워크시트에 간식 데이터1의 그래프를 보고 알게 된 정보를 적어봅시다.

 ▶︎ 세 가지 간식은 탄수화물이 높습니다. 그리고 비타민 C도 높은 것을 확인할 수 있습니다.

다른 간식과도 비교해보겠습니다.


1-2. 간식 데이터2 시각화하기

간식 데이터1의 그래프를 만든 것처럼 간식 데이터2의 그래프도 만들어봅시다. 간식 데이터2의 그래프를 보고 알 수 있는 것은 무엇인가요?


워크시트에 간식 데이터2의 그래프를 보고 알게 된 정보를 적어봅시다.

 ▶︎ 다른 영양소보다 단백질이 높은 것을 확인할 수 있습니다. 특히 오징어가 단백질이 가장 풍부하네요!


1-3. 간식 데이터3 시각화하기

간식 데이터3의 그래프를 보고 알 수 있는 것은 무엇인가요?


 워크시트에 간식 데이터3의 그래프를 보고 알게 된 정보를 적어봅시다.

 ▶ 간식 데이터3은 탄수화물과 지방이 다른 간식에 비해서 높은 편입니다.


2. 간식 영양 데이터 평균 비교하기

간식 데이터1, 2, 3을 비교해보면서 어떤 점을 알게 되었나요? 각 간식 영양 데이터를 따로 따로 보는 것도 좋지만 한 번에 비교해보려면 어떻게 하면 될까요?

우리는 각각의 간식 영양 데이터들의 평균을 내서, 평균을 비교할 수 있습니다. 평균을 사용해서 간식 영양 데이터를 비교해봅시다.

수업 Tip

학습자들이 평균에 대해서 익숙하지 않다면 평균의 정의에 대해서 알려줄 필요가 있습니다. 학습자들에게 평균의 개념과 예시를 함께 알려주시길 바랍니다. 

<네이버 지식백과 – 평균> https://url.kr/2zPWu4

간식별 평균 데이터를 활용해서 데이터들을 서로 비교하려면, 간식 영양 데이터1~3의 평균을 하나의 데이터로 정리해야 합니다.

2-1. 테이블의 정보에서 평균 비교하기

먼저, 간식 데이터1, 2, 3에서 정보를 눌러서 칼로리, 단백질, 지방, 탄수화물, 비타민C의 평균을 확인하고 워크시트에 메모합니다.


2-2. ‘평균비교’ 테이블에 평균 채워 넣기

워크시트에 메모한 내용을 엔트리 ‘평균비교’ 테이블에 직접 채워 넣어봅시다.


2-3. 간식 평균 데이터 시각화하기


간식별 평균 데이터를 모아둔 테이블의 차트를 직접 그려봅시다.


2-4. 평균으로 만든 표와 차트를 보고 알게 된 점 이야기하기

표와 차트를 확인해보며 알게 된 점을 이야기해봅시다. 이야기한 내용을 워크시트에 적어주세요.

간식별 평균 데이터의 표와 차트를 확인해보며 알게 된 점을 이제 발표해보겠습니다.

Q1. 간식의 영양 데이터는 각각 어떻게 구성되어 있었나요?

Q2. 간식 데이터3의 간식을 계속 먹는다면 어떤 일이 생길 수 있을까요?

Q3.건강하게 간식을 먹으려면 어떤 방법이 있을까요?

데이터 엔지니어(Data Engineer)란?

데이터 엔지니어는 특정 기업 혹은 분야에서 데이터를 수집하고 관리하며 유지하는 일을 합니다. 다양한 컴퓨터 프로그램을 활용하여 방대한 데이터를 다루는 기반 환경을 구축하고 운영하는 역할을 담당합니다.


※ 데이터 과학자(Data Scientist)와 데이터 엔지니어(Data Engineer) 차이점은? - 데이터 과학자 : 데이터 속에 숨어있는 가치를 찾는 일을 수행합니다. 주로 수학(통계) 측면을 많이 다룹니다. - 데이터 엔지니어 : 데이터를 활용하는 전체 과정 중에서 특히 앞의 과정(데이터 수집 등), 뒤의 과정(기반 환경 구축, 모델링 등)을 많이 담당합니다. 주로 기술적인 측면을 많이 다룹니다.


데이터 엔지니어 인터뷰 - 이 직업을 어떻게 선택하게 되셨나요?

 

Q. 간단한 자기소개 및 관심 분야에 대해 설명 부탁드립니다.

A. [장은영 님] 네이버 데이터 인사이트 센터에서 근무하고 있는 데이터 엔지니어 장은영입니다. 주로 맡고 있는 업무는 데이터 엔지니어링, 머신러닝/ AI 기반 데이터 모델링입니다. 최근에는 데이터 모델링 기법들과 데이터 처리 속도 개선에 관심이 있습니다.

A. [김광림 님] 네이버 데이터 인사이트 센터에서 근무하고 있는 데이터 엔지니어 김광림입니다. 장은영님과 마찬가지로, 데이터 엔지니어링, 머신러닝/AI 기반 데이터 모델링 업무를 주로 담당하고 있습니다. 데이터로 세상을 보다 정확하게 그려주는 데이터 스토리텔링에 관심이 있습니다.

Q. 데이터 엔지니어는 어떤 일을 하나요?

A. [장은영 님] 우리가 처음에 접하는 데이터는 깔끔한 형태의 것이 아닙니다. 이렇게 데이터가 정리되지 않았 을 때, 데이터에 노이즈(Noise)가 있다고 하는데요. 데이터의 노이즈를 청소하는 과정을 데이터 전처리라고 합니다. 데이터를 분석을 수월하게 하기 위해서는 데이터 전처리 과정을 거쳐야 하는데요. 데이터 엔지니어는 데이터 전처리를 통해 데이터 분석을 수월하게 할 수 있도록 깔끔하게 정리하는 일을 합니다. 마치 매우 지저분한 방을 잘 정리한다고 생각하면 될 거에요. 데이터 과학자가 데이터를 분석하여 가치를 찾아내는 일에 집중한다면, 데이터 엔지니어는 데이터 수집부터 전처리까지 좀 더 포괄적인 역할을 담당합니다.

A. [김광림 님] 저는 수학을 잘하기는 했지만, 수학을 그렇게 좋아하지는 않았습니다. 오히려 이것저것 잡다한 경험들을 많이 쌓았습니다. 저는 컴퓨터 과학을 전공하고, 지금까지 소프트웨어 개발을 해봤습니다. 중간에 IT 분야로 창업도 해보고, 국내외에서 다양한 일을 경험했습니다. 이런 경험들이 현재 직업을 선택하는데 많은 도움을 주었습니다.


Q. 데이터 엔지니어로 진로를 설정하신 이유가 있으신가요?

A. [장은영 님] 저희가 어렸을 때는 데이터 과학자(데이터 사이언티스트)라는 직업이 없었습니다. 저는 기본적으로 수학을 좋아했었고, 컴퓨터에도 관심이 있었습니다. 대학에서는 컴퓨터 과학을, 대학원에서는 자연어 처리를 전공하면서 데이터 분석에 흥미를 가지게 되었습니다. 그리고 네이버의 데이터 인사이트 센터에 입사하면서 데이터 분석을 전문적으로 하게 되었습니다.

 

 A. [김광림 님] 2016년 알파고가 이세돌 9단을 이기는 것을 보면서 새로운 도전을 해보고 싶다는 생각이 문득 들었습니다. 그 때 네이버 데이터랩이나 네이버 클로바로 옮기는 두 가지의 선택지가 있었습니다. AI도 데이터를 기반으로 하기 때문에 좀 더 근본적인 것을 다루는 네이버 데이터랩으로 옮기게 되었습니다.