Play with Data 2 > Chapter 4. 해양쓰레기 데이터를 분석해보자!

[실습하기] 해양쓰레기 수거 데이터를 분석해볼까요?

 수거사업 확인하고 의사결정하기

1. 해안쓰레기가 환경에 주는 영향 확인하기

 

앞에서 살펴본 것처럼 해안쓰레기에는 플라스틱, 종이, 목재, 금속 등 다양한 유형(종류)이 있습니다. 다양한 해안쓰레기는 환경에 어떠한 영향을 줄까요?




 


출처 : 해양환경정보포털 https://www.meis.go.kr

 <워크시트>

가. 해안쓰레기 유형에 따라 환경에 미치는 영향을 조사해봅시다. 특히 플라스틱은 환경에 어떠한 영향을 주는지 조사해봅시다. 조사한 내용을 정리해봅시다.

나. 조사한 결과와 느낀 점을 정리해봅시다. - 조사한 결과 : - 느낀 점 :


우리가 사용하고 버리는 쓰레기, 방치되는 선박, 양식 어장에서 발생하는 쓰레기 등으로 해양생태계가 파괴되고 있습니다. 여러 가지 정보를 확인하며 해양, 해안쓰레기로 인한 환경오염의 심각성을 알았나요? 우리는 환경오염을 해결하기 위해 어떤 노력을 하고 있을까요?


2. 수거사업 현황 확인하기

국가와 지방자치단체는 해양쓰레기 문제를 해결하기 위해 여러 가지 수거사업을 하고 있습니다. 이제 해양쓰레기 수거사업을 데이터를 통해 확인해봅시다. 표를 보고 알 수 있는 정보를 이야기해봅시다.

 <워크시트>

 






출처 : 해양환경정보포털 https://www.meis.go.kr

막대그래프로 시각화하여 데이터를 확인해 봅시다. 연도별로 수거량은 어떻게 변하고 있나요?



 <워크시트>

해양쓰레기 수거량을 확인하고 그래프로 표현해봅시다.


지금까지 살펴본 해양쓰레기 데이터를 정리해볼까요? 엔트리봇은 위기를 탈출하기 위해 용왕님께 해양쓰레기 데이터에 대해서 어떻게 설명을 하면 될까요? 

연도별 해양쓰레기 추정량 (16p 그래프)

 

연도별 해양쓰레기 수거량 (22p 그래프)

 


 <워크시트>

연도별 해양쓰레기 추정량 및 수거량 그래프를 보고 연도가 지남에 따라 데이터가 어떻게 변하고 있나요? 아래 빈칸을 채워봅시다. => 해양쓰레기 추정량은 ( 대체적으로 줄어들고 있습니다. ) => 해양쓰레기 수거량은 ( 대체적으로 늘어나고 있습니다. )


 

한편, 해양오염 때문에 용왕님이 병들었다고 주장한 엔트리봇은 해양쓰레기 추정량 데이터가 줄어드는 추세를 보고 용왕님에게 둘러댈 이야기가 없어졌습니다. 엔트리봇은 자신의 간을 빼앗길 생각에 눈을 질끈 감았습니다. 그런데, 데이터 그래프를 보고 해양쓰레기가 줄어들고 있다는 사실에 크게 감동한 용왕님은 엔트리봇을 살려주기로 했습니다. 그리고 엔트리봇을 해양쓰레기를 수거하는 환경미화원으로 임명했습니다. 엔트리봇이 열심히 쓰레기를 수거해 바다는 깨끗해졌고 용왕님은 자연스럽게 건강을 되찾을 수 있었습니다.



3. 해양 환경 보호를 위한 노력에 대해 토의하고 의사결정하기

현재까지 사용한 데이터를 바탕으로 ‘해양 환경보호를 위해 어떤 노력을 해야 할지’ 의사결정을 해봅시다. 데이터가 더 필요한 경우 인터넷 검색을 통해 찾아봅시다.


 

 쉬어가기(2) - 실시간 검색 데이터 이해하기

검색을 통해 데이터를 찾을 때는 네이버 실시간 검색을 참고할 수 있습니다. 네이버 데이터랩(https://datalab.naver.com)에 접속해봅시다.

네이버 실시간 급상승 검색어는 실시간으로 검색량이 급증한 검색어 순위를 보여주는 서비스입니다. 네이버 실시간 급상승 검색어 서비스를 제공하기 위해 순위를 계산하는 공식은 매우 복잡한데요, 실시간으로 쏟아지는 검색 데이터를 어떻게 분석해서 실시간 급상승 검색어를 만들어내는지 알아봅시다.

1. 사람들이 많이 검색하면 실시간 급상승 검색어가 될까요?

그렇지 않습니다. 사람들이 네이버에서 평소에 많이 검색하는 단어는 실시간 급상승 검색어가 되지 않아요. 예를 들어 ’날씨'는 사람들이 늘 많이 검색하기 때문에 실시간 급상승 검색어가 되지 않아요. 대신 사람들이 갑자기 많이 검색하는 단어가 실시간 급상승 검색어가 되는데요, 이를 어떻게 계산할 수 있을까요? 예를 들어봅시다. 한달 용돈이 5,000원에서 10,000원으로 오른 철수와 10,000원에서 15,000원으로 오른 영희가 있습니다. 둘 다 용돈이 5,000원씩 올랐지만 철수의 용돈은 2배가 된 반면 영희의 용돈은 1.5배가 되었지요? 즉, 용돈의 증가율은 영희보다 철수가 더 높습니다. 마찬가지로 특정 단어에 대하여 오후 2시의 검색량과 오후 3시의 검색량을 비교하였을 때 증가율이 높은 단어를 실시간 급상승 검색어로 만듭니다.

2. 같은 사람이 짧은 시간 동안 같은 검색어를 두 번 이상 입력할 경우에는 어떻게 할까요?

개인이 같은 단어를 계속해서 검색하면 그 단어가 실시간 급상승 검색어에 올라갈까요? 그렇지 않습니다. 같은 사람이 짧은 시간동안 같은 검색어를 두 번 이상 입력할 경우, 한번 입력한 것과 동일하게 계산합니다. 따라서 개인이 실시간 급상승 검색어를 조작하기는 어려워요.

3. 이미 실시간 급상승 검색어 차트에 올라와 있는 것을 클릭한 것은 횟수에 포함될까요?

실시간 급상승 검색어 차트에 올라와 있는 것을 클릭한 것은 검색 횟수가 포함되지 않아요. 많은 사람들이 실시간 급상승 검색어 차트를 보고 클릭하면 한번 1위를 한 것이 계속 1위가 되지는 않을까요? 그렇다면 새로운 내용이 실시간 급상승 검색어로 나타나기 어려워요. 직접 검색창에 입력한 것만 검색 횟수에 포함됩니다.


간단한 줄 알았던 네이버 실시간 검색어, 자세히 들여다보니 매우 복잡하지요? 이렇게 데이터 분석을 정확하게 하기 위해서는 많은 것들을 고려해야 합니다. 눈에 보이지는 않지만 네이버의 빅데이터 전문가들이 네티즌에게 필요한 정보를 정확하게 제공하기 위해 노력하고 있답니다.