데이터 출처 : www.kaggle.com/imdevskp/corona-virus-reporti
COVID-19 Dataset
Number of Confirmed, Death and Recovered cases every day across the globe
www.kaggle.com
ipynb file : github.com/sangHa0411/DataScience/blob/main/Covid-19%20Day%20Analysis.ipynb
sangHa0411/DataScience
Contribute to sangHa0411/DataScience development by creating an account on GitHub.
github.com
이번 포스팅에서는 2020 1월 말부터 2020 7월 말 까지 코로나 확진자 , 사망자 및 회복자의 수를 그래프로 그려보는 matplotlib의 animation기능을 이용해보겠습니다.
먼저 데이터를 Pandas를 이용해서 불러오겠습니다.
각 날짜와 코로나 확진자 , 사망자 , 회복한 사람 등의 데이터가 있는 것을 확인할 수 있습니다.
저는 이번 데이터 분석에서 Date , Confirmed , Deaths , Recovered 데이터만을 이용하였습니다.
위 Date항목을 보시면 2020-01-22부터 2020-07-27까지 데이터가 있는 것을 확인할 수 있습니다.
여기서 Xlabel에 모든 날짜를 표기하면 Text가 겹쳐서 오히려 알아보기 어려워지므로 매달 특정 날짜에만 label이 표기 되도록 새롭게 Xlabel을 만듭니다.
이제 animation으로 만들기 이전에 전체 데이터를 그래프로 시각화 해보겠습니다.
오랜지 색은 확진자 수 붉은 색은 사망자 수 파란색은 회복한 사람으로 색을 설정하고 그래프를 그렸습니다.
이제 이를 animation으로 만들어 보겠습니다.
animation에 대해서는 아래의 참고자료에 설명이 잘 되어있습니다.
towardsdatascience.com/animations-with-matplotlib-d96375c5442c
Animations with Matplotlib
Animations are an interesting way of demonstrating a phenomenon. We as humans are always enthralled by animated and interactive charts…
towardsdatascience.com
그리고 이전에 했던 포스팅에서도 animation에 대해서 다루었었습니다. 비교해서 보시면 이해하시기 편하실 것입니다.
electronicprogrammers.com/31?category=893647
Data Visualization - US Corona 분석하기 Part2
데이터 출처 : www.kaggle.com/fireballbyedimyrnmom/us-counties-covid-19-dataset US counties COVID 19 dataset NYT's github CSV on COVID19 per US counties www.kaggle.com ipynb file : github.com/sangH..
electronicprogrammers.com
먼저 저희가 해야할 일은 animation을 구현하기 위한 라이브러리를 불러와야 한다는 것입니다.
그리고 jupyter notebook에서 animation을 보기 위해서 matplolib설정을 notebook으로 변경합니다.
아래는 animation으로 구현한 코드입니다.
먼저 확진자 수 , 사망자 수 , 회복자 수 의 데이터를 저장할 ax.plot을 미리 선언합니다.
그리고 FuncAnimation의 함수의 인자로 저희가 animate(i) 함수를 저희가 정의해서 입력해야 합니다.
그러면 i가 0 부터 frames = 180까지 1씩 증가하면서 반복 수행됩니다.
따라서 저는 i를 맨 처음에 불러온 Pandas 데이터의 인덱스로 설정하고 구현하였습니다.
i 를 인덱스라고 생각해서 먼저 날짜를 파악합니다. 그리고 매달의 25일이면 그래프에 표기하도록 하고 아니면 그냥 표기 하지 않도록 합니다.
그리고 해당 인덱스의 확진자수 , 사망자 수 , 그리고 회복자수의 정보를 파악해서 미리 만든 ax.plot에 저장을 합니다.
그리고 Xlabel의 표기를 변경해줍니다.
최종 결과는 아래와 같습니다.
'Data Visualization' 카테고리의 다른 글
Data Visualization - GeoPandas 이용해서 샌프란시스코 범죄 데이터 시각화하기 Part2 (0) | 2020.10.20 |
---|---|
Data Visualization - 샌프란시스코 범죄 데이터 시각화하기 Part1 (0) | 2020.10.20 |
Data Visualization - US Corona 분석하기 Part2 (0) | 2020.10.10 |
Data Visualization - US Election Day Tweets 데이터 분석 Part1 (0) | 2020.10.07 |
Data Visualization - US Corona 분석하기 Part1 (0) | 2020.10.07 |