데이터 출처 : www.kaggle.com/bappekim/air-pollution-in-seoul
Air Pollution in Seoul
Air Pollution Measurement Information in Seoul, Korea
www.kaggle.com
ipynb file : github.com/sangHa0411/DataScience/blob/main/Seoul_Pollution.ipynb
sangHa0411/DataScience
Contribute to sangHa0411/DataScience development by creating an account on GitHub.
github.com
이번 포스팅을 통해서 서울의 공기 오염도 정도를 분석해보고자 합니다.
Part1 에서는 서울의 각 시의 위도와 경도를 이용해서 Basemap에 표기하는 방법을 정리하고
Part2 에서는 각 시의 서울의 오염정도를 파악해보고자 합니다.
먼저 데이터를 Pandas를 통해서 데이터를 불러오고 데이터의 구조를 파악해봅니다.
서울에는 25개의 시가 있고 위도 경도 등을 비롯한 정보를 가지고 있음을 알 수 있습니다.
각 시에 대한 코드와 이름을 key와 value로 dictionary에 저장하고 확인합니다.
여기서 저희는 각 시의 위도와 경도를 알고 있으니 이를 python의 geopandas를 이용해서 각 위치를 표기할 수 있습니다.
geopandas의 GeoDataFrame를 만들고 이 GeoDataFrame로 된 데이터를 확인하였습니다.
이는 위에 있는 Pandas의 DataFrame과는 차이가 별로 없어 보이지만 간단하게 plot함수를 함으로써 서울에 있는 각 시의 위치가 그려진 것을 확인할 수 있습니다.
이렇게 GeoPandas 이외에도 Python에 있는 Basemap을 이용해서도 각 시의 위치를 그릴 수 있습니다.
먼저 Basemap을 불러오고 왼쪽위의 위도 , 경도를 지정하고 오른쪽 아래의 위도 , 경도를 지정함으로써 한국 지도를 그릴 수 있습니다.
여기서 저희는 한국 내에서 25개의 서울 시를 그리면 너무 좁아서 구별이 되지 않을 테니 서울의 위도 경도를 잡아서 그리고자 합니다.
이제 여기서 각 시의 위도, 경도의 정보를 이용해서 서울 지도 위에 그리고자 합니다.
각 시의 위도 경도를 이용해서 Basemap으로 그려진 지도 위에 표현하기 위해서 각 위도 및 경도가 Basemap의 입력 인자로 들어가서 새로운 위도 경도 위치를 가져와야 합니다.
아래는 그 과정을 작성한 코드입니다.
이제 최종적으로 그리기 위해서 먼저 Basemap을 이용한 서울을 그립니다.
그 다음은 이전에 구한 새로운 X , Y.좌표를 가진 점들을 이용해서 Basemap 위에 표기를 합니다.
그 다음 각 시의 위치에 plt,text를 이용해서 각 시의 이름을 위에 표시되도록 합니다.
이로써 Basemap을 활용한 서울의 각 시를 서울 지도에 표시하는 방법을 알아봤습니다.
다음에는 본 목표인 서울의 공기 오염 정도를 분석해보고 시각화해보는 방벙에 대해서 정리하겠습니다.
'Data Visualization' 카테고리의 다른 글
Data Visualization - US Election Day Tweets 데이터 분석 Part1 (0) | 2020.10.07 |
---|---|
Data Visualization - US Corona 분석하기 Part1 (0) | 2020.10.07 |
Data Visualization - Brexit 투표 결과 분석하기 Part2 (0) | 2020.10.07 |
Data Visualization - Brexit 투표 결과 분석하기 Part1 (0) | 2020.10.07 |
Data Visualization - 서울의 각 시의 공기 오염도 분석 및 시각화 (0) | 2020.10.06 |