Category 74

Python - Basemap 이용하는 방법

데이터 출처 : www.data.go.kr/tcs/dss/selectFileDataDetailView.do?publicDataPk=3038489 공공데이터 포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase www.data.go.kr 이번 포스팅에 대해서는 제가 그리고자 하는 부분을 Basemap 을 이용해서 출력하는 방법과 이 지도 위에 데이터를 시각화하는 방법에 대해서 정리해보도록 하겠습니다. 저는 위 공공데이터 포털에서 2019년에 일어난 교통사고 데이터를 이용해보도록 하겠습니다. 먼저 Pandas를 이용해서 데이터를 불러오겠습니다. 그리고 Basema..

Python 2020.11.08

Deep Learning - 딥러닝의 활성화 히트맵 시각화하기

이번 포스팅에서는 이미 훈련된 CNN의 활성화를 파악하는 방법 중 하나인 히트맵 시각화하는 방법에 대해서 정리해보도록 하겠습니다. 이 방법으로 저희는 이미지의 어느 부분이 CNN의 최종 분류 결정에 기여하는 가에 대해서 파악할 수 가 있습니다. 먼저 히트맵을 시각화하기 이전에 이미 훈련된 CNN 모델 중 하나인 VGG16 모델을 가져오도록 하겠습니다. from keras.applications.vgg16 import VGG16 from keras.preprocessing import image from keras.applications.vgg16 import preprocess_input , decode_predictions 그리고 이 모델을 이용해서 히트맵을 그리고자 하는 예시 사진을 하나 가져오겠습니..

Deep Learning 2020.11.08

Deep Learning - Keras를 이용해 CNN 설계 및 학습시키기

데이터 출처 : www.kaggle.com/tongpython/cat-and-dog Cat and Dog Cats and Dogs dataset to train a DL model www.kaggle.com github 주소 : github.com/sangHa0411/DataScience/blob/main/CNN_Example.ipynb sangHa0411/DataScience Contribute to sangHa0411/DataScience development by creating an account on GitHub. github.com 이번 포스팅에서는 CNN을 설계하는 과정을 정리해보도록 하겠습니다. 대표적인 이미지 분류 문제로 여겨지는 Cats and Dogs 문제를 다루어보겠습니다. 먼저 o..

Deep Learning 2020.11.08

Python - WordCloud 만들고 시각화하기

이번에는 WordCloud 라이브러리를 이용해서 WordCloud를 만들어보고 출력해보는 과정을 정리해보도록 하겠습니다. 먼저 데이터를 Pandas를 이용해서 불러오겠습니다. 위 데이터는 넷플릭스에 영화 및 TV 시리즈에 대한 정보가 들어있는 데이터입니다. 저는 여기서 Crime TV Shows 장르만을 추출하고 그에 대한 설명을 가지고 WordCloud를 만들어 보겠습니다. 아래는 Crime TV Shows 를 장르로 가지는 Content만을 추출하는 과정입니다. 이제 위 추출된 데이터만을 이용해서 WordCloud를 본격적으로 만들어보겠습니다. crime_String = [] for string in crime_df['description'] : crime_String.append(string) cr..

Python 2020.11.07

Python - Plotly를 이용해서 데이터 시각화하는 방법

github 주소 : github.com/sangHa0411/DataScience/blob/main/Amazon_BestSellers_Plotly.ipynb sangHa0411/DataScience Contribute to sangHa0411/DataScience development by creating an account on GitHub. github.com 이번 포스팅에서는 matplotlib , seaborn 과 더불어서 많이 사용되는 plotly 라이브러리를 활용해서 데이터 시각화하는 방법에 대해서 정리해보겠습니다. plotly 라이브러리가 가지는 장점은 interacitve , 즉 상호작용이 가능하다라는 것인데 정리하면서 이러한 점을 확인해보겠습니다. 먼저 Pandas를 이용해서 데이터를 불..

Python 2020.11.06

Python - Seaborn을 이용해서 Heatmap을 그려보기

github 주소 : github.com/sangHa0411/DataScience/blob/main/Amazon_BestSellers_Seaborn.ipynb sangHa0411/DataScience Contribute to sangHa0411/DataScience development by creating an account on GitHub. github.com 아래는 Heatmap에 대한 참고자료에 대한 내용입니다. x , y 모두 이산적인 속성으로 정하고 색깔을 연속적인 속성으로 정함으로써 어디 칸의 색깔이 가장 짙은지를 혹은 색깔이 옅은지를 쉽게 파악할 수 있습니다. seaborn 을 이용한 데이터 시각화 방법 : electronicprogrammers.com/71?category=904280 ..

Python 2020.11.05

Python - Seaborn을 이용해서 데이터 시각화하는 방법

github 주소 : github.com/sangHa0411/DataScience/blob/main/Amazon_BestSellers_Seaborn.ipynb sangHa0411/DataScience Contribute to sangHa0411/DataScience development by creating an account on GitHub. github.com 저번 포스팅에서는 matplotlib을 이용해서 데이터를 시각화를 해보았습니다. 이번 포스팅에서는 seaborn을 이용해서 데이터를 시각화해볼 것이며 어떻게 이용하는지 그리고 matplotlib과 비교해서 어떠한 점이 좋은지 정리해보도록 하겠습니다. matplotlib 포스팅 주소 : electronicprogrammers.com/70?cat..

Python 2020.11.05

Python - Matplotlib을 이용해서 데이터 시각화 하는 방법

github 주소 : github.com/sangHa0411/DataScience/blob/main/Amazon_BestSellers_Matplotlib.ipynb sangHa0411/DataScience Contribute to sangHa0411/DataScience development by creating an account on GitHub. github.com 이번 포스팅에서는 matplotlib을 이용하는 방법을 자세하게 정리하여서 데이터를 시각화하면서 matplotlib을 사용할 때 어떻게 해야하는지에 대해서 정리해보도록 하겠습니다. 먼저 Pandas를 이용해서 데이터를 불러오겠습니다 1. 막대그래프 author_List = df['Author'].value_counts()[:10] key..

Python 2020.11.05

Data Visualization - 구글 플레이스토어 데이터 분석 및 시각화하기 Part2

데이터 출처 : www.kaggle.com/lava18/google-play-store-apps Google Play Store Apps Web scraped data of 10k Play Store apps for analysing the Android market. www.kaggle.com github 주소 : github.com/sangHa0411/DataScience/blob/main/GooglePlayStore_Plotly.ipynb sangHa0411/DataScience Contribute to sangHa0411/DataScience development by creating an account on GitHub. github.com Part1 에서는 구글 플레이스토어 데이터를 가지고 각..

Data Visualization 2020.11.05

Data Visualization - 구글 플레이스토어 데이터 분식 및 시각화하기 Part1

데이터 출처 : www.kaggle.com/lava18/google-play-store-apps Google Play Store Apps Web scraped data of 10k Play Store apps for analysing the Android market. www.kaggle.com github 주소 : github.com/sangHa0411/DataScience/blob/main/GooglePlayStore_Plotly.ipynb sangHa0411/DataScience Contribute to sangHa0411/DataScience development by creating an account on GitHub. github.com 이번 포스팅에서는 구글 플레이스토어 데이터를 이용해서 ..

Data Visualization 2020.11.05