Python 11

Python - Basemap 이용하는 방법

데이터 출처 : www.data.go.kr/tcs/dss/selectFileDataDetailView.do?publicDataPk=3038489 공공데이터 포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase www.data.go.kr 이번 포스팅에 대해서는 제가 그리고자 하는 부분을 Basemap 을 이용해서 출력하는 방법과 이 지도 위에 데이터를 시각화하는 방법에 대해서 정리해보도록 하겠습니다. 저는 위 공공데이터 포털에서 2019년에 일어난 교통사고 데이터를 이용해보도록 하겠습니다. 먼저 Pandas를 이용해서 데이터를 불러오겠습니다. 그리고 Basema..

Python 2020.11.08

Python - WordCloud 만들고 시각화하기

이번에는 WordCloud 라이브러리를 이용해서 WordCloud를 만들어보고 출력해보는 과정을 정리해보도록 하겠습니다. 먼저 데이터를 Pandas를 이용해서 불러오겠습니다. 위 데이터는 넷플릭스에 영화 및 TV 시리즈에 대한 정보가 들어있는 데이터입니다. 저는 여기서 Crime TV Shows 장르만을 추출하고 그에 대한 설명을 가지고 WordCloud를 만들어 보겠습니다. 아래는 Crime TV Shows 를 장르로 가지는 Content만을 추출하는 과정입니다. 이제 위 추출된 데이터만을 이용해서 WordCloud를 본격적으로 만들어보겠습니다. crime_String = [] for string in crime_df['description'] : crime_String.append(string) cr..

Python 2020.11.07

Python - Plotly를 이용해서 데이터 시각화하는 방법

github 주소 : github.com/sangHa0411/DataScience/blob/main/Amazon_BestSellers_Plotly.ipynb sangHa0411/DataScience Contribute to sangHa0411/DataScience development by creating an account on GitHub. github.com 이번 포스팅에서는 matplotlib , seaborn 과 더불어서 많이 사용되는 plotly 라이브러리를 활용해서 데이터 시각화하는 방법에 대해서 정리해보겠습니다. plotly 라이브러리가 가지는 장점은 interacitve , 즉 상호작용이 가능하다라는 것인데 정리하면서 이러한 점을 확인해보겠습니다. 먼저 Pandas를 이용해서 데이터를 불..

Python 2020.11.06

Python - Seaborn을 이용해서 Heatmap을 그려보기

github 주소 : github.com/sangHa0411/DataScience/blob/main/Amazon_BestSellers_Seaborn.ipynb sangHa0411/DataScience Contribute to sangHa0411/DataScience development by creating an account on GitHub. github.com 아래는 Heatmap에 대한 참고자료에 대한 내용입니다. x , y 모두 이산적인 속성으로 정하고 색깔을 연속적인 속성으로 정함으로써 어디 칸의 색깔이 가장 짙은지를 혹은 색깔이 옅은지를 쉽게 파악할 수 있습니다. seaborn 을 이용한 데이터 시각화 방법 : electronicprogrammers.com/71?category=904280 ..

Python 2020.11.05

Python - Seaborn을 이용해서 데이터 시각화하는 방법

github 주소 : github.com/sangHa0411/DataScience/blob/main/Amazon_BestSellers_Seaborn.ipynb sangHa0411/DataScience Contribute to sangHa0411/DataScience development by creating an account on GitHub. github.com 저번 포스팅에서는 matplotlib을 이용해서 데이터를 시각화를 해보았습니다. 이번 포스팅에서는 seaborn을 이용해서 데이터를 시각화해볼 것이며 어떻게 이용하는지 그리고 matplotlib과 비교해서 어떠한 점이 좋은지 정리해보도록 하겠습니다. matplotlib 포스팅 주소 : electronicprogrammers.com/70?cat..

Python 2020.11.05

Python - Matplotlib을 이용해서 데이터 시각화 하는 방법

github 주소 : github.com/sangHa0411/DataScience/blob/main/Amazon_BestSellers_Matplotlib.ipynb sangHa0411/DataScience Contribute to sangHa0411/DataScience development by creating an account on GitHub. github.com 이번 포스팅에서는 matplotlib을 이용하는 방법을 자세하게 정리하여서 데이터를 시각화하면서 matplotlib을 사용할 때 어떻게 해야하는지에 대해서 정리해보도록 하겠습니다. 먼저 Pandas를 이용해서 데이터를 불러오겠습니다 1. 막대그래프 author_List = df['Author'].value_counts()[:10] key..

Python 2020.11.05

Python - 기존 그래프의 확대 부분 같이 그리기

먼저 matplotlib을 이용해서 2개의 그래프를 동시에 그려보겠습니다. plt.figure(figsize=(18,10)) plt.title('Price Prediction & Real Comparison' , fontsize=20) plt.ylabel('Price Scaled' , fontsize=15) plt.xlabel('Index' , fontsize=15) plt.plot(idx_List , Y_test , color = 'blue' , alpha=0.5 , label = 'Real Price') plt.plot(idx_List , preds , color = 'red' , alpha=0.5 , label = 'Predicted Price') plt.legend(fontsize=15) plt...

Python 2020.11.01

Python - Seaborn 을 이용한 Boxplot , Violinplot 그리기

이번 포스팅에서는 .csv 파일을 Pandas를 이용해서 불러온 데이터에 대해서 Boxplot , ViolinPlot을 그리는 방법에 대해서 정리하도록 하겠습니다. 먼저 데이터를 불러오겠습니다. 먼저 Seaborn을 이용하기 이전에 matplotlib을 이용해서 seaborn을 그려보도록 하겠습니다. 데이터의 시각화는 성별에 따라서 보험비용의 청구 비용을 비교하기 위한 것으로 정해보겠습니다. 따라서 먼저 성별별로 데이터를 분류해보겠습니다. male_Flag = [sex == 'male' for sex in insurance['sex']] male_DF = insurance.loc[insurance[male_Flag].index] male_DF = male_DF.reset_index(drop=True) f..

Python 2020.11.01

Python - 상관행렬을 이용한 각 속성간의 연관성 파악하기

이번 포스팅에서는 Pandas를 이용해서 불러온 데이터프레임에서 각 속성간의 관계를 파악하기 위해서 상관행렬을 구하고 이를 이용해보는 과정을 정리해보겠습니다. 상관행렬에 대한 이론을 간단하게 정리하자면 아래와 같습니다. 먼저 각 속성에 대한 분산과 속성들간의 공분산을 구해서 분산 - 공분산 행렬을 만듭니다. 근데 여기서 공분산 값을 최솟값 = -1 , 최댓값 = 1 로 만듬으로써 표준화하는 것이 상관행렬이고 이를 이용하는 것이 피어슨 상관계수입니다. 이제 이를 파이썬을 이용해 구현해보겠습니다. 먼저 Pandas를 이용해서 데이터를 불러오고 데이터 구조를 확인해보겠습니다. 이제 이 데이터를 기반으로 상관행렬을 구해보겠습니다. corr_Info = insurance.corr() df.corr() 함수를 이용..

Python 2020.11.01

Python - Opencv 를 이용한 얼굴 검출하기

얼굴 검출은 원래 대표적인 머신러닝분야의 adaboost 알고리즘으로 유명합니다. Opencv에는 이러한 얼굴검출 함수가 주어져있기 때문에 저희가 구현할 필요없이 바로바로 사용할 수 있습니다. 이번 포스팅에서는 그 사용방법에 대해서 정리하고자 합니다. 먼저 얼굴이 있는 사진을 하나를 가져오겠습니다. 먼저 얼굴 검출을 하기 위해서는 기존 이미지를 흑백으로 변경해주어야 합니다. 아래 코드에서 확인 하실 수 있다시피 저희는 cv2.cvtColor() 함수를 이용해서 기존의 사진(BGR)을 GRAY로 변경을 해주었습니다. def getImageData(path) : orgImage_File = [] grayImage_File = [] for i in range(220) : image_Path = basic_Pa..

Python 2020.11.01