Python 을 활용한 데이터분석

seaborn 으로 시각화 하기

jwns 2022. 1. 18. 16:05

전 시간에는 boxplot 을 활용하여 시각화를 진행하였다.

이번 시간에는 seaborn 을 활용하여 시각화 하는 것을 공부 하였다.

 

1. 우선 seaborn 라이브러리를 가져와야 한다.

-> import seaborn as sns                            # 나는 seaborn 을 sns 로 지정해주었다.

 

모든 코드는      ? + ctrl +enter or 괄호안에서 shifr+ tab 을 사용하면 사용하는 방법을 볼 수 있다.

 

seaborn 라이브러리를 가져왔다면, seaborn 을 활용한 시각화 하는 방법을 간단하다.

막대그래프로 시각화 하고 싶다면?

1.1

-> sns.barplot(data = 원하는 데이터, x = ?, y = ?)       # sns.barplot? +ctrl + enter 를 하면 사용방법 알 수 있음.

x축에 원하는 컬럼, y 축에 원하는 컬럼을 써서 직관적이고 쉽게 막대그래프를 그릴 수 있다.

seaborn lib 를 활용한 barplot

이전에 matplotlob.pyplot 을 plt 로 가져온적이 있었는데, 

seaborn 에서 그래프의 크기나 x축의 크기를 조정하고 싶다면,

plt.figure(figsize = (10, 3)) 을 써주면 그래프의 크기 조정이 가능하다.

 

 

2. catplot 으로 서브플롯을 그릴 수 있다.

사용방법은 다음과 같다.

sns.catplot(data = 원하는 데이터, x = 원하는 컬럼, y = 원하는 컬럼)    

seaborn 에서는 plot 이름만 다르지 사용하는 방법을 거의 동일하다고 보면된다.

 

catplot 은 디폴트 값이 strip (점)이기 때문에 kind 값을 원하는 값으로 바꾸어 주어야 한다.

catplot, kind 는 디폴트값인 strip 으로 표현

 

나는 kind 를 bar (막대) 로 바꾸고 col = "지역명", col_wrap = 4 를 추가로 작성하여서,

각 지역별로 독립적인 그래프를 그렸다.

col 의 역할은 col로 설정한 컬럼으로 독립적으로 그래프를 그릴 수 있다는 장점이 있다.

아무래도 겹쳐서 그래프가 그려지면 알아보기 힘드니 col 옵션도 자주 사용할 것이다.

col_wrap 은 한줄에 몇개의 그래프를 그릴지 설정해주는 옵션이다.

 

 

sns.catplot(data = df_last, x = "연도", y = "평당분양가격", kind = "bar", col = "지역명", col_wrap = 4)

# catplot 또한 도움말을 활용하여서 옵션쓰는 방법을 쉽게 알 수 있다.

 

 

3. seaborn 의 lineplot

추가적으로 알아야 할 것은 hue 옵션이다. hue 옵션을 사용하면 설정한 컬럼에 따라 색이 다른 값으로 구분된다.

lineplot

 

hue = 지역명 으로 설정해줌으로써, 지역 별로 나누어서 분석은 할 수 있으나, 겹치는 것이 많아서 구분하기 힘들다.

-> col, col_wrap 옵션 사용하기

4. col, col_wrap 옵션을 사용하기 위해서 relplot 을 사용하자

 

 

replot의 kind 의 디폴트 값은 scatter 이다. 따라서, line 으로 바꾸어 주었음.

 

seaborn 라이브러리를 사용해보니, 상자그림, pivot_table 보다 사용하기 편한것 같다.

seaborn lib 만 불러오면, 원하는 plot 을 비슷한 형식으로 사용할 수 있기 때문이다.

 

도움말 사용하기의 중요성, col , col_wrap, hue, seaborn 에서 활용할 수 있는 다양한 그래프 그리기 에 대해서 공부하는 시간이었다.

 

 

 

[출처]: 인프런, "공공데이터로 파이썬 데이터 분석 시작하기" 박조은 선생님 강의

https://www.inflearn.com/course/%EA%B3%B5%EA%B3%B5%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%A1%9C-%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-%EC%8B%9C%EC%9E%91%ED%95%98%EA%B8%B0/dashboard

 

 

파일 출처: 공공데이터포털, 주택도시보증공사_전국 신규 민간 아파트 분양가격 동향

https://www.data.go.kr/dataset/3035522/fileData.do