데이터 시각화 3

두가지의 다른 데이터 프레임을 하나로 합치고 시각화하기(concat, heatmap)

저번시간에는 melt 와 apply 함수를 사용하여 df_first 데이터를 df_last 데이터의 컬럼과 맞춰주었다. 이제 맞추어진 두 데이터를 합쳐야 분석하기에 용이할것이다. 나는 두개의 데이터 프레임을 concat 으로 합칠것이다. 그러기 위해서는 컬럼명이 일치한 두 데이터 프레임을 담은 변수가 필요하다. 컬럼이 일치하는 df_first 의 데이터 프레임을 df_first_preapare, df_last 의 데이터 프레임을 df_last_prepare 라고 설정해준다면, 1. 먼저 지정할 컬럼을 변수 cols 에 할당한다. cols = ['지역명', '연도', '월', '평당분양가격'] 2. loc 함수를 이용하여 df_last_prepare 변수에 데이터 프레임 넣기 3. copy 함수 이용하여 ..

seaborn 으로 시각화 하기

전 시간에는 boxplot 을 활용하여 시각화를 진행하였다. 이번 시간에는 seaborn 을 활용하여 시각화 하는 것을 공부 하였다. 1. 우선 seaborn 라이브러리를 가져와야 한다. -> import seaborn as sns # 나는 seaborn 을 sns 로 지정해주었다. 모든 코드는 ? + ctrl +enter or 괄호안에서 shifr+ tab 을 사용하면 사용하는 방법을 볼 수 있다. seaborn 라이브러리를 가져왔다면, seaborn 을 활용한 시각화 하는 방법을 간단하다. 막대그래프로 시각화 하고 싶다면? 1.1 -> sns.barplot(data = 원하는 데이터, x = ?, y = ?) # sns.barplot? +ctrl + enter 를 하면 사용방법 알 수 있음. x축에 ..

데이터 시각화 (plot(), sort_values())

데이터 시각화 하기 데이터 그룹화까지 배웠고, 이제는 그룹화 한것을 한눈에 보기 쉽게 그래프를 활용하여 시각해보자 시각화를 위해서는 그룹화에서 사용했던 groupby 나 pivot_table 을 변수로 설정하고, plot()을 활용하여 시각화 해보자. plot()은 pandas 라이브러리에서 활용되는 시각화인가보다. 우선, 데이터시각화를 위해 폰트를 설정해주어야 한다. import matplolib.pyplot as plt plt.rc("font", family = "Malgum Gothic") # 윈도우라서 맑은 고딕이다. 폰트를 설정해줬다면, 시각화를 위한 코드를 작성해도 오류가 나지 않는다. 폰트 설정 안해주면, 오류난다! 강의에서는 groupby 를 사용하였지만, 나는 pivot_table이 더 ..