반응형
SMALL
오늘의 학습을 시작하겠습니다-_-
지금까지 판다스 라이브러리를 이용해서 데이터를 읽고 출력해보았습니다
여태까지 표(Table) 혹은 그리드(Grid) 형태로 데이터를 출력했는데 이는 한눈에 파악하기가 어렵습니다
아무래도 그래프나 히스토그램 같은 것이 가시적인 것이 데이터를 파악(구조나 패턴 등)하는데는 효과적일 것입니다
그래서 오늘은 판다스 내장 그래프 도구를 이용하여 그래프나 히스토그램을 출력해보겠습니다
데이터는 이 전에 사용하였던 것을 그대로 이용해보겠습니다
# 판다스(Pandas)
import pandas
filepath = "/Users/dennis_sa/Documents/"
#header가 없고 길이가 정해지지 않은 공백이 구분자인 데이터
read_data = pandas.read_csv(filepath+"auto-mpg.data-original", header = None, sep = '\s+')
print(read_data.head(), end = '\n')
read_data.columns = ['연비(mpg)', '실린더 수(cylinders)', '배기량(displacement)', '출력(horsepower)',
'차중(weight)', '가속능력(acceleration)', '출시년도(model_year)', '제조국(origin)', '모델명(name)']
print(read_data.head(), end = '\n') #앞 5행 보기
ex_data = read_data.iloc[0:, [8, 0, 2]]
ex_data.set_index('모델명(name)', inplace = True) #모델명을 기준으로 연비와 출력을 알아보기 위해 인덱스 설정
# plot() 메소드의 kind 옵션은 아래의 표 참조
# 선 그래프 그리기
ex_data.plot(kind = 'line') #defaul가 line이므로 생략가능
# 수직 막대 그래프 그리기
ex_data.plot(kind = 'bar')
# 수평 막대 그래프 그리기
ex_data.plot(kind = 'barh')
# 히스토그램
ex_data.plot(kind = 'hist')
# 산점도
ex_data.plot(x = '연비(mpg)', y = '배기량(displacement)', kind = 'scatter')
# 박스 플롯
ex_data[['연비(mpg)', '배기량(displacement)']].plot(kind='box')
위의 코드에서 소개한 것 외에도 plot() 메소드의 kind 옵션은
kde(커널 밀도 그래프), area(면적 그래프), pie(파이 그래프), hexbin(고밀도 산점도 그래프) 등이 있습니다
사실 판다스(Pandas)의 데이터 시각화를 위한 내장 기능들은 풍부하지 못하기 때문에
파이썬 표준 시각화 도구?라고 불리우는 맷플롯립(Matplotlib)에 대해 학습을 진행할 예정입니다
맷플롯립은 2D 평면 그래프에 관한 다양한 포맷과 기능을 지원합니다
그럼 오늘은 이만-_-
반응형
LIST
'Python' 카테고리의 다른 글
[Python] 맷플롯립(Matplotlib) 라이브러리(Library)_2 (0) | 2019.09.23 |
---|---|
[Python] 맷플롯립(Matplotlib) 라이브러리(Library)_1 (0) | 2019.09.21 |
[Python] 판다스(Pandas) 라이브러리(Library)_5 (0) | 2019.09.17 |
[Python] 판다스(Pandas) 라이브러리(Library)_4 (0) | 2019.09.15 |
[Python] 판다스(Pandas) 라이브러리(Library)_3 (0) | 2019.09.14 |