반응형
SMALL

Python 31

[Python] 씨본(Seaborn) 라이브러리(Library)_2

주말에 허접하지만 초보자 캠핑을 다녀오느라 공부를 못해 이제서야 씨본(Seaborn) 라이브러리(Library) 두번째 시간이네요-_- 오늘은 지난 시간에 이어 빈도 그래프, 박스 플롯/바이올린 그래프, 조인트 그래프를 그려보고 행, 열 방향으로 서로 다른 조건을 적용하여 여러 개의 서브 플롯을 생성하거나 열을 두 개씩 짝을 지어 분석해보겠습니다 # 판다스(Pandas) import pandas import matplotlib.pyplot as mp import matplotlib # 씨본(Seaborn) import seaborn titanic_data = seaborn.load_dataset('titanic') # titanic_data = titanic_data.fillna(method = 'ffi..

Python 2019.09.30

[Python] 씨본(Seaborn) 라이브러리(Library)_1

오늘도 파이썬(Python) 학습을 진행하겠습니다 바로 맷플롯립(Matplotlib) 라이브러리(Library)의 기능과 스타일을 확장한 씨본(Seaborn) 라이브러리(Library)입니다 # 판다스(Pandas) import pandas import matplotlib.pyplot as mp import matplotlib # 씨본(Seaborn) import seaborn titanic_data = seaborn.load_dataset('titanic') # titanic_data = titanic_data.fillna(method = 'ffill') print(titanic_data.head(), end = '\n') print(titanic_data.info(), end = '\n') matpl..

Python 2019.09.26

[Python] 맷플롯립(Matplotlib) 라이브러리(Library)_3

오늘 맷플롯립(Matplotlib) 라이브러리(Library)의 학습을 마치고자 달렸더니 벌써 새벽 2시를 향해-_- 진행할 내용은 맷플롯립을 이용해서 히스토그램(histogram), 산점도(scatter plot), 파이 차트(pie chart), 박스 플롯(box plot)입니다 # 판다스(Pandas) import pandas import matplotlib.pyplot as mp import matplotlib filepath = "/Users/dennis_sa/Documents/" # 0번 로우를 header로 설정 read_data = pandas.read_csv(filepath+"auto-mpg.data-original", header = None, sep = '\s+') read_data...

Python 2019.09.25

[Python] 맷플롯립(Matplotlib) 라이브러리(Library)_2

이어서 맷플롯립(Matplotlib) 라이브러리를 더 학습해보도록 하겠습니다 오늘은 누적 선 그래프(stacked line plot)라고도 하는 면적 그래프와 막대 그래프(bar plot)를 그려보겠습니다 # 판다스(Pandas) import pandas import matplotlib.pyplot as mp import matplotlib matplotlib.rc('font', family = 'AppleGothic') # MAC OS 일 경우 한글 폰트 오류 해결 filepath = "/Users/dennis_sa/Documents/" # 0번 로우를 header로 설정 read_data = pandas.read_excel(filepath+"전출입지(시도)별 이동자수.xlsx", header = 0)..

Python 2019.09.23

[Python] 맷플롯립(Matplotlib) 라이브러리(Library)_1

오늘도 잠을 자지 못하고-_- 파이썬 학습을 하고 있네요 지난 번에 판다스(Pandas)에 내장된 도구로 데이터 시각화를 해보았습니다 오늘은 데이터 시각화를 위해 맷플롯립(Matplotlib)을 이용하는 법을 학습하도록 하겠습니다 우선 시각화를 진행할 데이터를 준비해야겠죠^^ 데이터는 KOSIS 국가통계포털(http://kosis.kr/)에서 전출지/전입지(시도)별 이동자수(통계청, 「국내인구이동통계」를 다운받아 사용하겠습니다 KOSIS 국가통계포털 kosis.kr # 판다스(Pandas) import pandas import matplotlib.pyplot as mp import matplotlib matplotlib.rc('font', family = 'AppleGothic') # MAC OS 일 경..

Python 2019.09.21

[Python] 판다스(Pandas) 라이브러리(Library)_6

오늘의 학습을 시작하겠습니다-_- 지금까지 판다스 라이브러리를 이용해서 데이터를 읽고 출력해보았습니다 여태까지 표(Table) 혹은 그리드(Grid) 형태로 데이터를 출력했는데 이는 한눈에 파악하기가 어렵습니다 아무래도 그래프나 히스토그램 같은 것이 가시적인 것이 데이터를 파악(구조나 패턴 등)하는데는 효과적일 것입니다 그래서 오늘은 판다스 내장 그래프 도구를 이용하여 그래프나 히스토그램을 출력해보겠습니다 데이터는 이 전에 사용하였던 것을 그대로 이용해보겠습니다 # 판다스(Pandas) import pandas filepath = "/Users/dennis_sa/Documents/" #header가 없고 길이가 정해지지 않은 공백이 구분자인 데이터 read_data = pandas.read_csv(fil..

Python 2019.09.20

[Python] 판다스(Pandas) 라이브러리(Library)_5

오늘은 실제 데이터를 한 번 살펴보도록 하겠습니다 사용할 데이터셋은 UCI 머신러닝 저장소에 있는 자동차 연비(auto mpg) 입니다 https://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/ Index of /ml/machine-learning-databases/auto-mpg archive.ics.uci.edu ...더보기 판다스(Pandas) 자료형(Data Type) 판다스(Pandas) 파이썬(Python) 설명(Description) int64 int 정수 float64 float 실수 object string 문자열 datetime64, timedelta64 datetime 라이브러리 필요 시간 # 판다스(Pandas) impo..

Python 2019.09.17

[Python] 판다스(Pandas) 라이브러리(Library)_4

지금까지 판다스에서 제공하는 데이터 형식인 시리즈(Series)와 데이터프레임(Dataframe)에 대해 알아보았습니다 이제 데이터 분석을 위해 필요한 작업은 데이터들을 외부에서 가져와서 여태 공부한 시리즈나 데이터프레임으로 변환하는 작업일 것입니다 그렇다면 오늘할 공부는 당연히 데이터들을 외부에서 가져오는 방법이겠죠-_- 판다스는 다양한 형태의 외부 파일을 읽어와서 데이터프레임으로 변환하는 함수를 제공합니다 어떤 파일이든 일단 판다스 객체인 데이터프레임으로 변환되면 판다스가 제공하는 기능들을 이용할 수 있게됩니다 아래의 표는 https://pandas.pydata.org/index.html 에서 제공하는 입출력 도구입니다 File Format Reader Writer CSV(Comma-Separated..

Python 2019.09.15

[Python] 판다스(Pandas) 라이브러리(Library)_3

이번에는 판다스 객체의 산술연산에 대해 알아보겠습니다 판다스 객체의 산술연산은 먼저 ① 행/열 인덱스를 기준으로 모든 원소를 정렬하고 ② 동일한 위치에 있는 원소끼리 1:1 대응시켜 처리합니다 (단, 대응되는 원소가 없으면 NaN(Not a Number)으로 처리) # 판다스(Pandas) import pandas import numpy import seaborn #seaborn 내장 데이터셋의 종류 # 'anscombe', 'attention', 'brain_network', 'car_crashes', 'diamonds' # 'dots', 'exercise', 'flights', 'gammas', 'iris' # 'mpg', 'planets', 'tips', 'titanic' # 시리즈와 값 연산 se..

Python 2019.09.14

[Python] 판다스(Pandas) 라이브러리(Library)_2

오늘은 지난 번에 이어 판다스(Pandas) 라이브러리(Libarary)의 데이터프레임(DataFrame)에 대해 학습하겠습니다 지난 번에 데이터프레임의 행과 열을 생성하고 삭제하는 방법을 살펴보았는데 생성한 행과 열을 선택하거나 추가하고 값을 변경하는 법을 보겠습니다 선택을 위해서는 두가지의 인덱서를 사용합니다(loc, iloc) 구분 loc iloc 대상 인덱스 이름(index label) 정수형 위치 인덱스(integer position) 범위 범위의 끝을 포함한다 범위의 끝을 제외한다 # 판다스(Pandas) import pandas data = {'국어' : [100, 90, 80], '영어' : [98, 88, 78], '수학' : [76, 86, 96]} df = pandas.DataFram..

Python 2019.09.14
반응형
LIST