반응형
SMALL
정말 오랜만에 다시 파이썬(Python) 학습을 시작하겠습니다
오늘의 주제는 데이터 프레임(Data Frame)의 열 순서를 변경하거나 분리하고 필터링 하는 방법입니다
뭐 주제만 들어도 어떤 내용인지 짐작이 가기 때문에 부연 설명을 적을 필요는 없을 것 같네요-_-
import seaborn
import pandas
titanic_data = seaborn.load_dataset('titanic')
print(titanic_data.head(), end = '\n')
# 디스플레이 설정 변경
pandas.set_option('display.max_columns', 5) # 출력할 열의 개수
# 열 이름 리스트 생성
all_columns = list(titanic_data.columns.values)
print(all_columns, end = '\n')
# 열 정렬 후 출력
sort_columns = sorted(all_columns)
sort_data = titanic_data[sort_columns]
print(sort_data.head(), end = '\n')
# 열 역순으로 설정 후 출력
reverse_columns = list(reversed(all_columns))
reverse_data = titanic_data[reverse_columns]
print(reverse_data.head(), end = '\n')
# 열 순서를 임의로 설정 후 출력
custom_columns = ['sex', 'survived', 'deck']
custom_data = titanic_data[custom_columns]
print(custom_data.head(), end = '\n')
filepath = "/Users/dennis_sa/Documents/"
stock_data = pandas.read_csv(filepath + "주식.csv", header = 0)
print(stock_data.head(), end = '\n')
# 열 분리
stock_data['Date'] = stock_data['Date'].astype('str')
dates = stock_data['Date'].str.split('-')
print(dates.head(), end = '\n')
stock_data['Year'] = dates.str.get(0)
stock_data['Month'] = dates.str.get(1)
stock_data['Day'] = dates.str.get(2)
print(stock_data.head(), end = '\n')
# 불린 인덱싱(boolean indexing)
fltr = (titanic_data.age >= 10) & (titanic_data.age < 20) # 10대
teenage_data = titanic_data.loc[fltr, :]
print(teenage_data.head(), end = '\n')
# 열(column)에 특정 값 포함 여부로 추출
fltr = titanic_data['sibsp'].isin([3, 4, 5])
fltr_data = titanic_data[fltr]
print(fltr_data.head(), end = '\n')
이번 학습을 여기서 마치겠습니다-_-
반응형
LIST
'Python' 카테고리의 다른 글
[Python] 데이터 프레임(Data Frame) 심화_4 (0) | 2019.10.18 |
---|---|
[Python] 데이터 프레임(Data Frame) 심화_3 (0) | 2019.10.16 |
[Python] 데이터 프레임(Data Frame) 심화_1 (0) | 2019.10.11 |
[Python] 데이터 사전 처리(Preprocessing)_4 (0) | 2019.10.10 |
[Python] 데이터 사전 처리(Preprocessing)_3 (0) | 2019.10.07 |