Python

[Python] 데이터 프레임(Data Frame) 심화_2

구루싸 2019. 10. 16. 20:48
반응형
SMALL

정말 오랜만에 다시 파이썬(Python) 학습을 시작하겠습니다

오늘의 주제는 데이터 프레임(Data Frame)의 열 순서를 변경하거나 분리하고 필터링 하는 방법입니다

뭐 주제만 들어도 어떤 내용인지 짐작이 가기 때문에 부연 설명을 적을 필요는 없을 것 같네요-_-

import seaborn
import pandas

titanic_data = seaborn.load_dataset('titanic')
print(titanic_data.head(), end = '\n')

# 디스플레이 설정 변경
pandas.set_option('display.max_columns', 5) # 출력할 열의 개수
 
# 열 이름 리스트 생성
all_columns = list(titanic_data.columns.values)
print(all_columns, end = '\n')

# 열 정렬 후 출력
sort_columns = sorted(all_columns)
sort_data = titanic_data[sort_columns]
print(sort_data.head(), end = '\n')

# 열 역순으로 설정 후 출력
reverse_columns = list(reversed(all_columns))
reverse_data = titanic_data[reverse_columns]
print(reverse_data.head(), end = '\n')

# 열 순서를 임의로 설정 후 출력
custom_columns = ['sex', 'survived', 'deck'] 
custom_data = titanic_data[custom_columns]
print(custom_data.head(), end = '\n')

filepath = "/Users/dennis_sa/Documents/"
stock_data = pandas.read_csv(filepath + "주식.csv", header = 0)
print(stock_data.head(), end = '\n')

# 열 분리
stock_data['Date'] = stock_data['Date'].astype('str')
dates = stock_data['Date'].str.split('-')
print(dates.head(), end = '\n')
stock_data['Year'] = dates.str.get(0)
stock_data['Month'] = dates.str.get(1)
stock_data['Day'] = dates.str.get(2)
print(stock_data.head(), end = '\n')

# 불린 인덱싱(boolean indexing)
fltr = (titanic_data.age >= 10) & (titanic_data.age < 20) # 10대
teenage_data = titanic_data.loc[fltr, :]
print(teenage_data.head(), end = '\n')

# 열(column)에 특정 값 포함 여부로 추출
fltr = titanic_data['sibsp'].isin([3, 4, 5])
fltr_data = titanic_data[fltr]
print(fltr_data.head(), end = '\n')

이번 학습을 여기서 마치겠습니다-_-

반응형
LIST