반응형
SMALL

분석 8

[Security] 암호화 알고리즘

이번 학습 주제는 암호화 알고리즘입니다 먼저 대칭키 알고리즘들에 대해 알아보겠습니다 먼저 DES(Data Encryption Standard)는 IBM에서 개발한 대칭키 암호화 알고리즘으로 1977년 미국 표준국(NIST)에서 표준으로 채택하였으며 20년간 미국 표준 및 국제 표준으로 활용한 암호화 알고리즘입니다 64Bit 블록 단위 암호화를 수행하고 56Bit 키를 사용합니다 키가 56Bit라고 했지만 7Bit마다 Check Bit를 넣어 결론적으로 64Bit입니다 치환 암호(Substitution Cipher)와 전치 암호(Transposition Cipher)를 혼합한 혼합 암호(Product Cipher)를 이용하는데 내부에서 XOR, 자리바꿈, 순환이동, 치환 등을 사용하고 S-BOX를 제외한 ..

Security 2020.03.02

[Machine Learning] 회귀분석(Regression)_1

이번 학습 주제는 머신러닝(Machine Learning) 알고리즘(Algorithms) 중 회귀분석(Regression)이고 두 변수 사이에 1:1로 대응되는 확률적, 통계적 상관성을 찾는 단순회귀분석(Simple Linear Regression)에 대해 알아보겠습니다 그 전에 머신러닝 프로세스(Machine Learning Process)에 대해 잠깐 살펴보면 아래와 같습니다 데이터 정리 머신러닝 데이터 분석을 시작하기 전에 컴퓨터가 이해할 수 있는 형태로 데이터를 변환하는 작업이 선행되어야하는데 분석 대상에 대한 관측값(observation)을 속성(feature or variable)을 기준으로 정리합니다 데이터 분리(훈련/검증) 알고리즘 준비 모형 학습 훈련 데이터 이용 예측 검증 데이터 이용 ..

Machine Learning 2019.10.20

[Python] 데이터 사전 처리(Preprocessing)_4

이번 학습 주제도 저번 시간에 이어 데이터 사전 처리(Preprocessing)에 관한 것입니다 그 중에서도 정규화(Normalization)와 시계열 데이터(time series)에 관해 학습하겠습니다 먼저 정규화(Normalization)에 대해 알아보겠습니다 분석하려는 데이터의 어떤 두 열 A, B가 각각 A 열의 데이터는 0~ 10000, B 열의 데이터는 0~1의 범위를 갖는다고 가정하겠습니다 이 때 두 개의 열에 대해서 그래프를 그린다고하면 범위가 더 큰 A 열에 의해 그래프가 더 영향도가 높을 것입니다 이런 차이를 제거하고 분석의 신뢰도를 높이기 위해 데이터를 동일한 크기 기준으로 나눈 비율로 나타내는 방법을 사용하는데 이를 정규화(Normalization)라고 하고 이 과정을 거친 데이터의..

Python 2019.10.10

[Python] 데이터 사전 처리(Preprocessing)_2

오늘은 데이터 사전 처리(Preprocessing)에 대한 학습 두번째 시간입니다-_- 지난 번에 데이터셋의 누락 데이터, 중복 데이터를 처리하는 방법을 익혀보았습니다 이번에는 데이터의 일관성을 맞추기 위해 데이터를 표준화하는 방법을 익혀보겠습니다 데이터의 일관성을 맞춘다는 의미를 간단하게 설명하기 위해서 한 데이터셋에 길이 데이터가 있다고 가정해보겠습니다 그런데 이 길이 데이터의 수치가 어떤 것은 마일(mile)로 계산되었고 어떤 것은 미터(meter)로 계산되었다면? 이 데이터를 분석했을 때 정확도가 분명히 떨어질 것입니다 그래서 데이터를 분석하고자 할 때 데이터의 표준화는 필요합니다 그럼 오늘도 코드를 작성해보면서 학습해보겠습니다-_- # 판다스(Pandas) import pandas filepat..

Python 2019.10.07

[Python] 데이터 사전 처리(Preprocessing)_1

지금까지 파이썬(Python)의 판다스(Pandas), 맷플롯립(Matplotlib), 씨본(Seaborn), 폴리엄(Folium) 라이브러리(Library)를 통해 여러 데이터를 다양한 방법으로 출력해보면서 본래 이 학습의 목적인 데이터 분석을 위한 아주 미미한-_- 준비를 해보았습니다 그런데 머신러닝 등 데이터 분석의 정확도는 분석 데이터의 품질에 의해 좌우됩니다 일전 학습에서도 일부 데이터의 누락(NaN)으로 오류가 발생한다던지 결과가 잘못나온다던지 하는 현상이 있었습니다-_- 데이터 품질을 높이기 위해서는 누락된 데이터, 중복 데이터 등 오류를 수정하고 분석하려는 목적에 맞게 데이터를 가공해야합니다 먼저 누락 데이터를 처리하는 법을 학습해보도록 하겠습니다 import seaborn as sb ti..

Python 2019.10.01

[Python] 씨본(Seaborn) 라이브러리(Library)_2

주말에 허접하지만 초보자 캠핑을 다녀오느라 공부를 못해 이제서야 씨본(Seaborn) 라이브러리(Library) 두번째 시간이네요-_- 오늘은 지난 시간에 이어 빈도 그래프, 박스 플롯/바이올린 그래프, 조인트 그래프를 그려보고 행, 열 방향으로 서로 다른 조건을 적용하여 여러 개의 서브 플롯을 생성하거나 열을 두 개씩 짝을 지어 분석해보겠습니다 # 판다스(Pandas) import pandas import matplotlib.pyplot as mp import matplotlib # 씨본(Seaborn) import seaborn titanic_data = seaborn.load_dataset('titanic') # titanic_data = titanic_data.fillna(method = 'ffi..

Python 2019.09.30

[Python] 맷플롯립(Matplotlib) 라이브러리(Library)_2

이어서 맷플롯립(Matplotlib) 라이브러리를 더 학습해보도록 하겠습니다 오늘은 누적 선 그래프(stacked line plot)라고도 하는 면적 그래프와 막대 그래프(bar plot)를 그려보겠습니다 # 판다스(Pandas) import pandas import matplotlib.pyplot as mp import matplotlib matplotlib.rc('font', family = 'AppleGothic') # MAC OS 일 경우 한글 폰트 오류 해결 filepath = "/Users/dennis_sa/Documents/" # 0번 로우를 header로 설정 read_data = pandas.read_excel(filepath+"전출입지(시도)별 이동자수.xlsx", header = 0)..

Python 2019.09.23
반응형
LIST