파이썬 강좌 빅데이터 DataFrame 입력 출력 삭제 업로드 사용법
안녕하세요 오늘은 파이썬의 라이브러리 중 Pandas 안에 있는 Data Frame을 살펴보려고 하는데요.
사실 DataFrame 을 잘 알고 있어야만 나중에 빅데이터 훨씬 수월할 것입니다
Data Frame 문서랑 강의를 몇개 보다 보니 필요 없는 것도 강의하고 잘 쓰지 않고 검색하면 바로 나오는
그런 데이터 들로 강의나 또는 블로그를 적는 분이 있으시기에 이것만 알면 Pandas 에있는
DataFrame 은 다 알았다라고 생각하실 정도로 깔끔하고 빠르고 쉽게 입력출력 삭제 업로드에 적겠습니다
일단 파이썬 Python에서 DataFrame 은 무엇이냐면 아주 잘 깔끔하게 정리되어있는 표 같은 것이라고
보시면 됩니다
1. Python 라이브러리 Panddas DataFrame 만들기
일단 당연히 Import Panddas는 해주셔야 하고 통상적으로 줄여서 별칭을 pd라고 많이 해줍니다
import pandas as pd , import numpy as np 일단 간단하게 이두가지를 import 했습니다
Panddas와 Numpy는 세트 아니 거의 쌍둥이입니다 ㅎㅎ
이렇게 만들 수 있는데요 np.arrange(4). reshape(2,2)는 numpy 배열을 만드는 것입니다
저렇게 안에 만들데 Numpy의 2차원 배열 값 또는 1차원 배열 값을 넣어줘서 값을 만듭니다
index는 row 즉 행의 index 이름을 붙여주는 것이고 ,
colums는 즉 cloum 즉 각 열마다의 이름을 붙여주는 것입니다
frame = pd.DataFrame(np.arrange(4). reshape(2,2),
index = ['one', 'two'],
columns=['가격', '개수'])
frame
.
2 Python DataFrame 값 가져오기
1 열 전부 다 가져오기
위에 표를 열로 가져오는 방법입니다 행의 이름을 붙여줬다면 그 붙여준 행의 이름을 가져오면 이름을
전부 가져올 수 있는 것을 볼 수입니다
두 번째로는 가져오는 값은 Series입니다 인덱싱 해서 값을 가져온다면 가져오는 값은 시리즈입니다
2 행 가져오기
슬라이싱을 해서 값을 가져 올 수도 있고
이렇게 loc와 iloc로 값을 가져올 수 있습니다
3 Python DataFrame 값 추가하기
1 열 추가하기
위와 같이 있는 DataFrame에 추가할 수 있습니다 list 나 ndarray로 값을 넣어줘야 합니다
df ['만들고 싶은 행의 이름'] = [데이터 값]
2 행 추가하기
사실 행추가 하기는 쪼금 까다로운데요 한 번만 알아두고 나중에는 그냥 복붙 하여 글을 사용하는 것
이니까 그렇게 연연하지 않으셔도 됩니다
pd.concat([ 합치고 싶은 DataFrame 1 , 2 ,....], axis=행으로 합치고 싶다면 1 열로 합치고싶다면 0, ignore_index= True)
이렇게 하여 행들을 합칠 수 있습니다 여기에는 DataFrame 만들어가므로
s = pd.DataFrame([넣고 싶은 데이터], columns= 합치고 싶은 DataFrame.columns)
이렇게 하여 합칠 수 있는 행을 만들 수 있습니다
4 Python DataFrame 삭제하기
1 행으로 삭제하기
나의 DataFrame.drop([삭제하고 싶은 행의 번호 ])
2 열로 삭제하기
del MYDataFrame ['삭제하고 싶은 열의 index 또는 명칭 ']
이렇게 하여 삭제하고 읽어오고 수정하고 만드는 CRUD 작업을 완료하였습니다
분명 도움이 되실 것입니다 프로그램은 CRUD 딱 이 정도만 알면 훌륭한 개발자가 되는 건
순식간입니다 감사합니다