파이썬 강좌 빅데이터 DataFrame 입력 출력 삭제 업로드 사용법

2022. 8. 26. 20:46빅데이터 파이썬 기반

728x90

안녕하세요 오늘은 파이썬의 라이브러리 중 Pandas  안에 있는 Data Frame을 살펴보려고 하는데요.

사실 DataFrame 을 잘 알고 있어야만 나중에 빅데이터 훨씬 수월할 것입니다 

 

Data Frame 문서랑 강의를 몇개 보다 보니 필요 없는 것도 강의하고 잘 쓰지 않고 검색하면 바로 나오는

그런 데이터 들로 강의나 또는 블로그를 적는 분이 있으시기에 이것만 알면 Pandas 에있는

DataFrame 은 다 알았다라고 생각하실 정도로 깔끔하고 빠르고 쉽게 입력출력 삭제 업로드에 적겠습니다

 

일단 파이썬 Python에서 DataFrame 은 무엇이냐면  아주 잘 깔끔하게 정리되어있는 표 같은 것이라고

보시면 됩니다 

 

 

1. Python 라이브러리 Panddas   DataFrame 만들기

 일단 당연히 Import Panddas는 해주셔야 하고 통상적으로 줄여서 별칭을 pd라고 많이 해줍니다 

import pandas as pd  , import numpy as np 일단 간단하게 이두가지를 import 했습니다

Panddas와 Numpy는 세트 아니 거의 쌍둥이입니다 ㅎㅎ 

 

이렇게 만들 수 있는데요  np.arrange(4). reshape(2,2)는 numpy 배열을 만드는 것입니다

저렇게 안에 만들데 Numpy의 2차원 배열 값 또는 1차원 배열 값을 넣어줘서 값을 만듭니다

index는 row  즉 행의 index 이름을  붙여주는 것이고 ,

colums는 즉 cloum 즉 각 열마다의 이름을 붙여주는 것입니다 

frame = pd.DataFrame(np.arrange(4). reshape(2,2),
                     index = ['one', 'two'],
                    columns=['가격', '개수'])
frame

.

 

 

2 Python DataFrame 값 가져오기 

1 열 전부 다 가져오기

위에 표를 열로 가져오는 방법입니다 행의 이름을 붙여줬다면 그 붙여준 행의 이름을 가져오면 이름을

전부 가져올 수 있는 것을 볼 수입니다

두 번째로는 가져오는 값은 Series입니다 인덱싱 해서 값을 가져온다면 가져오는 값은 시리즈입니다

 

2 행 가져오기

슬라이싱을 해서 값을 가져 올 수도 있고

이렇게 loc와 iloc로 값을 가져올 수 있습니다

 

 

 

 

3 Python DataFrame 값 추가하기

1 열 추가하기 

위와 같이 있는 DataFrame에   추가할 수 있습니다  list 나 ndarray로 값을 넣어줘야 합니다

df ['만들고 싶은 행의 이름'] = [데이터 값]

 

2 행 추가하기 

사실 행추가 하기는 쪼금 까다로운데요 한 번만 알아두고 나중에는 그냥 복붙 하여 글을 사용하는 것

이니까 그렇게 연연하지 않으셔도 됩니다

pd.concat([ 합치고 싶은 DataFrame 1 ,  2 ,....], axis=행으로 합치고 싶다면 1 열로 합치고싶다면 0, ignore_index= True)

이렇게 하여 행들을 합칠 수 있습니다 여기에는  DataFrame 만들어가므로

s = pd.DataFrame([넣고 싶은 데이터], columns= 합치고 싶은 DataFrame.columns)

이렇게 하여 합칠 수 있는 행을 만들 수 있습니다

 

 

4 Python DataFrame 삭제하기 

1 행으로 삭제하기

나의 DataFrame.drop([삭제하고 싶은 행의 번호 ])

 

2 열로 삭제하기 

del MYDataFrame ['삭제하고 싶은 열의 index 또는 명칭 ']

 

 

이렇게 하여 삭제하고 읽어오고 수정하고 만드는 CRUD 작업을 완료하였습니다

분명 도움이 되실 것입니다 프로그램은 CRUD 딱 이 정도만 알면 훌륭한 개발자가 되는 건 

순식간입니다 감사합니다 

728x90