Pandas의 기초2 - 데이터 선택
1. 특정 컬럼 조회 : df[“컬럼”], df[[“컬럼1”, “컬럼2”]]
df["메뉴"] # 1개(시리즈로 반환)
df[["메뉴", "가격"]] # 2개 이상 시(데이터 프레임으로 반환)
2. 조건에 맞는 행 조회 : df[T/F로 이루어진 시리즈]
cond1 = df["메뉴"] == "짜장면" # True, False 시리즈들을 반환
df[cond1]
True, False로 이루어진 시리즈를 만들어, [ ]에 넣어 True인 행만을 출력받는 모습
-
✨ 다중조건 조회 방법
-
조건 생성
condi_price = df["가격"] >= 7500 # 충족하는 것은 "짬뽕", "볶음밥"
condi_name = df["메뉴"].isin(["짜장면", "짬뽕"]) # 충족하는 것은 "짜장면", "짬뽕"
- And(True + False = False) 와 Or(True + False = True) 을 실행한 모습
df[condi_price & condi_name] # And
df[condi_price | condi_name] # Or
3. 행과 열을 이용한 조회 : loc(명칭 이용), iloc(번호 이용)
- 사용법 [보고싶은 행, 보고싶은 열]을 담는다.
- ✨ 둘의 차이를 보기 위해 먼저 전체 df의 인덱스 명칭을 바꿔주겠습니다.
인덱스 명칭을 바꾼 전체 df
1) df.loc[인덱스 명칭, 컬럼 명칭]
df.loc["첫번째":"두번째", "메뉴"]
# 인덱스는 첫번째에서 두번째까지, 컬럼은 메뉴만 조회
2) df.iloc[인덱스값, 컬럼값]
df.iloc[0:2, 0]
# 인덱스 번호 0~1까지, 첫번째 컬럼까지
- ✨✨ 위와 같이 데이터를 선택한 뒤, 새로운 객체에 담아서 “가공”도 가능하다.
댓글남기기