목차


데이터 탐색하기

데이터가 어떤 특징을 가지는지 분석

데이터 확인 : head(), tail()

수치데이터의 특성 확인 : describe()

데이터타입 컬럼 등 확인 : info()


head()는 0~ 4번 인덱스까지 출력

tail()은 end-4 ~ end까지 출력

describe에서 확인할 수 있는 것들

스크린샷 2024-01-25 오후 8.28.30.png

# 컬럼명을 간결하고 직관적으로 변경해 줍시다.
cust=cust.rename(columns = {"cust_class" : 'class',"sex_type":'sex', "efct_svc_count":'service', "dt_stop_yn":'stop',"npay_yn":'npay', "r3m_avg_bill_amt":'avg_bill', "r3m_A_avg_arpu_amt":"A_bill", "r3m_B_avg_arpu_amt":'B_bill', "termination_yn":'termination'})
cust.head()
cust = cust.replace("_", np.NaN)

결측치 처리의 특징