Pandas ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ์ค์ต
ยท
Data Science/coding pratice
์ค์ ๋ถ๋์ฐ ๋ฐ์ดํฐ๋ก ๋ฐ์ดํฐ์ ์ฒ๋ฆฌ ์ค์ต์ ์งํ 1. column ์ฌ์ ์→ rename : column์ ์ด๋ฆ์ด ๋ณต์กํ ๊ฒฝ์ฐ ์ฌ์ ์๋ฅผ ํด์ค๋ค #๋ด๊ฐ์ง ์ฝ๋ df.columns = ['์ง์ญ๋ช
', '๊ท๋ชจ๊ตฌ๋ถ', '์ฐ๋', '์', '๋ถ์๊ฐ๊ฒฉ'] >> ์ด๋ฆ์ ๋ค ๋ฃ์ด์ค์ column์ด๋ฆ์ ์๋ก ๋ถ์ฌํด์ค #ํด์ค df = df.rename(columns={'๋ถ์๊ฐ๊ฒฉ(ใก)':'๋ถ์๊ฐ๊ฒฉ'}) 2. column์ datatype ๋ณํ: astype df['๋ถ์๊ฐ๊ฒฉ'].astype(int) 3. strip์ผ๋ก ๊ณต๋ฐฑ์ด ์๋ ๋ฐ์ดํฐ ๊ณต๋ฐฑ์์ ๊ธฐ: strip() column์ ๋ฌธ์์ด์ strip์ ์คํํ๊ณ ์ ํ ๋๋ str.strip() df.loc[df['๋ถ์๊ฐ๊ฒฉ']==' '] #ํ์ธ df['๋ถ์๊ฐ๊ฒฉ'] = df['๋ถ์๊ฐ๊ฒฉ']...