Pandas ๋ณต์Šต 1
ยท
Data Science/coding pratice
๋ชฉ์ฐจ - Series์™€ DataFrame, ์ œ๋ชฉ์ปฌ๋Ÿผ ์ถ”๊ฐ€ - csv, excel ํŒŒ์ผ ๋ถˆ๋Ÿฌ์˜ค๊ธฐ - ์ปฌ๋Ÿผ ๋ฐ ์ธ๋ฑ์Šค ์žฌ์ •์˜, ์ง€์ • (df.columns = [], df.index) - info(), describe(), shape, head(), tail() - index, column ์ •๋ ฌ(sort) - Boolean Indexing, isin์ƒ‰์ธ(loc ํ™œ์šฉ) - ๊ฒฐ์ธก๊ฐ’(Null) ์•Œ์•„๋ณด๊ธฐ -df.copy : ๊ทธ๋ƒฅ ๋ฐ”๊ฟ”์„œ df2 ํ• ๋‹นํ•˜๋ฉด ๊ธฐ์กด์˜ df๊ฐ’๋„ ์ˆ˜์น˜๊ฐ€ ๊ณ„์† ๋ฐ”๋€œ -row, column ์ถ”๊ฐ€ํ•˜๊ธฐ, ํŠน์ • row๋งŒ column ๊ฐ’ ๋ฐ”๊พธ๊ธฐ) -ํ†ต๊ณ„๊ฐ’(min, max, sum, mean, var, std ...) -pivot_table Import Pandas as pd 1) series •pd.Ser..
์ปคํ”ผ ํ•„์ˆ˜ ํ˜„๋Œ€์ธ
ยท
์ผ์ƒ log/note
์•„๋ฉ”๋ฆฌ์นด๋…ธ์— ์ต์ˆ™ํ•ด์ง„์ง€ ๋ฒŒ์จ 5๋…„์งธ! 20์‚ด ์ดˆ๋ฐ˜์—” ๊ทธ ์“ด๊ฑธ ์–ด๋–ป๊ฒŒ ๋จน๋ƒ๊ณ , ๋ฐ”๋‹๋ผ๋ผ๋–ผ๋งŒ ๋จน๋‹ค๊ฐ€ 20์‚ด์˜ 11์›”์ฏค๋ถ€ํ„ฐ ์•„๋ฉ”๋ฆฌ์นด๋…ธ๋ฅผ ์ฆ๊ฒจ๋จน๊ธฐ ์‹œ์ž‘ํ–ˆ๋‹ค. 22์‚ด์ฏค ์นดํŽ˜์•Œ๋ฐ”๋ฅผ ํ•˜๋ฉด์„œ ์—์Šคํ”„๋ ˆ์†Œ ์ฝ˜ํŒŒ๋ƒ๋ฅผ ๋จน๊ฒŒ๋˜์—ˆ๊ณ , ํ—ค์ด์ฆ๋„› ์‹œ๋Ÿฝ์„ ๋„ฃ์€ ์•„๋ฉ”๋ฆฌ์นด๋…ธ๋„ ๋ง›์žˆ๊ฒŒ ๋จน๊ฒŒ ๋˜์—ˆ๋‹ค. โ€‹ 24์‚ด์ฏค์—” ๋Š์ž„์—†์ด ๋ชฐ๋ ค์˜ค๋Š” ํŽธ์ง‘์˜ ๋Šช์—์„œ ํ—ˆ์šฐ์ ๋Œ€๋‹ค๊ฐ€ ๋‚จ์€ ์ฒด๋ ฅ์„ ๋Œ์–ด์˜ฌ๋ ค ์‚ด๊ธฐ ์œ„ํ•ด์„œ ์•„์•„ ๋ผ์ง€์‚ฌ์ด์ฆˆ๋ฅผ ํ•˜๋ฃจ ๋‘ ์ž”์”ฉ ๋จน์—ˆ๋‹ค. โ€‹ ๊ทธ๋ฆฌ๊ณ  ์ง€๊ธˆ์€ ์ง€๋‚œ 5๋…„๊ฐ„ ์ง€์ผœ์˜จ ์–ผ์ฃฝ์•„๋ฅผ ํƒˆํ‡ดํ•˜๊ณ  ๋œจ๊ฑฐ์šด ์•„๋ฉ”๋ฆฌ์นด๋…ธ๋ฅผ ๋งˆ์‹œ๋ฉด์„œ ์›”๋ฃจํ•˜๋ฉฐ ๋ธ”๋กœ๊ทธ๋ฅผ ์“ฐ๋Š”์ค‘์ด๋‹ค ใ…Žใ…Ž โ€‹ ์•„๋ฉ”๋ฆฌ์นด๋…ธ๋„ ๋ชป๋จน๋Š” ์ดˆ๋”ฉ์ž…๋ง›์ด ์ด์ œ๋Š” ์›๋‘๋„ ์ง์ ‘๊ณจ๋ผ ๊ทธ๋ผ์ธ๋”๋กœ ๊ฐˆ์•„์„œ ์ง์ ‘ ๋‚ด๋ ค๋จน๊ณ  ์‚ฌ๋Š”๋ฐ... ๋ญ๋“ ์ง€ ์–ธํƒํŠธ ๋ผ์ŠคํŠธํ•์œผ๋กœ ์‚ด๋‹ค๋ณด๋‹ˆ ์ด์ œ๋Š” ๊ฑ ๋ฐฐ๋‹ฌํ•ด๋จน๊ณ , ์ปฌ๋ฆฌํ•ด๋จน๊ณ , ๋“œ๋ฆฝ๋ฐฑ์œผ๋กœ ๋‚ด๋ ค๋จน๊ณ  ๊ฐ€..
Better late than never.
ยท
์ผ์ƒ log
๊ฐ€์žฅ ํฐ ์œ„ํ—˜์€ ์–ด๋–ค ์œ„ํ—˜๋„ ๊ฐ์ˆ˜ํ•˜์ง€ ์•Š๋Š” ๊ฒƒ์ด๋‹ค! ์ผ๋‹จ ๋„์ „ํ•ด๋ณด๋Š” 20๋Œ€์˜ ์ผ๊ธฐ
#1 ์†Œ์šธ(Soul,2021) : ๋‚ด ์ธ์ƒ์„ ์‚ด์•„๊ฐˆ ์ค€๋น„
ยท
๋ฆฌ๋ทฐ/์˜ํ™”
์˜ค๋žœ๋งŒ์— ์˜ํ™”๊ด€์— ๊ฐ”๋‹ค. ๋‚ด๊ฐ€ ๋ณธ ์˜ํ™”๋Š” ๋””์ฆˆ๋‹ˆ·ํ”ฝ์‚ฌ์˜ ํ”ฝ์‚ฌ ํŠน์œ ์˜ ์–ด๋ฅธ์ด๋ฅผ ์œ„ํ•œ ์˜ํ™”๋ฅผ ์ข‹์•„ํ•ด์„œ ์ธ์‚ฌ์ด๋“œ์•„์›ƒ๋„ ์ •๋ง ์ž˜๋ดค๋Š”๋ฐ! ์–ธ๋‹ˆ๊ฐ€ ๊ฐ™์ด ๋ณด๋Ÿฌ๊ฐ€์žํ•ด์„œ ์‹ ๋‚˜๊ฒŒ ๋‹ฌ๋ ค๊ฐ”๋‹ค. ์–ด๋Š ์‚ฌ์ดํŠธ์˜ ์˜ํ™” ํ›„๊ธฐ๋Š” ์ด๋ ‡๊ฒŒ ๋งํ–ˆ๋‹ค. "์˜ํ™”๋ฅผ ๋ณด๊ณ  ๋‚˜์™€ ํ•˜๋Š˜์„ ๋ณด๋Š” ๊ฒƒ๊นŒ์ง€๊ฐ€ ์™„์„ฑ์ด๋‹ค" โ€‹ ์ •๋ง์ด๋‹ค. ์ด ์˜ํ™”๋Š” ๋‹ค ๋ณด๊ณ  ๋‚˜์˜ค๋Š” ๊ฒƒ์—์„œ ๊ฐ์ƒ์ด ๋๋‚˜์ง€ ์•Š์•˜๋‹ค. ๋…ํŠนํ•˜๊ณ  ํ—ˆ๋ฌดํ•œ(?) ์ฟ ํ‚ค์˜์ƒ์ด ์žˆ์—ˆ์Œ์—๋„ ์˜ํ™”๊ด€์„ ๋‚˜์™€ ํ•˜๋Š˜์„ ๋ฐ”๋ผ๋ณด๊ณ , ์นœ๊ตฌ์™€ ๋ฐฅ์„ ๋จน๊ณ , ํ˜น์€ ์ง‘์œผ๋กœ ํ–ฅํ•˜๋ฉฐ ๋งฅ์ฃผ ํ•œ ์บ”์„ ์‚ฌ๊ฐ€๋Š” ์ˆœ๊ฐ„๊นŒ์ง€๊ฐ€ ์˜ํ™”์˜ ํ™˜์„ฑ์ด๋ผ๊ณ  ๋งํ•  ์ˆ˜ ์žˆ์—ˆ๋‹ค. โ€‹ ์˜ํ™”๋ณด๊ณ  ๋‚˜์˜ค๋‹ˆ ๊ทธ๋ ‡๊ฒŒ ํŽ˜ํผ๋กœ๋‹ˆ ํ”ผ์ž๊ฐ€ ๋จน๊ณ ์‹ถ๋”๋ผ.. ๊ทผ์ฒ˜์— ๋ง›์žˆ๋Š” ํ”ผ์ž ๊ฐ€๊ฒŒ๋ฅผ ์ž˜ ๋ชฐ๋ผ์„œ ์ฐจํƒ€๊ณ  ๋‚˜๊ฐ€ ์ˆ˜์ œ๋ฒ„๊ฑฐ๋ฅผ ๋จน๊ณ  ์ง‘์œผ๋กœ ๋Œ์•„๊ฐ”๋‹ค. ์—ฐ์ฐจ๋ฅผ ์“ฐ๊ณ  ์˜ํ™”๋ฅผ ๋ณธ ๋’ค ๋จน๋Š” ํ–„๋ฒ„๊ฑฐ๋Š” ์ตœ๊ณ ์˜€๋‹ค...