[나는 주니어 개발자다]
- 김설화, 문용기, 정종윤, 지찬규, 최재용
이 책을 집어든 이유:
마포 도서관에서 데이터 분석가의 저서를 찾는데 비전공 분석가보다는 비전공 개발자의 책이 많았고,
마침 발견한 이 책은 정말 나같이 정확하게 해야할 일을 몰라 갈피를 못잡았던 사람들의 이야기를 모아놓은 것 같아 빌려오게 됐다.
분석가든 개발자든 이론보다 중요한 것은 실전 경험.
컴공과를 전공했던 사람도, 보건학과 출신 비전공자가 취성패를 통해 해외취업까지 한 사례에도
결국 필요한 것은 선행 지식보다는 경험을 통해 내가 좋아하는 언어와 잘할 수 있는 언어 혹은 툴, 그리고 라이브러리 사용 경험, 단 3일이라도 좋으니 직접 코드 설계를 통해 결과물을 이뤄본 경험이다.
이 책에서도 말한다. 개발, 컴퓨터공학을 위해서는 선형대수와 미적분 지식이 필요하며 이를 위해 잊고있던 중학교 수학 지식까지 공부하는 것은 시간낭비라고. 그때그때 필요한 개념을 찾아 습득하는 것이 더 빠르고 바른 공부법 일 수 있다고.
나는 이에 공감한다. 지난 몇 달 동안, 회사를 다니고 있으니 좀 더 여유롭게 기초 지식을 다지고자 했던 나는 유튜브를 통해 미적분을 공부하고(중고등학교 지식이니 복습이다), k-mooc를 통해 선형대수에 입문했다. Python 인강까지 들었으니 행렬과 벡터 개념은 이해가 조.금. 쉬웠다. 3차원을 넘어가는 공간에 내가 왜 문과를 선택했을까.. 하는 후회와 함께.
이는 후에 분명 도움이 될 것이다. 대학원에 진학해서 배울 기초 수학이라던지, 알고리즘이나 데이터셋에 대한 이해도를 높여줄 것이다. 이는 배움에 대한 후회라기 보다는 조금 더 빨리 알았다면 시간을 아낄 수 있지 않았을까... 하는 아쉬움이다.
세상에는 네카쿠라배(네이버, 배민, 카카오, 쿠팡, 라인)을 미친 알고리즘 설계 능력과 코딩 실력으로 들어가는 천재 개발자만 있는게 아니다. 나보다 빨리 컴퓨터공학을 접했거나 혹은 4차산업혁명의 메세지를 깨닫고 빨리 전공읕 틀어 이제 막 입문한 사람이 한 줄 한 줄 코딩을 해가며 '어? 이게 왜 되지?', '어? 이게 왜 안되지?' 사이에서 고민하는 경우도 부지기수다. 이 책은 그런 사람들의 이야기다. 조금 더 빨리 읽었다면 취업보다 대학원을 선택했을텐데.. 취업을 했다가 8개월간 회사 생활을 하고 대학원을 준비하는 나로서는 이 책을 1년만 빨리 만났더라면 싶다.
사실 아직 읽고 있는데, 면접 준비라던지 언어 준비과정이라던지 참 도움이 많이 된다. 좋아하고 잘하는 영역을 찾아 세밀화하고, 직접 실행에 옮겨보는 것이 결국은 핵심이다. (진짜 실습이다,실습이 전부다. 최근 들었던 포스텍 강의 윤은영 교수님께서도 직접 해보라는 말을 매 강의마다 하신다.) 그래서 이걸 '조금 영역이 겹치는 빅데이터에 똑같이 적용하면 되지 않을까?' 하는 생각이 들었다. 무작정 캐글 사이트에 들어가 그렇게 많이 본다는 타이타닉 데이터를 한 번 구경해보고, 공공데이터 포털에 들어가 데이터를 한 번 살펴보고, 회사에서 빅데이터학과와 협약식을 맺은 문서를 살펴보며 담당자가 우리 회사의 주차단속 데이터를 어떻게 분석했는지를 살펴보는 등 어떻게든 데이터와 친숙해지고자 했던 내 노력이 헛되지는 않았구나, 싶다. 물론 우리 회사에는 데이터 분석가가 없고, 조금 배워본게 다인 내가 빅데이터 혁신 업무를 맡았던 대리보다 더 많이 아는 수준이라 그런지 큰 성과는 없었지만 말이다.
또 취업준비 당시 생각도 났다. 그 당시 나는 내게 맞는 직무가 뭔지 도무지 모르겠다는 생각이 들었다. 그래서 공기업으로 방향을 틀었던 거고, 이는 보기좋게 내 성향과 반대되는 선택이었다. 취업을 위한 자기소개서가 아닌, '마케터'의 자기소개서여야 했다. 맞아 그때 그렇게 생각했었지... 라고 이 책을 읽으며 다시금 떠올렸다. 나는 그 회사의 신입사원이 아니라 데이터 분석가이자 마케터에 지원하는 것이며 그것을 위한 자기소개서와 포트폴리오가 필요하다. 보다 구체적이어야 하고, 보다 진짜 노력한 경험이 있어야 한다. 밤을 새서라도 코딩을 한 번 해봐야한다고 언니 남자친구는 말했다.
데이터 분석가에게 필요한 직무기술은 무엇인가? 그것을 알기 위해 50개정도 되는 회사의 직무기술서를 보라고 추천했다. 난 지금까지 한 세 군데 공고의 직무기술서를 보았는데(늘 시작은 창대하지만 끝은 미미한 나) 공통적으로 적힌 요구 역량은 이렇다.
- SQL 및 기본적 분석 스크립트 작성, 이해
- 비즈니스 인텔리전스(BI) 도구 및 비즈니스 리포팅 도구 자유자재 사용(Tableau, Qilk 등)
- 프로그래밍 언어(Python/R 등) 활용한 데이터분석을 원활하게 수행
여기서 부터는 우대
- 컴퓨터 공학, 수학, 통계학, 데이터 마이닝 관련 분야 석/박사 학위
- 통계적 가설 검정에 대한 기술적 역량
여기서 우선 할게 정해진다.
매일 데이터분석 관련 공고를 찾아 책에서 처럼 50개정도를 살펴보고 필요한 역량에 대한 표본크기를 늘리는 것.
그리고 애초에 잡아놨던 논문읽기와 깃허브 활용, 아주 기초적이더라도 타이타닉 데이터 같은걸 더 살펴보는 것
우선 포스텍에서 선수과목으로 선정한 <프로그래밍 언어 Ⅰ, Ⅱ>, <Python Ⅰ, Ⅱ>을 다 들었으니 정리해둔 미적분을 공부하고,
포스텍 서류 결과가 나오기 전까지 k-mooc 선형대수 인강을 열심히 들을 것!
그리고 이번달 안에 책 좀 마저 읽기.
목표를 구체화하고 상념을 없애는데 아주 좋은 책이었다.
오늘의 독서 후기는 여기서 끝!!