ML 0. 통계분석 | 통계적 추론과 통계적 검정
·
Data Science/ML
통계분석(Statistical Analsis) 1. 통계학과 기술통계 2. 확률분포 3. 통계적 추론과 통계적 검정 ← 오늘은 여기! 1번과 2번을 먼저 보고싶다면? https://heesleisure.tistory.com/28 ML 0. 통계분석 통계분석(Statistical Analsis) 1. 통계학과 기술통계 2. 확률분포 3. 통계적 추론과 통계적 검정 1. 기술통계 데이터의 속성을 특정한 통계량을사용해 정리, 요약, 설명하는 방법 중심척도 중심경향성: heesleisure.tistory.com 3. 통계적 추론과 통계적 검정 1) 기술통계와 추론통계 - 기술통계: 측정이나 실험을 통해 수집한 통계 자료의 정리/표현/요약/해석을 통하여 자료의 특성을 규명하는 방법과 기법 - 추론통계: 한 모집단..
CNN(Convolutional Neural Network)
·
Data Science/DL
CNN(Convolutional Neural Network) Convolution을 통한 Filtering과 Max Pooling을 반복하여 정말 중요한 특징을 정제한 후 Classification하는 것 과정 Feature extraction + Classification - Feature extraction: Convolutional layer + max pooling, 특징을 뽑아냄 - Classification: Fully-connected layer, 물체를 판단함 Neural Network 이전에는? Adaptive boosting(Adaboost) :사람이 기정의한 필터를 크기와 모양을 바꾸고 회전시키며 빨간색의 바운딩 박스 영역에 대해 computation 연산을 함 좌상단에서부터 슬라이딩..
ML 0. 통계분석
·
Data Science/ML
통계분석(Statistical Analsis) 1. 통계학과 기술통계 2. 확률분포 3. 통계적 추론과 통계적 검정 1. 기술통계 데이터의 속성을 특정한 통계량을사용해 정리, 요약, 설명하는 방법 중심척도 중심경향성: 중심적인 경향을 나타내는 주요한 기술통계 산술평균, 중앙값, 최빈치 산포척도 데이터가 퍼져있는 정도를 설명하는 기술통계 범위, 분산, 표준편차, 사분위수 범위(IQR) 분포모양 데이터가 퍼져있는 형태를 나타낸 것 도수분포, 비대칭도(왜도, 치우친 정도), 첨도(뾰족한가 완만한가) 1) 산포척도 - 범위: 최대값과 최소값의 차이 - 제곱의 합(Sum of Squares) 편차는 다 더하면 0이 되는 딜레마가 생긴다 → MSE(제곱하여 합) / MAE(절대값의 합) 잘 알려진 예는 표준편차, ..
알고리즘 스터디0. 시간복잡도와 빅오(Big O)
·
Data Science/coding pratice
1. 시간복잡도란? (Time Complexity) 실행시간(running time)이란 함수/알고리즘 수행에 필요한 스텝(step) 수 각 라인을 수행하기 위해 필요한 스텝 수는 상수(constant)라고 가정 T(N) = c1 + c2*(N+1) + c3*N + 1 = (c2+c3)*N + c1 + c2 + 1 = a*N + b N이 작을 때의 실행시간은 의미가 없다. N이 무한대로 갈 때 N이 커질수록 덜 중요한 것은 제거(b 제거) 최고차항만이 의미를 갖게되며(여기서는 N) 최고차항의 계수(a) 또한 의미가 없다.(a 제거) → N만 남음 (Big) theta N = N → 점근적 분석에 따른 점근적 표기법 또한 시간복잡도는 함수의 실행시간을 점근적 분석을 통해 점근적 표기법으로 표현한다. 시간..
ML 2. Logistic Regression(로지스틱 회귀모형)
·
Data Science/ML
1. Logistic Regression(로지스틱 회귀모형) 개념 2. Confusion Matrix와 AUROC 3. Multiclass Classification 1. Logistic Regression(로지스틱 회귀모형) 개념 연속형 데이터를 input하여 sigmoid 함수를 통해 이산형(범주형) 데이터를 도출(output) ex)binary classfication Linear Regression + Rogistic Functoin (선형회귀 + 로지스틱 함수) 즉, 정답이 범주형일 때 사용하는 Regression Model 일반 선형/비선형 회귀모델과 같이 연속형 데이터를 넣어주는 것(input)은 같음 https://www.youtube.com/watch?v=14eTDPJLkis 2. Con..
Python numpy: reshape(-1, n) 에서 -1은 뭘까?
·
Data Science/Python 기초
Regression 인강듣는 도중 나온 reshape(-1, 1)을 보고 -1이 왜 들어가는걸까? 하고 궁금해서 찾아봄 결론부터, -1은 마치 n과 같이 가변적임을 나타내는 숫자이며, 뒤의 열의 숫자에 따라서 모든 원소가 누락되지 않도록 행렬을 구성해줌 ex) a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]]) a.shape >> (3, 4) a.reshape(-1, 12) >> 열이 12개가 되도록 행이 1개가 됨 a.reshape(-1, 6) a.reshape(-1, 2) a.reshape(-1,12) 열이 6개가 되어야 하므로 2x6 행렬 구성 열이 2개가 되어야 하므로 6x2 행렬 구성 열이 12개가 되어야 하므로 1x12 행렬 구성 1 3 5 7 9 11 ..
깃허브
·
카테고리 없음
https://zzsza.github.io/category/data/ Data Data와 관련된 글을 작성하는 공간 zzsza.github.io 도움을 많이 받은 깃허브 열심히해보자... 정말... 2022.11.21 내 깃허브를 생성했다 아직 바보 그 자체이나 화이팅! https://github.com/Keemjaehee Keemjaehee - Overview GitHub is where Keemjaehee builds software. github.com https://www.youtube.com/watch?v=lelVripbt2M 깃헙 초기설정 한국어버전 최고의 영상
Data Scientist
·
Idea/분야 탐방
https://github.com/Team-Neighborhood/I-want-to-study-Data-Science/wiki/%EB%8D%B0%EC%9D%B4%ED%84%B0-%EC%82%AC%EC%9D%B4%EC%96%B8%ED%8B%B0%EC%8A%A4%ED%8A%B8 GitHub - Team-Neighborhood/I-want-to-study-Data-Science: 데이터 사이언스를 공부하고 싶은 분들을 위한 글 데이터 사이언스를 공부하고 싶은 분들을 위한 글 . Contribute to Team-Neighborhood/I-want-to-study-Data-Science development by creating an account on GitHub. github.com 데이터 사이언티스트란 무..