Python numpy: np.log1p()란 뭘까?

2022. 11. 21. 10:53·Data Science/Python 기초

포스코 빅데이터 프로젝트의 데이터 전처리 부분을 봤는데,

연속형인 결과변수에 np.log1p() 함수를 취해준 것을 보았다.

 

왜 np.log1p()를 해준 것일까?

 


https://velog.io/@gjtang/np.log1p%EB%A5%BC-%ED%95%98%EB%8A%94-%EC%9D%B4%EC%9C%A0

 

np.log1p()를 하는 이유

np.log1p()를 하는 이유

velog.io

※ 참고

 

로그

큰 값을 작은 값으로 표현하기 위해 사용된다.

 

예를 들어, NN이나 logistic regression의 경우, binary classification의 마지막 레이어에서 activation function으로 sigmoid를 활용한다.(softmax는 multinomial classification)

이건 또 이걸 보면 되는데..

 

아무튼 연속형 변수를 예측하기 위해서는 보통 선형함수(y=ax+b)를 쓰면 되지만, binary의 경우 종속변수가 범주형(0, 1)이므로 선형함수를 이용하면 의미가 없다. 그래서 시그모이드 함수를 통해 실수범위로 표현해서 구함 암튼 그럼

https://icim.nims.re.kr/post/easyMath/64

 

활성함수(Activation) 시그모이드(Sigmoid)함수 정의 | 알기 쉬운 산업수학 | 산

 

icim.nims.re.kr

 

 

 

각설하고,

아무튼 로그로 변환을 해주면 > np.log()

0<x<1 범위에서 y의 값이 급격하게 변하며, 특히 x가 0에 가까워질수록 -∞로 수렴하는 것을 볼 수 있다.

그래서 log(x)에 1을 더해주는데, 그걸 컴퓨터가 연산하기 편하도록 만든게 np.log1p()임

 

 

출처: https://data-scientist-jeong.tistory.com/16

 

ax.plot(x, np.log1p(x))
ax.plot(x, np.log(x))

 

 

 

x = 0로 수렴할 때, 원래라면 y는 음의 무한대로 발산하겠지만

np.log1p()에 적용할 경우 x = 1이 되므로 y는 0의 값을 가진다.

 

 

 

 

 

 

저작자표시 비영리 동일조건 (새창열림)

'Data Science > Python 기초' 카테고리의 다른 글

데이터 채굴하기 1편: 웹 스크래핑  (0) 2023.02.09
Python numpy: reshape(-1, n) 에서 -1은 뭘까?  (0) 2022.07.23
Python 기초  (0) 2022.04.22
'Data Science/Python 기초' 카테고리의 다른 글
  • 데이터 채굴하기 1편: 웹 스크래핑
  • Python numpy: reshape(-1, n) 에서 -1은 뭘까?
  • Python 기초
희스레저
희스레저
👩🏻‍🎓 Master Student in IS(Information System) 📚 Data Science & Causal Inference Study 🎬 Hobby
  • 희스레저
    Data Dive
    희스레저
  • 전체
    오늘
    어제
    • 분류 전체보기 (52)
      • 일상 log (4)
        • 브이로그 아카이브 (0)
        • note (3)
      • 리뷰 (1)
        • 영화 (1)
        • OTT (0)
      • Data Science (38)
        • ML (6)
        • DL (4)
        • LLM (5)
        • Econometrics (5)
        • coding pratice (9)
        • kaggle study (1)
        • Python 기초 (4)
        • CS231n (1)
        • Paper (3)
      • Idea (8)
        • 분야 탐방 (5)
        • 대학원준비 (2)
        • book blogging (1)
        • 취업준비 (0)
  • 블로그 메뉴

    • 홈
    • 방명록
    • 블로그
    • Write
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    카누추천
    Econometrics
    영화소울
    fixed effect
    고정효과
    모두의연구소
    불연속회귀
    promptengineering
    놈코어커피
    계량경제테스트
    fixed effects
    모두콘2023
    생성형AI
    계량경제
    모두콘
    소울후기
    계량경제학
    panel data
    GenAI
    모두연
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.0
희스레저
Python numpy: np.log1p()란 뭘까?
상단으로

티스토리툴바