[Econometrics, 계량경제학] 고정 효과(Fixed Effect) 사례 분석
·
Data Science/Econometrics
https://www.youtube.com/watch?v=UNIF-jHY2Rk들어가기 전에https://heesleisure.tistory.com/55 [Econometrics, 계량경제학] 데이터 구조와 고정 효과(Fixed Effect)https://www.youtube.com/watch?v=yZOTgQfVfxQ 데이터 구조Cross-sectional Data : 여러 유닛, 특정 시점의 정보를 포함 (서베이 등 데이터를 모음)Time-Series Data : 하나의 유닛, 시간에 따른 변화 (주식 가격, 국가의 Gheesleisure.tistory.com  이전 글을 먼저 읽어보시면 이해가 빠르실 겁니다! How Fixed Effects Work for Causal Inference어떤 방식으로 작..
[Econometrics, 계량경제학] 데이터 구조와 고정 효과(Fixed Effect)
·
Data Science/Econometrics
https://www.youtube.com/watch?v=yZOTgQfVfxQ 데이터 구조Cross-sectional Data : 여러 유닛, 특정 시점의 정보를 포함 (서베이 등 데이터를 모음)Time-Series Data : 하나의 유닛, 시간에 따른 변화 (주식 가격, 국가의 GDP 등)Panel (longitudinal) Data : 여러 유닛, 시간에 따른 변화동일한 유닛에 대해 시간에 따른 변화를 관찰할 수 있어야 함즉, 각 시점마다 유닛이 다르거나 유닛 ID가 없어서 추적이 불가능하다면? pooled cross-sectional data 됨  Recall How to Remove the Selection Bias 인과추론을 방해하는 최대의 적은? 선택 편향 (Treatment가 없는 상황에서..
Ensemble(앙상블): Bagging과 Boosting, Stacking
·
Data Science/ML
Ensemble(앙상블)이란?여러개의 분류기를 생성하고 그 예측을 결합함으로써 최종 예측을 도출하는 방법 Bagging과 Boosting의 차이점Bagging: 병렬적, parallel함Bootstrap Aggregating, 부트스트랩(랜덤 샘플링)을 집계하는 것, 여러 샘플 조합에 대하여 하나의 알고리즘(모델) 활용샘플링 과정은 복원추출임데이터가 많지 않아도 충분한 학습효과를 주어 underfitting, overfitting 문제에 도움됨Bagging의 대표적인 기법으로 RandomForest가 있음  Boosting: 순차적, sequential함오분류된 학습 데이터에 대해서 가중치를 주고 다음 모델(분류기)에서 해당 데이터를 학습하게 유도먼저 생성된 모델을 점점 발전시켜나가는 방법임   Stac..
[MODUPOP Seminar] Gen AI Safety & Security
·
Data Science/LLM
https://festa.io/events/4739 [강남] 모두팝 세미나 | Gen AI Safety & Security | Festa! Festa에서 당신이 찾는 이벤트를 만나보세요. festa.io 이번 주제는 모두의연구소에서 주최한 [Gen AI Safety & Security] 오픈 세미나이다. 모두콘 이후로 플친이 된 나와 모두연.. 요새 개인연구&프로젝트로 LLM과 프롬프트를 한창 공부하고 있었는데 이런 세미나라니! 근데 신촌과 정반대 강남캠퍼스를 저시간에 가는건 무리라 온라인 수강을 하기로 했다. (지금 생각하니 신의 한 수임) 연구실 멤버들에게 같이듣자고 꼬시는중 일단은 나만 들은 것 같긴해 ... 아쉬움을 뒤로하고,, 오늘 주제는 휘발성이 꽤 강한 내용이라 간략히 정리만 해보려한다 목차..
[1강][CV] 딥러닝 기초 이론 CS231n
·
Data Science/CS231n
보호되어 있는 글입니다.
[LLM] LangChain으로 ChatGPT API 활용 & 프롬프트 템플릿
·
Data Science/LLM
출처: https://www.youtube.com/watch?v=BLM3KDaOTJM&list=PLQIgLu3Wf-q_Ne8vv-ZXuJ4mztHJaQb_v&index=3 https://www.youtube.com/watch?v=y6D5Hn_k4lE&list=PLQIgLu3Wf-q_Ne8vv-ZXuJ4mztHJaQb_v&index=5 API를 통해 ChatGPT와 대화하기 davinci-003 vs gpt-3.5-turbo: GPT 버전 차이(3과 3.5) temperature: chat-gpt가 내놓는 답변의 일관성을 조절하는 매개변수 0~2까지 설정 가능 0일 경우 답변이 일관적, 2일 경우 random하게 나오는 경향이 있음 callbacks의 streaming_stdout 내에서 streaming..
[LLM] LangChain: 초거대 언어모델 간단 설명
·
Data Science/LLM
출처: https://youtube.com/watch?v=XwlLeVhWCCc LangChain의 구조 LLM 뿐만 아니라 자연어 형태로된 데이터 처리를 위해 현재 NLP(Natural Language Process) 모델의 거의 대부분은 Transformer 아키텍처를 기반으로 하며, 모델의 용도에 따라 트랜스포머의 Encoder, Decoder를 개별 또는 통합 사용하는 추세 기계와 말을 주고받기 위해 어떤 식으로 모델을 구성해야하는지 연구하다가 최종적으로 효율적이라고 판단한 구조가 바로 Transformer 모델이므로, 우리의 말을 '잘 이해하고', 의도된 대로 '대답을 잘 하는' 역할이 중요함 Encoder: 문장을 줬을 때 잘 이해하는 부분을 담당(분홍색) Decoder: 말을 잘 하는 부분(파..
[LLM] LangChain의 모든 것
·
Data Science/LLM
출처: https://www.youtube.com/watch?v=WWRCLzXxUgs&list=PLQIgLu3Wf-q_Ne8vv-ZXuJ4mztHJaQb_v 정의 언어모델로 구동되는 애플리케이션을 개발하기 위한 프레임 워크 → 데이터 소스를 기반으로 이야기할 수 있도록 함, 구체적인 툴과 방법론을 제시하지 않아도 다양한 환경과 상호작용이 가능함 ex) 최근 LLM 동향을 알고 싶다면? 에이전트 기능을 이용해 어떤 요청을 넘겼을 때, 그것을 기반으로 어떤 툴을 활용해야할지 랭체인이 결정하여 인터넷 검색을 한다던가 등 함으로써 정제된 답변을 제공할 수 있음 데이터 인식: 언어 모델을 다른 데이터 소스에 연결 에이전트 기능: 언어 모델이 환경과 상호 작용할 수 있도록 함 왜 써야할까? 1) 정보 접근 제한 최..