생각이 담아두는 곳

Introduction to Trading, Machine learning&GCP [5] 본문

CS/ML

Introduction to Trading, Machine learning&GCP [5]

Chang_Tree 2020. 4. 28. 00:52

Forecasting 

대용량의 데이터를 INPUT으로 주입해, 고차원의 영역에서(여기서 고차원이란, 많은 feature를 다루는 것을 뜻함) 복잡한 수학식을 이용해, 놀라운 결과를 OUTPUT으로 내는 것이다. 

 

Forecasting 의 두 가지 분류

공통점은, 아래 둘 다 데이터를 모으고, 정제하고, 모델을 만들고, 실험하고, 결과를 만들어내야 한다는 것이다.

 

질적예측 

- 두가지 통상적인 질문에 대답하고 그들의 답변에 정당성을 부여하며, 이에 대해 수정이나 거부할 수 있는 전문가가 포함된다. 역사적 수명주기(시장), 시장 조사 등이 예시가 될 수 있다. 따라서 전문가의 판단에 의해 주관적인 결과를 내놓을 수 있으므로, 과거 데이터가 존재하지 않을 때 쓰인다.

 

양적예측 

- 과거 수치 데이터가 이용가능할 때, 그리고 특정 패턴이 미래에도 계속될 것 같을 때 사용하는게 적절하다. 

 

아래는 양적예측의 두가지 분류

1. Casual 

단일 설명 변수를 사용하여 모형화하거나 다중 변수를 사용하여 더 복잡한 모형을 모형화

회귀 분석에서는 설명 변수를 사용하여 변수를 예측하는 반응을 설명한다

Regression 을 이용하며, 반응을 설명하기 위해 변수들을 사용한다. 

 

 

2. Time Series 

 

미래에 대한 예측으로 마지막 기간의 실제 값의 함수를 사용

 

미래 데이터를 예측하기 위해 과거 데이터를 이용한다. (다른 변수는 없음)

 


출처  coursera
출처 coursera

내가 구조화 시킨 데이터에 따라서, 적절한 모델을 선택해야한다. 

이전 글에서 Linear Regression 을 사용한 것과 같이

 

구글에서 만든 BigQuery를 이용해 머신러닝 모델 구현에 대해 소개하고 있다.

 

출처) coursera
출처) coursera 

자사 제품을 이용하면 좋은 점에 대해 나열하고 있는데, 개인적으로 4번째가 어떤지 궁금하다. 

 

Comments