ARIMA 모델은 자기상관성을 보정하고 데이터의 변화 패턴을 이해하는 데 도움을 주며, 최적의 파라미터를 찾는 방법과 AIC를 통한 모델 적합성을 평가하는 방법을 설명합니다. ARIMA는 기본적으로 과거 데이터를 기반으로 한 예측을 제공하며, 이를 통해 데이터 분석가가 더 나은 결정과 인사이트를 도출할 수 있도록 돕습니다. 시계열 데이터를 다루는 데 있어 ARIMA의 사용과 이해는 필수적이며, 이는 데이터 분석에 필수적인 기초를 제공합니다.
Key topics
ARIMA 모델은 시간의 자기상관을 관리하는 중요한 도구이다.
- ARIMA는 과거의 측정치가 현재에 영향을 미치는 경우에 사용되며, 프로모션, 고객 충성도, 계절적 영향을 포함한 다양한 요소를 고려한다.
- 모델은 p, d, q 세 가지 구성 요소로 나뉘며, 각각은 자기회귀, 차분, 이동평균을 나타낸다.
AIC는 모델 적합도를 평가하는 중요한 기준이다.
- AIC는 패널티 회귀 분석과 유사하게 작동하여 과적합을 줄이는데 도움을 준다.
- 작은 AIC 값은 모델 간 균형을 나타내며, 최선의 모델 선택에 기여한다.
ARIMA 및 AIC는 회귀 분석과 밀접한 관계가 있다.
- ARIMA는 OLS와 비슷한 구조를 가지며, R의 형태적인 특성을 공유한다.
- ARIMAX는 ARIMA에 외생변수를 결합하여 분석력을 더욱 높인다.
Timeline
1. ARIMA 모델의 개념과 구성 요소p.2-9
- ARIMA는 시간의 자기상관을 수정하기 위해 사용되며, 이전 측정이 현재 측정에 영향을 미칠 때 활용된다.
- 주요 요소로는 프로모션, 구두 광고, 고객 충성도, 제품 채택, 경쟁, 그리고 계절적 영향이 있다.
- ARIMA 모델은 p(자기회귀), d(차분), q(이동평균)로 구성되며, 각각 이전 시간 포인트의 수, 데이터를 정상화하기 위해 차분할 횟수, 그리고 이전 예측 오차의 수를 나타낸다.
- 모델의 수식은 Sales = α + β1Sales( -1) + γ1Error( -1) + γ2Error( -2)로 표현된다.
- 모델의 적합도를 평가할 때는 AIC를 사용하며, k는 매개변수의 수, L은 데이터에 모델이 얼마나 잘 맞는지를 의미한다.
2. 📊 AIC와 회귀 분석의 유사성p.10-17
- AIC는 패널티 회귀 분석과 매우 유사하며, OLS의 잔차 제곱합에 패널티를 추가하여 편향과 분산의 균형을 맞추어 과적합을 감소시킨다.