yessen 2023. 1. 4. 13:41
728x90

시간에 따른 값들의 집합을 시계열 데이터라고 할 수 있다.

이러한 시계열 데이터는 크게 정상성(statioinary) 데이터와 비정상성(non-stationary) 데이터로 나눌 수 있다. 

 

I. 데이터의 구분

1. 정상성(stationary) 데이터

- 뚜렷한 추세가 나타나지 않고 변동이 시간에 따라 일정한 데이터

- 데이터의 성질이 일정함

 

2. 비정상성(non-stationary) 데이터

- 정상적이지 않은 시계열 데이터

- 추세 변동이나 계절 변동이 포함됨

 

 II. 시계열 패턴

1. 추세(trend)

  - 데이터가 장기적으로 증가하거나 감소하는 패턴

  - 선형, 비선형 존재

 

2. 계절성(seasonality)

  - 특정 주기마다 반복되는 경향의 패턴

  - 일정한 빈도의 형태로 나타남 (ex. 크리스마스의 케익 판매량 등)

 

3. 주기성(cycle)

  - 고정되지 않은 형태로 빈도의 증가나 감소가 나타나는 패턴

  - 빈도가 일정하지 않고 보통 계절성 패턴의 길이보다 길며, 변동성이 큼

 

출처: A Toolbox for State Space Modeling