평활화 시계열. 시계열 평활화 방법

현재 위치: 사업 시작

15/02/16 빅토르 가브릴로프

38133 0

시계열은 시간이 지남에 따라 변하는 일련의 값입니다. 나는 이 글에서 그러한 시퀀스를 작업하는 간단하지만 효과적인 접근 방식에 대해 이야기하려고 합니다. 통화 시세, 판매량, 고객 요청, 다양한 응용 과학(사회학, 기상학, 지질학, 물리학 관측)의 데이터 등 이러한 데이터의 예가 많이 있습니다.

시리즈는 우리가 관심 있는 가치의 전체 변화 내역을 관찰할 수 있게 해주기 때문에 데이터를 설명하는 일반적이고 중요한 형식입니다. 이는 수량의 "전형적인" 동작과 그러한 동작으로부터의 편차를 판단할 수 있는 기회를 제공합니다.

나는 시계열의 특징을 명확하게 보여줄 수 있는 데이터 세트를 선택하는 작업에 직면했습니다. 나는 이 데이터 세트가 매우 명확하고 어느 정도 표준이 되었기 때문에 국제 항공 승객 교통 통계를 사용하기로 결정했습니다(http://robjhyndman.com/tsdldata/data/airpass.dat, 소스 Time Series Data Library, R. J. Hyndman). 이 시리즈는 1949년부터 1960년까지 월별 국제선 승객 수(천 단위)를 설명합니다.

나는 항상 행 작업을 위한 흥미로운 도구 ""를 가지고 있으므로 그것을 사용할 것입니다. 데이터를 파일로 가져오기 전에 값이 시간과 연결되도록 날짜가 있는 열과 각 관찰에 대한 계열 이름이 있는 열을 추가해야 합니다. 아래에서는 시계열 분석 도구에서 직접 가져오기 마법사를 사용하여 Prognoz Platform으로 가져온 소스 파일의 모습을 볼 수 있습니다.

우리가 일반적으로 시계열을 사용하여 가장 먼저 하는 일은 시계열을 그래프에 그리는 것입니다. Prognoz 플랫폼을 사용하면 시리즈를 통합 문서로 끌어서 차트를 작성할 수 있습니다.

차트의 시계열

시리즈 이름 끝에 'M' 기호는 해당 시리즈가 월간 역학을 갖는다는 것을 의미합니다(관찰 간격은 1개월입니다).

이미 그래프에서 이 시리즈는 두 가지 기능을 보여줍니다.

경향– 차트에서 이는 관측된 값의 장기적인 증가를 나타냅니다. 추세가 거의 선형에 가깝다는 것을 알 수 있습니다.
계절성– 그래프에서는 주기적으로 가치가 변동합니다. 시계열 주제에 관한 다음 기사에서는 기간을 계산하는 방법을 알아 보겠습니다.

우리 시리즈는 매우 "깔끔"하지만 위에서 설명한 두 가지 특성 외에도 "노이즈"의 존재를 보여주는 시리즈가 종종 있습니다. 어떤 형태로든 무작위로 변형됩니다. 이러한 시리즈의 예는 아래 차트에서 볼 수 있습니다. 이것은 랜덤 변수와 혼합된 사인파입니다.

시리즈를 분석할 때 우리는 시리즈의 구조를 식별하고 모든 주요 구성 요소(추세, 계절성, 노이즈 및 기타 기능)를 평가하는 것뿐만 아니라 미래 기간의 가치 변화를 예측하는 능력에도 관심이 있습니다.

시리즈로 작업할 때 노이즈가 있으면 시리즈 구조를 분석하기 어려운 경우가 많습니다. 영향을 제거하고 계열의 구조를 더 잘 확인하려면 계열 평활화 방법을 사용할 수 있습니다.

계열을 평활화하는 가장 간단한 방법은 이동 평균입니다. 아이디어는 계열 시퀀스의 홀수 점에 대해 중앙 점을 나머지 점의 산술 평균으로 바꾸는 것입니다.

어디 x 나는– 초기 행, 나야?– 평활화된 계열.

아래에서는 이 알고리즘을 두 시리즈에 적용한 결과를 볼 수 있습니다. 기본적으로 Prognoz 플랫폼은 창 크기가 5포인트( 케이위의 공식에서는 2)와 같습니다. 평활화된 신호는 더 이상 노이즈의 영향을 받지 않지만 노이즈와 함께 당연히 시리즈의 역학에 대한 일부 유용한 정보도 사라집니다. 또한 스무딩된 계열에는 첫 번째(및 마지막)가 부족하다는 것도 분명합니다. 케이포인트들. 이는 창의 중앙 지점(여기서는 세 번째 지점)에서 스무딩이 수행된 후 창이 한 지점만큼 이동되고 계산이 반복되기 때문입니다. 두 번째 무작위 계열의 경우 계열의 구조를 더 잘 식별하기 위해 30의 창을 사용하여 평활화를 사용했습니다. 계열은 점이 많은 "고빈도"이기 때문입니다.

이동평균법에는 다음과 같은 단점이 있습니다.

이동 평균은 계산하기에 비효율적입니다. 각 포인트에 대해 평균을 새로 다시 계산해야 합니다. 이전 포인트에 대해 계산된 결과를 재사용할 수 없습니다.
이동 평균은 계열의 첫 번째 지점과 마지막 지점으로 확장될 수 없습니다. 이것이 우리가 관심을 갖고 있는 사항이라면 문제가 발생할 수 있습니다.
이동 평균은 계열 외부에서 정의되지 않으므로 예측에 사용할 수 없습니다.

지수평활

예측에도 사용할 수 있는 고급 평활화 방법은 지수평활법이며, 창시자의 이름을 따서 홀트-윈터스 방법이라고도 합니다.

이 방법에는 여러 가지 변형이 있습니다.

추세나 계절성이 없는 계열에 대한 단일 평활화;
추세는 있지만 계절성이 없는 계열에 대한 이중 평활화;
추세와 계절성이 모두 있는 계열에 대한 삼중 평활화입니다.

지수평활법은 현재 단계의 정보를 이용하여 이전 단계에서 계산된 값을 업데이트하여 평활화된 계열의 값을 계산하는 방법입니다. 이전 및 현재 단계의 정보는 제어할 수 있는 다양한 가중치를 사용하여 가져옵니다.

단일 평활화의 가장 간단한 버전에서 비율은 다음과 같습니다.

매개변수 α 현재 단계에서 평활화되지 않은 값과 이전 단계에서 평활화된 값 사이의 관계를 정의합니다. ~에 α =1 우리는 원래 계열의 점만 취합니다. 즉, 평탄화는 없을 것입니다. ~에 α =0 행에서는 이전 단계에서 평활화된 값만 가져옵니다. 즉, 시리즈는 상수가 될 것입니다.

평활화를 지수라고 부르는 이유를 이해하려면 관계를 재귀적으로 확장해야 합니다.

계열의 모든 이전 값이 현재 평활화된 값에 기여하지만 매개변수의 정도가 증가함에 따라 그 기여도가 기하급수적으로 감소한다는 관계를 보면 분명합니다. α .

그러나 데이터에 추세가 있는 경우 단순 평활화는 추세보다 "지연"됩니다(또는 값을 가져와야 함). α 1에 가까우나 스무딩이 충분하지 않습니다. 이중지수평활을 사용해야 합니다.

이중 평활화에서는 이미 두 개의 방정식을 사용합니다. 하나의 방정식은 추세를 현재와 이전 평활화 값 간의 차이로 평가한 다음 단순 평활화를 사용하여 추세를 평활화합니다. 두 번째 방정식은 단순 사례와 동일하게 평활화를 수행하지만, 두 번째 항은 이전 평활화 값과 추세의 합을 사용합니다.

삼중 평활화에는 계절성이라는 또 다른 구성요소가 포함되며 또 다른 방정식을 사용합니다. 이 경우 계절 구성 요소에는 덧셈과 곱셈의 두 가지 변형이 있습니다. 첫 번째 경우, 계절 성분의 진폭은 일정하며 시간이 지나도 계열의 기본 진폭에 의존하지 않습니다. 두 번째 경우에는 계열의 기본 진폭 변화에 따라 진폭이 변경됩니다. 그래프에서 볼 수 있듯이 이것이 바로 우리의 경우입니다. 계열이 커짐에 따라 계절 변동의 진폭도 증가합니다.

첫 번째 행에는 추세와 계절성이 모두 있으므로 이에 대해 삼중 평활화 매개변수를 선택하기로 결정했습니다. Prognoz 플랫폼에서는 매개변수 값이 업데이트되면 플랫폼이 즉시 평활화된 계열의 그래프를 다시 그리고 원래 계열을 얼마나 잘 설명하는지 시각적으로 즉시 확인할 수 있기 때문에 이 작업이 매우 쉽습니다. 저는 다음과 같은 가치를 정했습니다.

시계열에 관한 다음 글에서는 기간을 어떻게 계산했는지 살펴보겠습니다.

일반적으로 0.2에서 0.4 사이의 값을 첫 번째 근사값으로 간주할 수 있습니다. Prognoz 플랫폼은 추가 매개변수가 있는 모델도 사용합니다. ɸ , 이는 추세를 약화시켜 미래에 상수에 접근하도록 합니다. 을 위한 ɸ 나는 일반 모델에 해당하는 값 1을 사용했습니다.

나 역시 지난 2년간 이 방법을 이용하여 계열값에 대한 예측을 해보았다. 아래 그림에서는 예측의 시작점을 선으로 그어 표시했습니다. 보시다시피, 예측 기간을 포함하여 원래 계열과 평활화된 계열이 꽤 잘 일치합니다. 이렇게 간단한 방법으로는 나쁘지 않습니다!

Prognoz 플랫폼을 사용하면 매개변수 값 공간에서 체계적 검색을 사용하고 원래 값에서 평활화된 계열의 제곱 편차의 합을 최소화하여 최적의 매개변수 값을 자동으로 선택할 수 있습니다.

설명된 방법은 매우 간단하고 적용하기 쉬우며 시계열의 구조 분석 및 예측을 위한 좋은 시작점을 제공합니다.

다음 기사에서 시계열에 대해 자세히 알아보세요.

계량경제학 1모듈
1. 곡물 수확량과 곡물 가격의 관계에 따라 수요 패턴을 결정하는 법칙은 무엇입니까?
왕의 법에
2. 확률변수의 확산 정도를 측정하는 방법을 무엇이라고 합니까?
분산
3. 어떤 모델을 연구할 때 계량경제학 연구에 추세, 지연 및 순환 구성요소 식별이 포함될 수 있습니까?
시계열 모델
4. 다음 중 질적 특성의 주요 척도에 속하지 않는 것은 무엇입니까?
비율 척도
5. Econometrics 저널을 창간한 사람은 누구입니까?
R. 프리쉬
6. 다음 중 독립적이고 순서 없는 관찰에 기초한 모델을 연구할 때 현재 개발 단계의 계량경제학 연구를 포함할 수 있는 것은 무엇입니까?
모델 매개변수 추정
7. 자연적인 측정 단위는 있지만 자연적인 기준점은 없는 척도는 무엇입니까?
차이 규모에
8. 통합 자기회귀 3/4 이동 평균 모델 이론을 창안한 과학자는 누구입니까?
J. 박스와 G. 젠킨스
9. 설명된 각 변수를 동일한 요인 집합의 함수로 보는 시스템은 무엇입니까?
독립 방정식 시스템에서
10. 정량적 특성의 척도를 의미하는 측정 척도는 무엇입니까?
간격 척도
11. 80년대부터 90년대 초반까지 어떤 계량경제 모델이 개발되었습니까? 답장. Eagle, T. Bolleslev 및 Nelson?
자기회귀 조건부 이분산성 모델
12. 가장 일반적이고 편리한 측정 척도는 무엇입니까?
관계 척도
13. 경제 변동 분석과 경제 정책에 계량경제학 모델을 적용한 공로로 1980년에 노벨상을 받은 과학자는 누구입니까?
L. 클라인
14. 최초의 국제계량사회가 창설된 국가는 어디입니까?
미국에서
15. 다음 중 확률변수의 상수 성분은 무엇입니까?
산술 평균
16. 과학으로서 계량경제학의 목적은 무엇입니까? (E. Malenvo에 따르면)
경제법칙의 실증분석
17. 계량경제학을 경제 현상 연구에 수학이나 통계적 방법을 적용하는 것으로 해석하여 폭넓게 해석한 연구자는 누구입니까?
E. 말렌보
18. 분석 과정에서 확률변수에는 어떤 구성요소가 포함되나요?
일정하고 무작위적인 구성 요소
19. 무작위 성분, 즉 나머지의 평균은 얼마입니까?
0
20. 계량경제학이라는 용어를 처음으로 소개한 사람은 누구입니까?
P. 시엠파
21. 연합 수준의 국내 과학자 중 적은 수의 매개변수를 사용한 방정식을 사용하여 곡물 수확량의 역학을 설명한 사람은 누구입니까?
V. 오부코프
22. 계량경제학에는 어떤 섹션이 포함되어 있나요?
시간 무질서 데이터 모델링 및 시계열 이론
23. 경제의 어떤 특성을 직접 측정할 수 없습니까?
잠재 특성
24. 순환성 문제를 연구한 과학자는 누구입니까?
K. 주글리아르
25. 계량경제학에 관한 첫 번째 책인 The Laws of Wages: An Essay in Statistical Economics의 저자는 누구입니까?
G. 무어

2 모듈
1. 회귀가 유의미한 경우
Fob>Fcrit
2. 회귀계수는 무엇을 나타냅니까?
한 단위의 요인 변화로 인한 결과의 평균 변화
3. 표본 추정치의 평균이 일반 모집단에 대해 해당 매개변수의 원하는 알 수 없는 값과 일치한다는 것은 무엇을 의미합니까?
이주되지 않은
4. k= 2인 경우 회귀는 무엇입니까?
다수의
5. 회귀곡선에 대한 관측점의 산란(편차)의 특징은 무엇입니까?
잔차 회귀
6. 연결의 친밀감을 나타내는 계수는 무엇입니까?
선형 상관 계수
7. 단순히 잔차(편차) 제곱합의 평균은 무엇입니까?
잔차 회귀
8. 확률 변수 x와 y 사이의 선형 관계를 측정하는 상관 계수를 결정하는 표현식은 무엇입니까?
r(x,y)=…
9. 평균 근사 오차는 어떤 값을 초과하면 안 됩니까?
7-8%
10. 회귀(regression)라는 용어는 누가 만들었나요?
F. 갈턴
11. 승수를 계산하는 데 사용되는 소비 함수의 계수는 무엇입니까?
회귀계수
12. 선형 함수 선택의 품질을 결정하는 데 어떤 계수가 사용됩니까?
결정 계수를 사용하여
13. 표본 상관계수를 결정하는 표현식은 무엇입니까?
r(x,y)(정사각형 포함)
14. 회귀분석에서 유효특징(Effective Feature)이란 무엇입니까?
종속변수
15. 분산 분석은 어떤 변수의 분산을 조사합니까?
종속변수
16. 모델 매개변수를 투명하게 해석하는 것이 특징인 회귀는 무엇입니까?
선형 회귀
17. 결과 속성 y의 총 분산에서 회귀 분석으로 설명되는 분산 점유율을 나타내는 계수는 무엇입니까?
결정 계수
18. 요소 x가 (요소 x) 평균 값에서 1%만큼 변경될 때 결과 y가 평균 값에서 몇 퍼센트씩 변경되는지를 나타내는 계수는 무엇입니까?
탄성계수
19. 결과 특성의 실제 값이 이론 또는 계산된 값과 일치하는 경우 잔차 분산 값은 얼마입니까?
0
20. 회귀식의 매개변수 a, b를 추정하기 위해 어떤 방법이 사용됩니까?
최소제곱법(LSM)
21. 계산된 특성과 결과 특성의 실제 값의 제곱 편차 합계를 최소화하기 위한 요구 사항을 기반으로 하는 방법은 무엇입니까?
최소제곱법
22. 어떤 k 값에서 회귀를 쌍이라고 부르나요?
k= 1
23. 다음 중 추정된 매개변수에 대한 비선형 회귀에 적용되지 않는 것은 무엇입니까?
지수 함수
24. 정리의 본질은 무작위 변수가 다수의 다른 무작위 변수의 상호 작용의 전체 결과이고 그 중 어느 것도 전체 결과에 주된 영향을 미치지 않는 경우 그러한 결과 무작위 변수가 설명된다는 것입니다. 대략 정규분포로?
중심 극한 정리
25. 선형 회귀를 설명하는 방정식은 무엇입니까?
y = a + bx + ε
(오류 3개)

3 모듈()1 오류
1. Breusch 및 Pagan 점근 검정에서 모델의 이분산성을 어떻게 확인합니까?
기준 c2(r)에 따라
2. 다양한 사양에서 가장 좋은 모델을 선택할 수 있게 하고 모델 적합도에 대한 두 가지 상반된 추세의 영향을 고려하도록 수치적으로 설계된 기준은 무엇입니까?
슈바르츠 기준
3. 모델의 품질은 어떤 가치로 판단되나요?
평균 상대 근사 오차로
4. 관찰의 동질성(동분산성) 조건을 설명하는 표현은 무엇입니까?
s2(유) =s2(hu+eu) =s2(eu) =s2
5. 오류 벡터의 공분산 행렬이 대각선인 조건에서 적용할 수 있는 방법은 무엇입니까?
최소제곱법
6. 근사의 절대 오차를 결정하는 표현식은 무엇입니까?
yi-y1i=e
7. 다중공선성이란 무엇을 의미합니까?
설명변수의 높은 상관관계
8. 원래 변수에서 해당 평균을 빼고 그 차이를 표준편차로 나눈 변수는 무엇입니까?
표준화된 변수
9. 대조 샘플의 어떤 오류가 구성된 모델의 품질이 양호함을 나타냅니까?
4-9%
10. 요인의 다중공선성의 유의성을 평가하기 위해 어떤 방법을 사용할 수 있습니까?
변수의 독립성 가설을 검정하는 방법
11. 미지수의 선형함수로 표현되어야 하는 변수는 무엇입니까?
프록시 변수
12. 일반화 선형 다중회귀모형의 관측오차의 분산과 공분산
임의적일 수 있음
13. 이분산성 문제를 해결하는 두 번째 접근법은 무엇입니까?
관측 오류의 이분산성을 고려한 모델 구축
14. 가장 간단한 쌍별 회귀의 경우 표준화된 회귀 계수는 무엇입니까?
선형 상관 계수
15. 연구자가 관찰 기간 동안 종속변수와 독립변수 간의 관계 형태에 급격한 구조적 변화가 있었다고 가정하는 경우 다음 중 가설을 테스트하는 데 사용되는 것은 무엇입니까?
차우 테스트
16. 요인들 사이에 완전한 선형 관계가 있고 모든 상관 계수가 1인 경우 행렬의 행렬식은 무엇입니까?
0
17. 능선회귀법을 사용할 때 모형계수를 계산하는 데 사용되는 공식은 무엇입니까?
bgr= (XTX+DgrIk+ 1)-1XTY
18. Aitken의 정리에 따르면 모델 계수를 추정하기 위해 어떤 공식이 사용됩니까?
b= (X¢W-1X)-1X¢W-1Y
19. 다음 테스트 중 회귀 잔차의 정규 분포 가정이 필요하지 않은 테스트는 무엇입니까?
Spearman의 순위 상관 검정
20. 올바른 이론에 따라 모형에 있어야 할 변수의 이름은 무엇입니까?
중요한
21. 인터팩터 상관 행렬의 행렬식 값이 1에 가까울수록
요인의 다중공선성이 적음
22. 회귀식의 중요성을 전체적으로 평가하는 데 사용되는 기준은 무엇입니까?
피셔의 F 테스트
23. 회귀 분석에서 고려된 요인으로 인해 성능 특성에서 설명된 변화의 비율을 포착하는 지표는 무엇입니까?
결정 지수
24. 모델에서 중복 요인을 제외할 수 있는 계수는 무엇입니까?
상호 상관 계수
25. 선형 회귀 분석에서 잔차 제곱합의 자유도는 얼마입니까?
n-2
모듈 4
1. 구조 모델링 프로세스에는 어떤 단계가 포함됩니까?
나열된 모든 단계
2. 부적합한 설명변수를 무작위항과 상관관계가 없는 변수로 부분적으로 대체하는 방법의 핵심은 무엇입니까?
도구변수법
3. 표현식의 변수 x는 무엇을 나타냅니까?
혼란스러운 과정
4. 다음 형식의 차분 방정식의 일반 해법은 어떤 조건에서 "폭발적인" 특성을 갖습니까?
|a1|> 2의 경우
5. 모델 내에서(시스템 자체 내에서) 결정되고 y로 표시되는 상호의존 변수의 이름은 무엇입니까?
내생변수
6. 축소된 형식 계수를 기반으로 어떤 모델에서 하나의 구조 계수에 대해 두 개 이상의 값을 얻을 수 있습니까?
과도하게 식별됨
7. 모델의 구조적 계수라고 불리는 계수는 무엇입니까?
모델의 구조적 형태에서 내생 및 외생 변수에 대한 계수
8. 정보가 제한되어 있는 방법 중 최소 분산비 방법이라고 불리는 방법은 무엇입니까?
최대우도법
9. 이전 시점과 관련된 변수의 이름은 무엇입니까?
지연변수
10. 숫자 집합 X가 Y = 4X 관계로 다른 숫자 Y 집합과 관련되어 있으면 Y의 분산은 다음과 같아야 합니다.
X의 분산보다 16배 더 큼
11. 식별된 시스템을 해결하기 위해 어떤 방법이 사용됩니까?
간접 최소제곱법
12. 사전 정의된 변수는 어떤 변수를 의미합니까?
외생변수와 시차내생변수
13. 단지 변수들 간의 관계의 성격을 명확히 하고 싶을 때 어떤 방법을 사용하나요?
경로 분석 방법
14. 상관 구조 모델을 구축하면 무엇을 할 수 있습니까?
상관 행렬이 특정 형식을 갖는다는 가설을 테스트합니다.
15. 모든 구조 계수가 축소된 모델의 계수에 의해 고유하게 결정되고 두 모델의 매개변수 수가 동일하다면 어떤 모델입니까?
식별 가능
16. 이전 기간 y(t-1)의 소득에 대한 t 연도의 소비 의존성을 결정하는 표현식은 무엇입니까?
C(t) =b+cy(t- 1)
17. 시스템 외부에서 결정되어 x로 표시되는 독립변수의 이름은 무엇입니까?
외생변수
18. 어떤 조건에서 전체 모델이 식별 가능한 것으로 간주됩니까?
시스템의 방정식이 하나 이상 식별되면
19. 어떤 경우에 모델을 식별할 수 없나요?
주어진 계수의 수가 구조적 계수의 수보다 작은 경우
20. 질적 요인의 영향을 고려하기 위해 종종 어떤 변수를 도입해야 합니까?
더미 변수
21. 평균 구조 모델을 구축하면 무엇을 할 수 있습니까?
분산 및 공분산 분석과 동시에 평균의 구조 탐색
22. 인과 모델에는 어떤 변수가 포함될 수 있습니까?
매니페스트 변수와 잠재 변수
23. 어떤 조건에서 방정식을 식별할 수 없습니까?
방정식에는 없지만 시스템에 존재하는 사전 결정된 변수의 수를 1만큼 증가시킨 경우 방정식의 내생 변수의 수보다 적습니다.
24. "뒤로" 이동하여 수식을 풀면 오류가 발생합니다.
축적하다
25. 공분산 구조 모델링으로 무엇을 할 수 있나요?
공분산 행렬이 특정 형식을 갖는다는 가설을 테스트합니다.

4개 모듈
1. 오류수정모델(ECM)의 1에 가까운 큰 값은 무엇을 의미하나요(1-a1)?
경제적 요인이 결과를 크게 좌우한다는 것
2. 계열의 정상성 상태를 확인하기 위해 계열을 몇 개의 섹션으로 나누나요?
두 개의 플롯에
3. 평활화된 계열 Y(t)에서 진동의 진폭을 줄이려면 다음이 필요합니다.
평활화 간격 m의 너비를 늘립니다.
4. 파라메트릭 테스트를 사용하여 정상성을 테스트할 때 선험적으로 가정하는 가정 중 하나는 무엇입니까?
시계열 값의 정규 분포에 대한 가정
5. 시계열이란 무엇입니까?
시간이나 기간의 여러 연속 지점에 걸쳐 취해지는 일련의 특성 값
6. 방정식의 개수 m이 증가함에 따라 2차 다항식 변화에 의해 계열 Y(t)의 분산이 어떻게 평활화됩니까?
감소하다
7. 어떤 추세가 서로 연관되어 있습니까?
일시적인
8. 다음 중 시계열의 정상성을 테스트하는 데 사용되는 것은 무엇입니까?
연속 정상성 기준
9. 시계열의 연속적인 수준 사이의 상관 관계를 무엇이라고 합니까?
계열 수준의 자기 상관
10. 가변분산이 있는 확률변수를 무엇이라고 하나요?
이분산
11. 계열의 평활화를 중심이라고 부르는 조건은 무엇입니까?
k=l에서
12. 결과 변수에서 시간 추세를 어떻게 제거할 수 있습니까?
시간이 지남에 따라 이 변수의 회귀를 구성하고 이미 추세가 없는 새로운 고정 변수를 형성하는 잔차로 이동하여
13. 직선을 평활 다항식으로 취하면 계수를 계산하는 데 어떤 공식이 사용됩니까?
ar= 1/m
14. 2~10년 주기의 추세 편차를 설명하는 구성 요소는 무엇입니까?
순환 구성 요소
15. 표현식에서 매개변수 L은 무엇을 의미합니까?
우도 함수
16. 백색소음은 어떤 순서인가요?
시퀀스의 각 확률 변수가 평균이 0이고 시퀀스의 다른 요소와 상관관계가 없는 경우
17. 단위근을 포함하고 d차로 적분할 수 있는 계열은 어떤 클래스에 속합니까?
ID)
18. 일정한 분산을 갖는 확률변수를 무엇이라고 합니까?
등분산 변수
19. 예측 개발의 어떤 원칙이 준수, 실제 생산 및 경제 프로세스에 대한 이론적 모델의 최대 근사를 전제로 합니까?
예측의 적절성
20. 평활화에 동시에 참여하는 원본 계열의 값 수의 이름은 무엇입니까?
평활 간격 폭
21. 예측 개발의 기본 원칙은 무엇입니까?
일관성, 적절성, 대안성
22. 직렬 정상성 기준이 사용되는 이유는 무엇입니까?
시계열의 정상성을 확인하려면
23. 뷰 모델의 이름은 무엇입니까?
자기회귀 조건부 이분산 모델(ARUG 모델)
24. 방정식은 무엇을 나타냅니까?
(et2) 시퀀스에 대한 APCC 프로세스
25. 랜덤워크 과정에는 어떤 변수가 사용되나요?
상관되지 않은 비정상 변수

시계열을 심층적으로 분석하려면 보다 복잡한 수학적 통계 방법을 사용해야 합니다. 시계열에 상당한 임의 오류(노이즈)가 있는 경우 간격을 확대하고 그룹 평균을 계산하여 평활화 또는 평준화라는 두 가지 간단한 기술 중 하나가 사용됩니다. 이 방법을 사용하면 대부분의 "잡음" 구성 요소가 간격 내에 위치하는 경우 계열의 가시성을 높일 수 있습니다. 그러나 "노이즈"가 주기성과 일치하지 않으면 지표 수준의 분포가 거칠어져 시간에 따른 현상 변화에 대한 자세한 분석 가능성이 제한됩니다.

평균 계열의 지표를 평활화하는 데 널리 사용되는 방법인 이동 평균을 사용하면 보다 정확한 특성을 얻을 수 있습니다. 이는 계열의 초기 값에서 특정 시간 간격의 평균으로의 전환을 기반으로 합니다. 이 경우 각 후속 지표를 계산할 때 시간 간격이 시계열을 따라 미끄러지는 것처럼 보입니다.

이동 평균의 사용은 시계열의 추세가 불확실하거나 주기적으로 반복되는 이상치(이상치 또는 개입)의 성능에 큰 영향을 미칠 때 유용합니다.

평활 간격이 클수록 이동 평균 차트가 더 부드러워 보입니다. 평활화 구간의 값을 선택할 때는 시계열 값과 반영된 역학의 의미 있는 의미부터 진행해야 합니다. 소스 포인트 수가 많은 대형 시계열에서는 더 큰 평활 시간 간격(5, 7, 10 등)을 사용할 수 있습니다. 비계절 계열을 평활화하기 위해 이동 평균 절차를 사용하는 경우 평활화 간격은 3 또는 5와 동일하게 사용되는 경우가 가장 많습니다. https://tvoipolet.ru/iz-moskvi-v-nyu-jork/ - 우수함 모스크바에서 뉴욕까지 항공편을 이용할 항공사를 선택할 수 있는 기회

수확량이 많은(30c/ha 이상) 농장의 이동 평균 수를 계산하는 예를 들어보겠습니다(표 10.3).

표 10.3 이동 평균을 사용하여 간격을 확대하여 시계열 평활화

회계 연도	수확량이 많은 농장 수	3년간의 금액	3년 롤링	이동 평균

			90,0	89,7
1984				88,7
				87,3
			87,3	87,0
				86,7
				83,0
			83,0	82,3
				82,3
				82,6
			82,7	82,7

이동 평균 계산의 예:

1982(84 + 94 + 92) / 3 = 90.0;

1983 (94 + 92 + 83) / 3 = 89.7;

1984(92 + 83 + 91) / 3 = 88.7;

1985(83 + 91 + 88) / 3 = 87.3.

일정이 작성됩니다. 가로축에는 연도를 표시하고, 세로축에는 수확량이 많은 농장의 수를 표시합니다. 그래프에는 농장 수의 좌표가 표시되며 결과 지점은 점선으로 연결됩니다. 그러면 연도별 이동평균의 좌표가 그래프에 표시되고 점들은 부드러운 굵은 선으로 연결됩니다.

보다 복잡하고 효과적인 방법은 다양한 근사 함수를 사용하여 동역학 계열을 평활화(평준화)하는 것입니다. 이를 통해 일반적인 추세와 역학의 주요 축의 원활한 수준을 형성할 수 있습니다.

수학적 함수를 이용한 가장 효과적인 평활화 방법은 단순지수평활법이다. 이 방법은 다음 공식에 따라 계열의 모든 이전 관측값을 고려합니다.

S t = α∙X t + (1 - α ) ∙S t - 1 ,

여기서 S t - 시간 t에서의 각각의 새로운 평활화; S t - 1 - 이전 시간 t -1의 평활화된 값; X t - 시간 t에서의 계열의 실제 값; α는 평활 매개변수입니다.

α = 1이면 이전 관측치가 완전히 무시됩니다. α = 0이면 현재 관측치가 무시됩니다. 0과 1 사이의 α 값은 중간 결과를 제공합니다. 이 매개변수의 값을 변경하면 가장 적절한 정렬 옵션을 선택할 수 있습니다. α의 최적 값 선택은 원래 곡선과 정렬된 곡선의 결과 그래픽 이미지를 분석하거나 계산된 점의 제곱 오차(오차) 합계를 고려하여 수행됩니다. 이 방법의 실제 사용은 MS Excel의 컴퓨터를 사용하여 수행되어야 합니다. 데이터 역학 패턴에 대한 수학적 표현은 지수평활 함수를 사용하여 얻을 수 있습니다.

매우 자주 역학 계열의 수준이 변동하는 반면, 시간이 지남에 따라 현상의 발전 추세는 한 방향 또는 다른 방향으로의 수준의 무작위 편차로 인해 숨겨집니다. 추세 모델을 기반으로 한 예측 방법의 추가 적용을 포함하여 연구 중인 프로세스의 개발 추세를 보다 명확하게 식별하기 위해, 스무딩(수준 측량) 시계열.

시계열 평활화 방법은 두 가지 주요 그룹으로 나뉩니다.

1. 계열의 특정 수준 사이에 그려진 곡선을 사용하여 계열에 내재된 경향을 반영하는 동시에 사소한 변동을 방지하는 분석적 정렬입니다.

2. 인접한 수준의 실제 값을 사용하여 시계열의 개별 수준을 기계적 정렬합니다.

기계적 평활화 방법의 본질은 다음과 같습니다. 시계열의 여러 수준이 취해져서 형성됩니다. 스무딩 간격. 이를 위해 다항식이 선택되며 그 차수는 평활 구간에 포함된 수준 수보다 작아야 합니다. 다항식을 사용하면 평활화 간격 중간에 새로운 레벨 레벨 값이 결정됩니다. 다음으로 평활화 간격이 한 행 수준 오른쪽으로 이동하고 다음 평활화 값이 계산되는 식으로 진행됩니다.

기계적 스무딩의 가장 간단한 방법은 다음과 같습니다. 단순 이동평균법.

2.4.1.단순 이동 평균 방법.

시계열에 대한 첫 번째: 평활 간격이 결정됩니다. 작은 무작위 변동을 평활화해야 하는 경우 평활화 간격을 최대한 크게 설정합니다. 더 작은 변동을 보존해야 하는 경우 평활 간격이 줄어듭니다.

계열의 첫 번째 수준에서는 산술 평균이 계산됩니다. 이는 평활 구간의 중간에 위치한 계열 수준의 평활화된 값이 됩니다. 그런 다음 평활화 간격이 한 수준 오른쪽으로 이동하고 산술 평균 계산이 반복됩니다. 계열의 평활화된 수준을 계산하려면 다음 공식이 사용됩니다.

여기서(홀수인 경우); 짝수의 경우 공식이 더 복잡해집니다.

이 절차의 결과로 계열 수준의 평활화된 값이 얻어집니다. 이 경우 계열의 첫 번째 및 마지막 수준이 손실됩니다(평활화되지 않음). 이 방법의 또 다른 단점은 선형 추세를 갖는 계열에만 적용할 수 있다는 것입니다.

2.4.2.가중 이동 평균 방법.

가중이동평균법은 평활구간에 포함된 수준을 서로 다른 가중치로 합산한다는 점에서 이전 평활법과 다릅니다. 이는 평활 구간 내 계열의 근사가 이전 사례와 같이 1차가 아닌 2차부터 시작하는 차수의 다항식을 사용하여 수행된다는 사실에 기인합니다.

산술 가중 평균 공식이 사용됩니다.

여기서 가중치는 최소 제곱법을 사용하여 결정됩니다. 이러한 가중치는 근사 다항식의 다양한 정도와 다양한 평활화 간격에 대해 계산됩니다.

1. 2차 및 3차 다항식의 경우 평활 구간에서 가중치의 숫자 순서는 다음과 같은 형식을 갖습니다. , for 의 형식은 다음과 같습니다. ;

2. 4차 및 5차 다항식과 평활화 간격의 경우 가중치 순서는 다음과 같습니다.

최소 제곱법을 사용하여 얻은 평활 구간에 대한 가중치 분포는 다이어그램 1을 참조하세요.

2.4.3.지수평활법.

동일한 방법 그룹에는 지수 평활 방법이 포함됩니다.

그 특징은 평활화된 수준을 찾는 과정에서 계열의 이전 수준의 값만 사용하고, 일정한 가중치를 부여하고, 시점에서 멀어질수록 관찰의 가중치가 감소한다는 점이다. 계열 수준의 평활화된 값이 결정됩니다.

원래 시계열의 경우

해당 평활화 값은 다음과 같이 표시됩니다. , 다음 공식에 따라 지수 평활이 수행됩니다.

어디 평활화 매개변수 ; 수량이라고 합니다 할인 요인.

계열의 모든 수준에 대해 주어진 반복 관계를 사용하여 첫 번째부터 시작하여 해당 시점까지 끝나는 지수 평균, 즉 이 방법으로 평활화된 계열의 수준 값은 다음과 같습니다. 모든 이전 레벨의 가중 평균.

시계열 분석 작업 중 하나는 시간에 따른 연구 지표 수준의 변화 패턴을 설정하는 것입니다.

어떤 경우에는 이러한 개체 개발 패턴이 시계열 수준에 매우 명확하게 반영됩니다. 그러나 계열의 수준이 다양한 변화를 겪을 때 이러한 역동적인 계열을 자주 접하게 된다. 이러한 경우 특정 기간 동안 매우 안정적인 주요 개발 추세를 결정하기 위해 역학 시리즈를 처리하는 데 특별한 기술이 사용됩니다.

여러 가지 역학 수준은 다양한 무작위 상황을 포함하여 많은 장기 및 단기 요인의 결합된 영향을 받아 형성됩니다. 동시에 계열 수준의 변화에 대한 주요 추세를 식별하는 것은 임의의 영향에서 자유로운 정량적 표현을 전제로 합니다. 역학 추세를 식별하는 다양한 방법이 있습니다. 주요 추세를 파악하는 방법 중 하나는 간격을 확대하는 방법입니다. 이 방법은 계열 수준이 속하는 기간을 확대하는 데 기반을 둡니다. 예를 들어 일련의 일일 생산량이 일련의 월별 생산량 등으로 대체됩니다.

또 다른 방법은 이동평균법.이 방법의 핵심은 초기 수준을 특정 기간 동안의 산술 평균으로 대체하는 것입니다. 이 경우 먼저 시계열에 대한 평활화 간격이 결정됩니다. . 작은 무작위 변동을 평활화해야 하는 경우 평활화 간격은 가능한 한 크게 설정됩니다. 작은 변동을 부드럽게 유지하여 평활화 간격을 줄입니다. 다른 모든 조건이 동일하다면 평활 간격을 홀수로 설정하는 것이 좋습니다. 시계열의 첫 번째 수준에 대한 평활화 프로세스에서는 산술 평균이 계산됩니다. 이는 평활 구간의 중간에 위치한 계열 수준의 평활화된 값이 됩니다. 그런 다음 평활화 간격이 한 수준 오른쪽으로 이동하고 산술 평균 계산이 반복됩니다. 시계열의 평활화 수준을 계산하려면 다음 공식이 사용됩니다.

(5.6)

이 절차의 결과는 계열 수준의 평활화된 값; 첫 번째 동안 수준과 계열의 마지막 수준이 손실됩니다(평활화되지 않음).

이 평활화(평준화) 방법은 지수 평활화로 보완됩니다. 이 방법의 특징은 평활화된 수준을 찾는 절차에서 특정 가중치를 적용한 이전 시리즈 수준의 값만 사용된다는 것입니다. 원래 시계열의 경우 해당 레벨의 평활화된 값은 다음과 같이 표시됩니다. , 다음 공식에 따라 지수 평활이 수행됩니다.

평활화 매개변수는 어디에 있습니까? 할인요소라고 합니다.

계열의 모든 수준에 대해 위의 반복 관계(5.7)를 사용하여 처음부터 시작하여 시간의 순간까지 끝나는 지수 평균, 즉 이 방법으로 평활화된 계열 수준의 값은 다음과 같습니다. 모든 이전 수준의 가중 평균입니다.

, (5.8)

초기 조건을 특징 짓는 양은 어디에 있습니까?

경제적 시계열을 처리하는 실제 문제에서는 평활 매개변수 값을 0.1~0.3 범위에서 선택하는 것이 (불합리하게) 권장됩니다. 최적의 매개변수 값을 선택하기 위한 다른 정확한 권장 사항은 아직 없습니다. 경우에 따라 R. Brown은 평활화된 계열의 길이를 기준으로 값을 결정할 것을 제안합니다.

초기 매개변수는 특정 문제에서는 계열의 첫 번째 수준 값과 동일하거나 동일하게 사용됩니다. , 또는 계열의 처음 몇 항의 산술 평균과 같습니다. 예를 들어 다음 항은 다음과 같습니다.

So 값을 선택하는 위의 절차는 첫 번째 수준에 대해 평활화된 계열과 원래 계열 사이의 좋은 일치를 보장합니다. 시계열의 오른쪽 끝에 접근할 때 선택한 매개변수를 사용하여 이 방법으로 평활화한 값이 원래 계열의 해당 값과 크게 달라지기 시작하면 다른 평활화 매개변수로 전환해야 합니다. 이 평활화 방법을 사용하면 평활화된 시계열의 초기 수준과 최종 수준이 손실되지 않습니다.

편집자의 선택

인체에 대한 날짜의 실제 이점과 신화적인 피해

안녕하세요 친구! 나는 어렸을 때 우리가 맛있고 달콤한 대추야자를 먹는 것을 정말 좋아했던 것을 기억합니다. 하지만 그들은 우리 식단에 자주 포함되지 않았고...