Wednesday 22 November 2017

Przenoszenie średnia model w sas


Autoregresyjne średnie ruchome błędy (błędy ARMA) i inne modele, które wiążą się z opóźnieniami w zakresie błędów, można oszacować za pomocą instrukcji FIT i symulować lub prognozować za pomocą instrukcji SOLVE. Modele ARMA dla procesu błędu są często używane w modelach z autokorelowanymi resztami. Makro AR można wykorzystać do określenia modeli z autoregresyjnymi procesami błędów. Makro MA może być użyte do określenia modeli z ruchomymi średnimi procesami błędów. Błędy autoregresyjne Model z błędami autoregresyjnymi pierwszego rzędu, AR (1), ma postać, podczas gdy proces błędu AR (2) ma formę i tak dalej dla procesów wyższego rzędu. Zauważ, że s są niezależne i identycznie rozmieszczone i mają oczekiwaną wartość 0. Przykład modelu ze składnikiem AR (2) jest i tak dalej dla procesów wyższego rzędu. Na przykład można napisać prosty model regresji liniowej z błędami średniej ruchomej MA (2), ponieważ MA1 i MA2 są parametrami średniej ruchomej. Zauważ, że RESID. Y jest automatycznie definiowany przez PROC MODEL, ponieważ funkcja ZLAG musi być używana dla modeli MA w celu skracania rekurencji opóźnień. Gwarantuje to, że opóźnione błędy zaczynają się od zera w fazie zalewania opóźnienia i nie propagują brakujących wartości, gdy brakuje zmiennych okresu opóźniania i zapewniają, że przyszłe błędy są zerowe, a nie brakują podczas symulacji lub prognozowania. Szczegółowe informacje na temat funkcji opóźnienia znajdują się w sekcji Logika opóźnień. Ten model napisany przy użyciu makra MA jest następujący: Formularz ogólny dla modeli ARMA Ogólny proces ARMA (p, q) ma następującą postać Model ARMA (p, q) można określić w następujący sposób: gdzie AR i i MA j reprezentują parametry autoregresji i średniej ruchomej dla różnych opóźnień. Możesz użyć dowolnych nazw dla tych zmiennych i istnieje wiele równoważnych sposobów na to, aby specyfikacja mogła zostać napisana. Wektorowe procesy ARMA można również oszacować za pomocą MODELU PROC. Na przykład proces dwóch zmiennych AR (1) dla błędów dwóch zmiennych endogenicznych Y1 i Y2 można określić w następujący sposób: Problemy konwergencji z modelami ARMA Modele ARMA mogą być trudne do oszacowania. Jeśli oszacowania parametrów nie mieszczą się w odpowiednim zakresie, terminy rezydualne modeli ruchomych rosną wykładniczo. Obliczone reszty dla późniejszych obserwacji mogą być bardzo duże lub mogą być przepełnione. Może się tak zdarzyć, ponieważ zastosowano niewłaściwe wartości początkowe lub ponieważ iteracje odeszły od rozsądnych wartości. Należy zachować ostrożność przy wybieraniu wartości początkowych dla parametrów ARMA. Wartości początkowe 0,001 dla parametrów ARMA zwykle działają, jeśli model dobrze pasuje do danych, a problem jest dobrze kondycjonowany. Należy zauważyć, że model MA może często być aproksymowany przez model AR wysokiego rzędu i na odwrót. Może to spowodować wysoką kolinearność w mieszanych modelach ARMA, co z kolei może spowodować poważne pogorszenie warunków obliczeń i niestabilność oszacowań parametrów. Jeśli masz problemy z konwergencją podczas szacowania modelu z procesami błędów ARMA, spróbuj oszacować w krokach. Najpierw użyj instrukcji FIT do oszacowania tylko parametrów strukturalnych z parametrami ARMA utrzymywanymi do zera (lub do racjonalnych wcześniejszych oszacowań, jeśli są dostępne). Następnie użyj innej instrukcji FIT, aby oszacować tylko parametry ARMA, używając wartości parametrów strukturalnych z pierwszego uruchomienia. Ponieważ wartości parametrów strukturalnych prawdopodobnie będą zbliżone do ich ostatecznych szacunków, oszacowania parametrów ARMA mogą się teraz zbiegać. Na koniec użyj innej instrukcji FIT, aby uzyskać równoczesne oszacowania wszystkich parametrów. Ponieważ początkowe wartości parametrów są prawdopodobnie bardzo zbliżone do końcowych szacunków łącznych, oszacowania powinny szybko zbiegać się, jeśli model jest odpowiedni dla danych. Warunki początkowe AR Początkowe opóźnienia warunków błędów modeli AR (p) można modelować na różne sposoby. Metody autoregressive uruchamiania błędów obsługiwane przez procedury SASETS są następujące: warunkowe najmniejszych kwadratów (procedury ARIMA i MODEL) bezwarunkowe procedury najmniejszych kwadratów (procedury AUTOREG, ARIMA i MODEL) maksymalne prawdopodobieństwo (procedury AUTOREG, ARIMA i MODEL) Yule-Walker (AUTOREG tylko procedura) Hildreth-Lu, która usuwa pierwsze p obserwacje (tylko procedura MODEL) Patrz rozdział 8, Procedura AUTOREG, dla wyjaśnienia i omówienia zalet różnych metod uruchamiania AR (p). Inicjalizacja CLS, ULS, ML i HL może być wykonywana przez PROC MODEL. W przypadku błędów AR (1) te inicjalizacje mogą zostać wykonane zgodnie z tabelą 18.2. Metody te są równoważne w przypadku dużych próbek. Tabela 18.2 Inicjacje wykonywane przez MODEL PROC: AR (1) BŁĘDY Początkowe opóźnienia warunków błędów modeli MA (q) można również modelować na różne sposoby. Następujące paradygmaty rozruchu błędu średniej ruchomej są obsługiwane przez procedury ARIMA i MODEL: bezwarunkowe minimalne kwadraty warunkowe najmniejsze kwadraty Metoda warunkowych najmniejszych kwadratów szacowania średnich błędów ruchomych nie jest optymalna, ponieważ ignoruje problem rozruchowy. Zmniejsza to efektywność szacunków, chociaż pozostają one bezstronne. Początkowe opóźnione reszty, rozciągające się przed rozpoczęciem danych, przyjmuje się jako 0, ich bezwarunkową oczekiwaną wartość. Wprowadza to różnicę między tymi resztami a uogólnionymi resztami najmniejszych kwadratów dla kowariancji ruchomej, która, w przeciwieństwie do modelu autoregresyjnego, utrzymuje się przez zbiór danych. Zwykle różnica ta szybko zbiega się do 0, ale w przypadku prawie nieodwracalnych średnich ruchomych konwergencja przebiega dość wolno. Aby zminimalizować ten problem, powinieneś mieć mnóstwo danych, a oszacowania parametrów średniej ruchomej powinny znajdować się w zakresie odwracalności. Ten problem można poprawić kosztem pisania bardziej złożonego programu. Bezwarunkowe estymaty najmniejszych kwadratów dla procesu MA (1) można uzyskać, określając model w następujący sposób: Błędy średniej ruchomej mogą być trudne do oszacowania. Powinieneś rozważyć zastosowanie przybliżenia AR (p) do procesu średniej ruchomej. Proces średniej ruchomej może być zwykle dobrze zindetyzowany przez proces autoregresyjny, jeśli dane nie zostały wygładzone lub zróżnicowane. Makro AR Makro AR AR SAS generuje instrukcje programowania dla PROC MODEL dla modeli autoregresyjnych. Makro AR jest częścią oprogramowania SASETS i żadne specjalne opcje nie muszą być ustawione, aby używać makra. Proces autoregresyjny można zastosować do błędów równań strukturalnych lub samych szeregów endogenicznych. Makro AR może być użyte dla następujących typów autoregresji: nieograniczona autoregresja wektora autoregresji ograniczona autoregresja Jednawiściowa autoregresja Aby modelować pojęcie błędu równania jako proces autoregresyjny, należy zastosować następującą instrukcję po równaniu: Załóżmy na przykład, że Y jest funkcja liniowa błędu X1, X2 i AR (2). Piszemy ten model w następujący sposób: Wywołania AR muszą nadejść po wszystkich równaniach, do których proces ma zastosowanie. Poprzednie wywołanie makra, AR (y, 2), tworzy instrukcje pokazane na wyjściu LIST na rysunku 18.58. Rysunek 18.58 LISTA Opcja Wyjście dla modelu AR (2) Zmienne wstępnie zdefiniowane PRED są tymczasowymi zmiennymi programu używanymi w taki sposób, że opóźnienia reszt są poprawnymi resztami, a nie tymi nowo zdefiniowanymi przez to równanie. Zauważ, że jest to równoważne z instrukcjami jawnie zapisanymi w sekcji Ogólne Formularze dla modeli ARMA. Możesz także ograniczyć parametry autoregresji do zera w wybranych opóźnieniach. Na przykład, jeśli potrzebujesz parametrów autoregresji w opóźnieniach 1, 12 i 13, możesz użyć następujących instrukcji: Te instrukcje generują wyjście pokazane na rysunku 18.59. Rysunek 18.59 LISTA Wyjście Opcja Wyjście dla modelu AR z opóźnieniami na poziomie 1, 12 i 13 Procedura MODEL Lista skompilowanych deklaracji kodu programu jako przeanalizowana PRED. yab x1 c x2 RESID. y PRED. y - ACTUAL. y BŁĄD. y PRED. y - y OLDPRED. y PRED. y yl1 ZLAG1 (y - perdy) yl12 ZLAG12 (y - perdy) yl13 ZLAG13 (y - perdy) RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y warianty warunkowej metody najmniejszych kwadratów, w zależności od tego, czy obserwacje na początku serii są wykorzystywane do rozgrzania procesu AR. Domyślnie metoda warunkowych najmniejszych kwadratów AR wykorzystuje wszystkie obserwacje i przyjmuje zera dla początkowych opóźnień autoregresyjnych. Korzystając z opcji M, możesz poprosić, aby AR użył zamiast tego metody bezwarunkowego najmniejszego kwadratu (ULS) lub największej wiarygodności (ML). Na przykład Dyskusje na temat tych metod przedstawiono w sekcji Warunki początkowe AR. Korzystając z opcji MCLS n, możesz poprosić o użycie pierwszych n obserwacji do obliczenia oszacowań początkowych opóźnień autoregresyjnych. W takim przypadku analiza rozpoczyna się od obserwacji n 1. Na przykład: Można użyć makra AR, aby zastosować model autoregresyjny do zmiennej endogenicznej, zamiast do terminu błędu, za pomocą opcji TYPEV. Na przykład, jeśli chcesz dodać pięć ostatnich opóźnień Y do równania w poprzednim przykładzie, możesz użyć AR do wygenerowania parametrów i opóźnień za pomocą następujących instrukcji: Poprzednie instrukcje generują wyjście pokazane na rysunku 18.60. Rysunek 18.60 LISTA Opcja Wyjście dla modelu AR Y Ten model przewiduje Y jako liniową kombinację X1, X2, punktu przecięcia i wartości Y w ostatnich pięciu okresach. Nieograniczona autoregresja wektorowa Aby modelować terminy błędów zbioru równań jako proces autoregresyjny wektorów, po równaniach należy użyć następującej postaci makra AR: Wartość processname to dowolna nazwa, którą podaje się do AR, aby użyć jej przy tworzeniu nazw dla autoregresji parametry. Możesz użyć makra AR do modelowania kilku różnych procesów AR dla różnych zestawów równań, używając różnych nazw procesów dla każdego zestawu. Nazwa procesu zapewnia, że ​​używane nazwy zmiennych są niepowtarzalne. Użyj krótkiej wartości processname dla procesu, jeśli prognozy parametrów mają zostać zapisane w zestawie danych wyjściowych. Makro AR próbuje skonstruować nazwy parametrów mniejsze lub równe ośmiu znaków, ale jest to ograniczone przez długość nazwy procesu. który jest używany jako prefiks dla nazw parametrów AR. Wartość variablelist jest listą zmiennych endogenicznych dla równań. Załóżmy na przykład, że błędy dla równań Y1, Y2 i Y3 są generowane przez proces autoregresyjny wektora drugiego rzędu. Możesz użyć następujących instrukcji: które generują następujące dla Y1 i podobny kod dla Y2 i Y3: Tylko metoda warunkowych najmniejszych kwadratów (MCLS lub MCLS n) może być użyta do procesów wektorowych. Możesz również użyć tej samej formy z ograniczeniami, że macierz współczynników wynosi 0 w wybranych opóźnieniach. Na przykład poniższe instrukcje stosują proces wektorowy trzeciego rzędu do błędów równania ze wszystkimi współczynnikami opóźnienia 2 ograniczonego do 0 i ze współczynnikami w opóźnieniach 1 i 3 nieograniczony: Możesz modelować trzy serie Y1Y3 jako wektor autoregresyjny w zmiennych zamiast w błędach za pomocą opcji TYPEV. Jeśli chcesz modelować Y1Y3 jako funkcję przeszłych wartości Y1Y3 i niektórych egzogennych zmiennych lub stałych, możesz użyć AR do wygenerowania instrukcji dla warunków opóźnienia. Napisz równanie dla każdej zmiennej dla nieautoregresywnej części modelu, a następnie wywołaj AR z opcją TYPEV. Na przykład: Nieautoregresywna część modelu może być funkcją zmiennych egzogenicznych lub może przechwytywać parametry. Jeśli nie ma elementów egzogennych w wektorowym modelu autoregresji, w tym żadnych przechwyceń, wówczas przypisz zero do każdej ze zmiennych. Musi istnieć przyporządkowanie do każdej zmiennej przed wywołaniem AR. Ten przykład modeluje wektor Y (Y1 Y2 Y3) jako funkcję liniową tylko jego wartości w poprzednich dwóch okresach i wektor błędu szumu białego. Model ma 18 (3 3 3 3) parametrów. Składnia makr AR Istnieją dwa przypadki składni makra AR. Gdy ograniczenia na wektorowym procesie AR nie są potrzebne, składnia makra AR ma formę ogólną określającą prefiks dla AR do użycia w konstruowaniu nazw zmiennych potrzebnych do zdefiniowania procesu AR. Jeśli endolista nie jest określony, lista endogeniczna przyjmuje domyślną nazwę. która musi być nazwą równania, do którego ma być zastosowany proces błędu AR. Wartość nazwy nie może przekraczać 32 znaków. jest kolejnością procesu AR. Określa listę równań, do których ma być zastosowany proces AR. Jeśli podano więcej niż jedną nazwę, tworzony jest nieograniczony proces wektorowy z resztami strukturalnymi wszystkich równań zawartych jako regresory w każdym z równań. Jeśli nie zostanie określony, endolist domyślnie nazwie. określa listę opóźnień, w których mają zostać dodane warunki AR. Współczynniki terminów w niewystępujących opóźnieniach są ustawione na 0. Wszystkie wymienione opóźnienia muszą być mniejsze lub równe nlag. i nie może być żadnych duplikatów. Jeśli nie jest określony, lista zaludnia przyjmuje domyślnie wszystkie opóźnienia od 1 do nlag. określa metodę szacowania do wdrożenia. Prawidłowe wartości M to CLS (warunkowe estymaty najmniejszych kwadratów), ULS (bezwarunkowe estymaty najmniejszych kwadratów) i ML (szacunki największej wiarygodności). MCLS jest domyślnie. Tylko MCLS jest dozwolone, gdy określono więcej niż jedno równanie. Metody ULS i ML nie są obsługiwane przez AR w wektorowych modelach AR. Określa, że ​​proces AR ma być zastosowany do samych zmiennych endogenicznych, a nie do reszt strukturalnych równań. Ograniczona autoregresja wektorowa Możesz kontrolować, które parametry są uwzględnione w procesie, ograniczając do 0 parametrów, których nie uwzględniasz. Najpierw użyj AR z opcją DEFER, aby zadeklarować listę zmiennych i zdefiniować wymiar procesu. Następnie użyj dodatkowych wywołań AR, aby wygenerować warunki dla wybranych równań z wybranymi zmiennymi w wybranych opóźnieniach. Na przykład Wygenerowane równania błędu są następujące: Ten model stwierdza, że ​​błędy dla Y1 zależą od błędów obu Y1 i Y2 (ale nie Y3) w obu opóźnieniach 1 i 2 oraz że błędy dla Y2 i Y3 zależą od poprzednie błędy dla wszystkich trzech zmiennych, ale tylko w opóźnieniu 1. Składnia makr AR dla ograniczonego wektora AR Alternatywne użycie AR pozwala na nałożenie ograniczeń na proces AR wektorów przez kilkakrotne wywołanie AR w celu określenia różnych warunków AR i opóźnień dla różnych równania. Pierwsze wywołanie ma formę ogólną określającą prefiks dla AR do użycia przy konstruowaniu nazw zmiennych potrzebnych do zdefiniowania procesu AR wektor. określa kolejność procesu AR. Określa listę równań, do których ma być zastosowany proces AR. Określa, że ​​AR nie generuje procesu AR, ale oczekuje na dalsze informacje określone w późniejszych wywołaniach AR dla tej samej wartości nazwy. Kolejne wywołania mają formę ogólną taką samą jak w pierwszym wywołaniu. Określa listę równań, do których mają zastosowanie specyfikacje w tym wywołaniu AR. Tylko nazwy określone w wartości endolistu pierwszego wywołania wartości nazwy mogą pojawić się na liście równań w eqlist. Określa listę równań, których opóźnione reszty strukturalne mają być włączone jako regresory w równaniach w eqlist. Tylko nazwy w końcówce pierwszego wywołania wartości nazwy mogą pojawiać się na liście varlist. Jeśli nie jest podana, varlist domyślnie jest endolistą. określa listę opóźnień, w których mają zostać dodane warunki AR. Współczynniki terminów na opóźnieniach niewymienionych na liście są ustawione na 0. Wszystkie wymienione opóźnienia muszą być mniejsze lub równe wartości nlag. i nie może być żadnych duplikatów. Jeśli nie jest określony, laglist domyślnie przyjmuje wszystkie opóźnienia od 1 do nlag. Makro MA Makro MA SAS generuje instrukcje programowania dla MODELU PROC dla modeli średniej ruchomej. Makro MA jest częścią oprogramowania SASETS, a do korzystania z makra nie są potrzebne żadne specjalne opcje. Proces błędu średniej ruchomej można zastosować do błędów równania strukturalnego. Składnia makra MA jest taka sama jak makro AR, z tym że nie ma argumentu TYPE. Gdy używane są makra MA i AR połączone, makro MA musi być zgodne z makrem AR. Następujące instrukcje SASIML generują proces błędu ARMA (1, (1 3)) i zapisują go w zbiorze danych MADAT2. Poniższe instrukcje modelu MODEL są używane do oszacowania parametrów tego modelu za pomocą struktury maksymalnego błędu wiarygodności: Szacunki parametrów wytworzonych przez ten przebieg pokazano na rysunku 18.61. Rysunek 18.61 Szacunki z procesu ARMA (1, (1 3)) Istnieją dwa przypadki składni dla makra MA. Gdy ograniczenia na wektorowym procesie MA nie są potrzebne, składnia makra MA ma ogólną postać określającą przedrostek dla MA do zastosowania w konstruowaniu nazw zmiennych potrzebnych do zdefiniowania procesu MA i jest domyślną endolistą. jest kolejnością procesu MA. Określa równanie, do którego ma zastosowanie proces MA. Jeśli podana jest więcej niż jedna nazwa, oszacowanie CLS jest używane do procesu wektorowego. określa opóźnienia, w których mają zostać dodane warunki umowy o partnerstwie. Wszystkie wymienione opóźnienia muszą być mniejsze lub równe nlag. i nie może być żadnych duplikatów. Jeśli nie jest określony, lista zaludnia przyjmuje domyślnie wszystkie opóźnienia od 1 do nlag. określa metodę szacowania do wdrożenia. Prawidłowe wartości M to CLS (warunkowe estymaty najmniejszych kwadratów), ULS (bezwarunkowe estymaty najmniejszych kwadratów) i ML (szacunki największej wiarygodności). MCLS jest domyślnie. Tylko MCLS jest dozwolona, ​​gdy w endolicie podano więcej niż jedno równanie. Składnia makr MA dla ograniczonej średniej ruchomej wektora Alternatywne wykorzystanie MA pozwala na nałożenie ograniczeń na wektorowy proces MA poprzez kilkukrotne wywołanie MA w celu określenia różnych warunków MA i opóźnień dla różnych równań. Pierwsze wywołanie ma formę ogólną, określającą prefiks dla MA do zastosowania w konstruowaniu nazw zmiennych potrzebnych do zdefiniowania wektora procesu MA. określa kolejność procesu MA. Określa listę równań, do których ma zastosowanie proces MA. określa, że ​​MA nie generuje procesu MA, ale oczekuje na dalsze informacje określone w późniejszych wezwaniach MA dla tej samej wartości nazwy. Kolejne wywołania mają formę ogólną taką samą jak w pierwszym wywołaniu. Określa listę równań, do których mają zastosowanie specyfikacje w niniejszym zaproszeniu MA. Określa listę równań, których opóźnione reszty strukturalne mają być włączone jako regresory w równaniach w eqlist. Określa listę opóźnień, w których mają zostać dodane warunki SI. Lista wyskakujących przedziałów ufności umożliwia ustawienie poziomu ufności dla prognozowanych przedziałów ufności. W oknach dialogowych sezonowych modeli wygładzania znajduje się pole Okresy w sezonie, umożliwiające ustawienie liczby okresów w sezonie. Lista wyskakujących Więzy pozwala określić, jakiego rodzaju ograniczenie chcesz wymusić na wygładzaniu ciężarów podczas dopasowania. Ograniczenia są następujące: rozwija okno dialogowe, aby umożliwić ustawienie ograniczeń dla poszczególnych wag wygładzających. Każda masa wygładzająca może być ograniczona. Naprawiony. lub Unconstrained zgodnie z ustawieniem menu podręcznego obok nazwy wagi. Wprowadzając wartości dla ustalonych lub ograniczonych wag, wartości mogą być dodatnimi lub ujemnymi liczbami rzeczywistymi. Pokazany tutaj przykład ma masę Poziomu () ustaloną na wartość 0.3, a Masa trendu () ograniczona o 0,1 i 0,8. W tym przypadku wartość masy Trend może się zmieniać w zakresie od 0,1 do 0,8, natomiast waga poziomu wynosi 0,3. Zauważ, że możesz określić wszystkie wagi wygładzające z wyprzedzeniem, używając tych ograniczeń niestandardowych. W takim przypadku żadna z wag nie zostanie oszacowana na podstawie danych, chociaż prognozy i wartości resztowe będą nadal obliczane. Po kliknięciu Estimate. wyniki dopasowania pojawiają się w miejscu okna dialogowego. Równanie wygładzania, L t y t (1) L t -1. jest definiowany w kategoriach pojedynczej masy wygładzającej. Ten model jest równoważny z modelem ARIMA (0, 1, 1), w którym procesy neutralnego ruchu z umiarkowaną średnią ruchomością 13 13 13 13 13 13 Autoregresyjne średnie ruchome błędy (błędy ARMA) i inne modele z opóźnieniami błędów można oszacować za pomocą instrukcji FIT i symulowane lub prognozowane za pomocą instrukcji SOLVE. Modele ARMA dla procesu błędu są często używane w modelach z autokorelowanymi resztami. Makro AR można wykorzystać do określenia modeli z autoregresyjnymi procesami błędów. Makro MA może być użyte do określenia modeli z ruchomymi średnimi procesami błędów. Błędy autoregresyjne Model z błędami autoregresyjnymi pierwszego rzędu, AR (1), ma postać, podczas gdy proces błędu AR (2) ma formę i tak dalej dla procesów wyższego rzędu. Zauważ, że s są niezależne i identycznie rozmieszczone i mają oczekiwaną wartość 0. Przykładem modelu ze składnikiem AR (2) jest zapisanie tego modelu w następujący sposób: lub równoważne użycie makra AR jako średniej ruchomej modeli 13 A model z błędami średniej ruchomej pierwszego rzędu, MA (1), ma formę, w której jest identycznie i niezależnie rozdzielany ze średnią zerową. Proces błędu MA (2) ma postać i tak dalej dla procesów wyższego rzędu. Na przykład można zapisać prosty model regresji liniowej z błędami średniej ruchomej MA (2), ponieważ MA1 i MA2 są parametrami średniej ruchomej. Zauważ, że RESID. Y jest automatycznie definiowany przez PROC MODEL jako Notatka, że ​​RESID. Y jest. Funkcja ZLAG musi być używana dla modeli MA w celu skrócenia rekurencji opóźnień. Gwarantuje to, że opóźnione błędy zaczynają się od zera w fazie zalewania opóźnień i nie propagują brakujących wartości, gdy brakuje zmiennych okresu opóźniania i zapewniają, że przyszłe błędy są zerowe, a nie brakują podczas symulacji lub prognozowania. Szczegółowe informacje na temat funkcji opóźnienia znajdują się w rozdziale 34Lag Logic.34 Ten model napisany przy użyciu makra MA jest ogólną formą dla modeli ARMA Ogólny proces ARMA (p, q) ma następującą postać. Model ARMA (p, q) może być określone poniżej, gdzie AR i MAj reprezentują parametry autoregresyjne i średnie ruchome dla różnych opóźnień. Możesz użyć dowolnych nazw dla tych zmiennych i istnieje wiele równoważnych sposobów na to, aby specyfikacja mogła zostać napisana. Wektorowe procesy ARMA można również oszacować za pomocą MODELU PROC. Na przykład proces dwóch zmiennych AR (1) dla błędów dwóch zmiennych endogenicznych Y1 i Y2 można określić następująco Problemy konwergencji z modelami ARMA Modele ARMA mogą być trudne do oszacowania. Jeśli szacunki parametrów nie mieszczą się w odpowiednim zakresie, pozostałe resocjalne modele będą rosły wykładniczo. Obliczone reszty dla późniejszych obserwacji mogą być bardzo duże lub mogą być przepełnione. Może się tak zdarzyć, ponieważ zastosowano niewłaściwe wartości początkowe lub ponieważ iteracje odeszły od rozsądnych wartości. Należy zachować ostrożność przy wybieraniu wartości początkowych dla parametrów ARMA. Wartości początkowe .001 dla parametrów ARMA zwykle działają, jeśli model dobrze pasuje do danych, a problem jest dobrze kondycjonowany. Należy zauważyć, że model MA może często być aproksymowany przez model AR wysokiego rzędu i na odwrót. Może to spowodować wysoką kolinearność w mieszanych modelach ARMA, co z kolei może spowodować poważne pogorszenie warunków w obliczeniach i niestabilność oszacowań parametrów. Jeśli masz problemy z konwergencją podczas szacowania modelu z procesami błędów ARMA, spróbuj oszacować w krokach. Najpierw użyj instrukcji FIT do oszacowania tylko parametrów strukturalnych z parametrami ARMA utrzymywanymi do zera (lub do racjonalnych wcześniejszych oszacowań, jeśli są dostępne). Następnie użyj innej instrukcji FIT, aby oszacować tylko parametry ARMA, używając wartości parametrów strukturalnych z pierwszego uruchomienia. Ponieważ wartości parametrów strukturalnych prawdopodobnie będą zbliżone do ich ostatecznych szacunków, oszacowania parametrów ARMA mogą się teraz zbiegać. Na koniec użyj innej instrukcji FIT, aby uzyskać równoczesne oszacowania wszystkich parametrów. Ponieważ początkowe wartości parametrów są prawdopodobnie bardzo zbliżone do końcowych szacunków łącznych, oszacowania powinny szybko zbiegać się, jeśli model jest odpowiedni dla danych. Warunki początkowe AR 13 13 13 13 13 13 13 13 13 13 Początkowe opóźnienia warunków błędów modeli AR (p) można modelować na różne sposoby. Metody autoregressive uruchamiania błędów obsługiwane przez procedury SASETS są następujące: CLS warunkowe najmniejszych kwadratów (procedury ARIMA i MODEL) ULS bezwarunkowe najmniejszych kwadratów (procedury AUTOREG, ARIMA i MODEL) Maksymalne prawdopodobieństwo ML (procedury AUTOREG, ARIMA i MODEL) YW Yule - Walker (tylko procedura AUTOREG) HL Hildreth-Lu, która usuwa pierwsze p obserwacje (tylko procedura MODEL) W rozdziale 8 znajdziesz wyjaśnienie i omówienie zalet różnych metod uruchamiania AR (p). Inicjalizacja CLS, ULS, ML i HL może być wykonywana przez PROC MODEL. W przypadku błędów AR (1) te inicjalizacje można wykonać zgodnie z tabelą 14.2. Metody te są równoważne w przypadku dużych próbek. Tabela 14.2: Inicjacje wykonywane przez MODEL PROC: AR (1) BŁĘDY MA Warunki początkowe 13 13 13 13 13 13 Początkowe opóźnienia warunków błędów modeli MA (q) można również modelować na różne sposoby. Następujące średnie ruchome paradygmaty uruchamiania błędów są obsługiwane przez procedury ARIMA i MODEL: ULS bezwarunkowe najmniejszych kwadratów CLS warunkowe najmniejsze kwadraty Maksymalne prawdopodobieństwo ML Metoda warunkowego najmniejszych kwadratów szacowania średnich błędów ruchomych nie jest optymalna, ponieważ ignoruje problem z uruchomieniem. Zmniejsza to efektywność szacunków, chociaż pozostają one bezstronne. Początkowe opóźnione reszty, rozciągające się przed rozpoczęciem danych, przyjmuje się jako 0, ich bezwarunkową oczekiwaną wartość. Wprowadza to różnicę między tymi resztami a uogólnionymi resztami najmniejszych kwadratów dla średniej kroczącej kowariancji, która w przeciwieństwie do modelu autoregresyjnego utrzymuje się przez zbiór danych. Zwykle różnica ta szybko zbiega się do zera, ale w przypadku prawie nieodwracalnych średnich ruchomych konwergencja przebiega dość wolno. Aby zminimalizować ten problem, powinieneś mieć dużo danych, a szacunki parametrów średniej ruchomej powinny znajdować się w zakresie odwracalności. Ten problem można poprawić kosztem pisania bardziej złożonego programu. Bezwarunkowe estymaty najmniejszych kwadratów dla procesu MA (1) można uzyskać, określając model w następujący sposób: Błędy średniej ruchomej mogą być trudne do oszacowania. Powinieneś rozważyć zastosowanie przybliżenia AR (p) do procesu średniej ruchomej. Proces średniej średniej ruchomej może być zwykle dobrze zindetyzowany przez proces autoregresyjny, jeśli dane nie zostały wygładzone lub zróżnicowane. Makro AR Makro AR AR SAS generuje instrukcje programowania dla MODELU PROC dla modeli autoregresyjnych. Makro AR jest częścią oprogramowania SASETS i nie trzeba ustawiać żadnych specjalnych opcji do korzystania z makra. Proces autoregresyjny można zastosować do błędów równań strukturalnych lub samych szeregów endogenicznych. Makro AR może być użyte do jednorearowej autoregresji nieograniczonej wektorowej autoregresji ograniczonej wektorowej autoregresji. Jednowymiarowa autoregresja 13 Aby zamodelować termin błędu równania jako proces autoregresyjny, użyj następującej instrukcji po równaniu: Załóżmy na przykład, że Y jest funkcją liniową X1 i X2 oraz błędem AR (2). Piszemy ten model w następujący sposób: Wywołania AR muszą nadejść po wszystkich równaniach, do których proces ma zastosowanie. Inscenizacja makra procedującego, AR (y, 2), generuje instrukcje pokazane na wyjściu LIST na rysunku 14.49. Rysunek 14.50: WYKAZ Opcja Wyjście dla modelu AR z opóźnieniami 1, 12 i 13 Istnieją warianty warunkowej metody najmniejszych kwadratów, w zależności od tego, czy obserwacje na początku serii są używane do 34 burzenia się34 procesu AR. Domyślnie metoda warunkowych najmniejszych kwadratów AR wykorzystuje wszystkie obserwacje i przyjmuje zera dla początkowych opóźnień autoregresyjnych. Korzystając z opcji M, możesz poprosić, aby AR użył zamiast tego bezwarunkowej metody najmniejszych kwadratów (ULS) lub maksymalnych prawdopodobieństw (ML). Na przykład: Dyskusje na temat tych metod znajdują się w Warunkach początkowych343 wcześniej w tej sekcji. Korzystając z opcji MCLS n, możesz poprosić o użycie pierwszych n obserwacji do obliczenia oszacowań początkowych opóźnień autoregresyjnych. W takim przypadku analiza rozpoczyna się od obserwacji n 1. Na przykład: Można użyć makra AR, aby zastosować model autoregresyjny do zmiennej endogenicznej, zamiast do terminu błędu, za pomocą opcji TYPEV. Na przykład, jeśli chcesz dodać pięć ostatnich opóźnień Y do równania w poprzednim przykładzie, możesz użyć AR do wygenerowania parametrów i opóźnień za pomocą następujących instrukcji: Poprzednie instrukcje generują wyjście pokazane na rysunku 14.51. Procedura MODEL Lista skompilowanych deklaracji kodu programu jako przeanalizowana PRED. yab x1 c x2 RESID. y PRED. y - RZECZYWISTY. r. BŁĘDY. PRED. y - y OLDPRED. y PRED. y yl1 ZLAG1 (y) yl2 ZLAG2 (y ) yl3 ZLAG3 (y) yl4 ZLAG4 (y) yl5 ZLAG5 (y) RESID. y PRED. y - ACTUAL. y ERROR. y PRED. y - y Rysunek 14.51: LIST Opcja Wyjście dla modelu AR z Y Ten model przewiduje Y jako liniową kombinację X1, X2, punktu przecięcia i wartości Y w ostatnich pięciu okresach. Nieograniczona autoregresja wektorowa 13 Aby modelować terminy błędów zbioru równań jako proces autoregresyjny wektorów, po równaniach należy użyć następującej postaci makra AR: Wartość nazwa procesu jest dowolną nazwą, którą podaje się w celu użycia AR w tworzeniu nazw dla parametry autoregresyjne. Możesz użyć makra AR do modelowania kilku różnych procesów AR dla różnych zestawów równań, używając różnych nazw procesów dla każdego zestawu. Nazwa procesu zapewnia, że ​​używane nazwy zmiennych są niepowtarzalne. Użyj krótkiej wartości processname dla procesu, jeśli prognozy parametrów mają zostać zapisane w zestawie danych wyjściowych. Makro AR próbuje skonstruować nazwy parametrów mniejsze lub równe ośmiu znaków, ale jest to ograniczone długością nazwy. który jest używany jako prefiks dla nazw parametrów AR. Wartość variablelist jest listą zmiennych endogenicznych dla równań. Załóżmy na przykład, że błędy dla równań Y1, Y2 i Y3 są generowane przez proces autoregresyjny wektora drugiego rzędu. Możesz użyć następujących instrukcji: generuje następujące dla Y1 i podobny kod dla Y2 i Y3: Tylko procesy warunkowe najmniejszych kwadratów (MCLS lub MCLS n) mogą być używane do procesów wektorowych. Możesz również użyć tej samej formy z ograniczeniami, że macierz współczynników wynosi 0 w wybranych opóźnieniach. Na przykład, instrukcje stosują proces wektorowy trzeciego rzędu do błędów równania, a wszystkie współczynniki w opóźnieniu 2 są ograniczone do 0, a współczynniki w opóźnieniach 1 i 3 są nieograniczone. Możesz modelować trzy serie Y1-Y3 jako wektor autoregresyjny w zmiennych zamiast w błędach, używając opcji TYPEV. Jeśli chcesz modelować Y1-Y3 jako funkcję przeszłych wartości Y1-Y3 i niektórych egzogennych zmiennych lub stałych, możesz użyć AR do wygenerowania instrukcji dla warunków opóźnienia. Napisz równanie dla każdej zmiennej dla nieautoregresywnej części modelu, a następnie wywołaj AR z opcją TYPEV. Na przykład: Nieautoregresywna część modelu może być funkcją zmiennych egzogenicznych lub może być parametrem przechwytującym. Jeśli nie ma elementów egzogennych w wektorowym modelu autoregresji, w tym żadnych przechwyceń, wówczas przypisz zero do każdej ze zmiennych. Musi istnieć przyporządkowanie do każdej zmiennej przed wywołaniem AR. Ten przykład modeluje wektor Y (Y1 Y2 Y3) jako funkcję liniową tylko jego wartości w poprzednich dwóch okresach i wektor błędu szumu białego. Model ma 18 (3 razy 3 3 razy 3) parametrów. Składnia makr AR Istnieją dwa przypadki składni makra AR. Pierwsza ma ogólną nazwę formularza określającą prefiks dla AR do użycia przy tworzeniu nazw zmiennych potrzebnych do zdefiniowania procesu AR. Jeśli endolista nie jest określony, lista endogeniczna przyjmuje domyślną nazwę. która musi być nazwą równania, do którego ma być zastosowany proces błędu AR. Wartość nazwy nie może przekraczać ośmiu znaków. nlag to kolejność procesu AR. Endolist określa listę równań, do których ma być zastosowany proces AR. Jeśli podano więcej niż jedną nazwę, tworzony jest nieograniczony proces wektorowy z resztami strukturalnymi wszystkich równań zawartych jako regresory w każdym z równań. Jeśli nie zostanie określony, endolist domyślnie nazwie. laglist określa listę opóźnień, w których mają zostać dodane warunki AR. The coefficients of the terms at lags not listed are set to 0. All of the listed lags must be less than or equal to nlag . and there must be no duplicates. If not specified, the laglist defaults to all lags 1 through nlag . M method specifies the estimation method to implement. Valid values of M are CLS (conditional least-squares estimates), ULS (unconditional least-squares estimates), and ML (maximum-likelihood estimates). MCLS is the default. Only MCLS is allowed when more than one equation is specified. The ULS and ML methods are not supported for vector AR models by AR. TYPEV specifies that the AR process is to be applied to the endogenous variables themselves instead of to the structural residuals of the equations. Restricted Vector Autoregression 13 13 13 13 You can control which parameters are included in the process, restricting those parameters that you do not include to 0. First, use AR with the DEFER option to declare the variable list and define the dimension of the process. Then, use additional AR calls to generate terms for selected equations with selected variables at selected lags. For example, The error equations produced are This model states that the errors for Y1 depend on the errors of both Y1 and Y2 (but not Y3) at both lags 1 and 2, and that the errors for Y2 and Y3 depend on the previous errors for all three variables, but only at lag 1. AR Macro Syntax for Restricted Vector AR An alternative use of AR is allowed to impose restrictions on a vector AR process by calling AR several times to specify different AR terms and lags for different equations. The first call has the general form name specifies a prefix for AR to use in constructing names of variables needed to define the vector AR process. nlag specifies the order of the AR process. endolist specifies the list of equations to which the AR process is to be applied. DEFER specifies that AR is not to generate the AR process but is to wait for further information specified in later AR calls for the same name value. The subsequent calls have the general form name is the same as in the first call. eqlist specifies the list of equations to which the specifications in this AR call are to be applied. Only names specified in the endolist value of the first call for the name value can appear in the list of equations in eqlist . varlist specifies the list of equations whose lagged structural residuals are to be included as regressors in the equations in eqlist . Only names in the endolist of the first call for the name value can appear in varlist . If not specified, varlist defaults to endolist . laglist specifies the list of lags at which the AR terms are to be added. The coefficients of the terms at lags not listed are set to 0. All of the listed lags must be less than or equal to the value of nlag . and there must be no duplicates. If not specified, laglist defaults to all lags 1 through nlag . The MA Macro 13 The SAS macro MA generates programming statements for PROC MODEL for moving average models. The MA macro is part of SASETS software and no special options are needed to use the macro. The moving average error process can be applied to the structural equation errors. The syntax of the MA macro is the same as the AR macro except there is no TYPE argument. 13 When you are using the MA and AR macros combined, the MA macro must follow the AR macro. The following SASIML statements produce an ARMA(1, (1 3)) error process and save it in the data set MADAT2. The following PROC MODEL statements are used to estimate the parameters of this model using maximum likelihood error structure: The estimates of the parameters produced by this run are shown in Figure 14.52. Maximum Likelihood ARMA(1, (1 3)) Figure 14.52: Estimates from an ARMA(1, (1 3)) Process Syntax of the MA Macro There are two cases of the syntax for the MA macro. The first has the general form name specifies a prefix for MA to use in constructing names of variables needed to define the MA process and is the default endolist . nlag is the order of the MA process. endolist specifies the equations to which the MA process is to be applied. If more than one name is given, CLS estimation is used for the vector process. laglist specifies the lags at which the MA terms are to be added. All of the listed lags must be less than or equal to nlag . and there must be no duplicates. If not specified, the laglist defaults to all lags 1 through nlag . M method specifies the estimation method to implement. Valid values of M are CLS (conditional least-squares estimates), ULS (unconditional least-squares estimates), and ML (maximum-likelihood estimates). MCLS is the default. Only MCLS is allowed when more than one equation is specified on the endolist . MA Macro Syntax for Restricted Vector Moving Average 13 An alternative use of MA is allowed to impose restrictions on a vector MA process by calling MA several times to specify different MA terms and lags for different equations. The first call has the general form name specifies a prefix for MA to use in constructing names of variables needed to define the vector MA process. nlag specifies the order of the MA process. endolist specifies the list of equations to which the MA process is to be applied. DEFER specifies that MA is not to generate the MA process but is to wait for further information specified in later MA calls for the same name value. The subsequent calls have the general form name is the same as in the first call. eqlist specifies the list of equations to which the specifications in this MA call are to be applied. varlist specifies the list of equations whose lagged structural residuals are to be included as regressors in the equations in eqlist . laglist specifies the list of lags at which the MA terms are to be added.

No comments:

Post a Comment