Implementação da planilha de ajuste sazonal e suavização exponencial É simples executar o ajuste sazonal e ajustar os modelos de suavização exponencial usando o Excel. As imagens e gráficos da tela abaixo são tirados de uma planilha que foi configurada para ilustrar o ajuste sazonal multiplicativo e a suavização exponencial linear nos seguintes dados de vendas trimestrais da Outboard Marine: Para obter uma cópia do próprio arquivo de planilha, clique aqui. A versão de suavização exponencial linear que será usada aqui para fins de demonstração é a versão Brown8217s, simplesmente porque ela pode ser implementada com uma única coluna de fórmulas e há apenas uma constante de suavização para otimizar. Normalmente, é melhor usar a versão Holt8217s que possui constantes de suavização separadas para nível e tendência. O processo de previsão procede da seguinte forma: (i) primeiro os dados são ajustados sazonalmente (ii) então as previsões são geradas para os dados dessazonalizados linearmente e (iii) finalmente as previsões sazonalmente ajustadas são estimadas para obter as previsões para a série original . O processo de ajuste sazonal é executado nas colunas D a G. O primeiro passo no ajuste sazonal é calcular uma média móvel centralizada (realizada aqui na coluna D). Isso pode ser feito considerando a média de duas médias de um ano que são compensadas por um período relativo entre si. (Uma combinação de duas médias de offset, em vez de uma única média, é necessária para fins de centralização quando o número de estações é uniforme.) O próximo passo é computar a proporção para a média móvel - isto é. os dados originais divididos pela média móvel em cada período - que é realizada aqui na coluna E. (Isso também é chamado de componente quottrend-cyclequot do padrão, na medida em que os efeitos da tendência e do ciclo de negócios podem ser considerados como sendo todos permanece após a média de um ano inteiro de dados. É claro que as mudanças mês a mês que não são devidas à sazonalidade podem ser determinadas por muitos outros fatores, mas a média de 12 meses suaviza-as em grande parte.) O índice sazonal estimado para cada estação é calculado medindo em primeiro lugar todas as razões para aquela estação particular, que é feita nas células G3-G6 usando uma fórmula AVERAGEIF. Os rácios médios são então reescalados de modo a somarem exatamente 100 vezes o número de períodos de uma estação, ou 400 neste caso, o que é feito nas células H3-H6. Abaixo, na coluna F, as fórmulas VLOOKUP são usadas para inserir o valor de índice sazonal apropriado em cada linha da tabela de dados, de acordo com o trimestre do ano que ela representa. A média móvel centralizada e os dados dessazonalizados acabam ficando assim: Observe que a média móvel geralmente parece uma versão mais suave da série ajustada sazonalmente, e é mais curta nos dois extremos. Outra planilha no mesmo arquivo do Excel mostra a aplicação do modelo de suavização exponencial linear aos dados dessazonalizados, começando na coluna G. Um valor para a constante de suavização (alfa) é inserido acima da coluna de previsão (aqui, na célula H9) e por conveniência, é atribuído o nome de intervalo quotAlpha. quot (O nome é atribuído usando o comando quotInsert / Name / Createquot). O modelo LES é inicializado definindo as duas primeiras previsões como iguais ao primeiro valor real da série ajustada sazonalmente. A fórmula usada aqui para a previsão do LES é a forma recursiva de equação única do modelo Brown8217s: Essa fórmula é inserida na célula correspondente ao terceiro período (aqui, célula H15) e copiada de lá. Observe que a previsão do LES para o período atual se refere às duas observações anteriores e aos dois erros de previsão anteriores, bem como ao valor de alfa. Assim, a fórmula de previsão na linha 15 refere-se apenas aos dados que estavam disponíveis na linha 14 e anterior. (Claro, se quiséssemos usar suavização exponencial simples em vez de linear, poderíamos substituir a fórmula SES aqui. Também poderíamos usar Holt8217s em vez do modelo LES de Brown8217s, o que exigiria mais duas colunas de fórmulas para calcular o nível e a tendência que são usados na previsão.) Os erros são computados na próxima coluna (aqui, coluna J) subtraindo as previsões dos valores reais. O erro quadrático médio da raiz é calculado como a raiz quadrada da variância dos erros mais o quadrado da média. (Isso decorre da identidade matemática: MSE VARIANCE (erros) (MÉDIA (erros)) 2.) Ao calcular a média e a variância dos erros nesta fórmula, os dois primeiros períodos são excluídos porque o modelo não inicia a previsão até o terceiro período (linha 15 na planilha). O valor ideal de alfa pode ser encontrado alterando manualmente o alfa até que o RMSE mínimo seja encontrado, ou então você pode usar o quotSolverquot para executar uma minimização exata. O valor de alfa que o Solver encontrou é mostrado aqui (alpha0,471). Geralmente, é uma boa ideia plotar os erros do modelo (em unidades transformadas) e também calcular e plotar suas autocorrelações em intervalos de até uma temporada. Aqui está um gráfico de série temporal dos erros (ajustados sazonalmente): As autocorrelações de erro são calculadas usando a função CORREL () para calcular as correlações dos erros com elas próprias defasadas por um ou mais períodos - detalhes são mostrados no modelo de planilha . Aqui está um gráfico das autocorrelações dos erros nas primeiras cinco defasagens: As autocorrelações nos lags 1 a 3 são muito próximas de zero, mas o pico na defasagem 4 (cujo valor é 0,35) é um pouco problemático - sugere que processo de ajuste sazonal não foi completamente bem sucedido. No entanto, na verdade, é apenas marginalmente significativo. 95 bandas de significância para testar se as autocorrelações são significativamente diferentes de zero são aproximadamente mais ou menos 2 / SQRT (n-k), onde n é o tamanho da amostra ek é a defasagem. Aqui n é 38 e k varia de 1 a 5, então a raiz quadrada-de-n-menos-k é em torno de 6 para todos eles e, portanto, os limites para testar a significância estatística de desvios de zero são mais ou menos ou-menos 2/6, ou 0,33. Se você alterar o valor de alfa manualmente neste modelo do Excel, poderá observar o efeito nos gráficos de série temporal e de autocorrelação dos erros, bem como no erro de raiz quadrática média, que será ilustrado abaixo. Na parte inferior da planilha, a fórmula de previsão é "transferida" para o futuro simplesmente substituindo as previsões por valores reais no ponto em que os dados reais se esgotam - ou seja, onde começa o futuro? (Em outras palavras, em cada célula onde um valor de dados futuros ocorreria, é inserida uma referência de célula que aponta para a previsão feita para esse período.) Todas as outras fórmulas são simplesmente copiadas de cima: Observe que os erros de previsão de o futuro é computado como zero. Isso não significa que os erros reais serão zero, mas apenas refletem o fato de que, para fins de previsão, estamos assumindo que os dados futuros serão iguais às previsões em média. As previsões de LES resultantes para os dados dessazonalizados são assim: Com este valor particular de alfa, que é ideal para previsões de um período à frente, a tendência projetada é levemente ascendente, refletindo a tendência local que foi observada nos últimos 2 anos. ou então. Para outros valores de alfa, uma projeção de tendência muito diferente pode ser obtida. Geralmente, é uma boa ideia ver o que acontece com a projeção de tendência de longo prazo quando alfa é variada, porque o valor que é melhor para a previsão de curto prazo não será necessariamente o melhor valor para prever o futuro mais distante. Por exemplo, aqui está o resultado obtido se o valor de alfa for definido manualmente para 0,25: A tendência de longo prazo projetada é agora negativa em vez de positiva Com um valor menor de alfa, o modelo está colocando mais peso nos dados mais antigos sua estimativa do nível e tendência atuais e suas previsões de longo prazo refletem a tendência de queda observada nos últimos 5 anos, em vez da tendência ascendente mais recente. Este gráfico também ilustra claramente como o modelo com um valor menor de alfa é mais lento para responder a pontos de quitação nos dados e, portanto, tende a cometer um erro do mesmo sinal por muitos períodos consecutivos. Seus erros de previsão de um passo à frente são maiores em média do que os obtidos antes (RMSE de 34,4 em vez de 27,4) e fortemente positivamente autocorrelacionados. A autocorrelação de 0,5-lag de 0,56 excede em muito o valor de 0,33 calculado acima para um desvio estatisticamente significativo de zero. Como uma alternativa para reduzir o valor de alfa a fim de introduzir mais conservadorismo em previsões de longo prazo, um fator de redução de tendência de cotação é algumas vezes adicionado ao modelo para fazer com que a tendência projetada se estabilize após alguns períodos. O passo final na construção do modelo de previsão é cotalizar as previsões do LES, multiplicando-as pelos índices sazonais apropriados. Assim, as previsões sazonais na coluna I são simplesmente o produto dos índices sazonais na coluna F e as previsões de LES ajustadas sazonalmente na coluna H. É relativamente fácil calcular os intervalos de confiança para as previsões em um passo feitas por este modelo: primeiro calcula o RMSE (erro de raiz quadrada média, que é apenas a raiz quadrada do MSE) e calcula um intervalo de confiança para a previsão ajustada de sazonalidade adicionando e subtraindo duas vezes o RMSE. (Em geral, um intervalo de confiança de 95 para uma previsão de um período à frente é aproximadamente igual ao ponto de previsão mais ou menos-duas vezes o desvio padrão estimado dos erros de previsão, supondo que a distribuição de erro seja aproximadamente normal e o tamanho da amostra é grande o suficiente, digamos, 20 ou mais Aqui, o RMSE, em vez do desvio padrão amostral dos erros, é a melhor estimativa do desvio padrão dos erros de previsão futuros porque leva em conta também variações aleatórias.) Os limites de confiança para a previsão dessazonalizada são então ressarcidas. juntamente com a previsão, multiplicando-os pelos índices sazonais apropriados. Neste caso, o RMSE é igual a 27,4 e a previsão sazonalmente ajustada para o primeiro período futuro (Dez-93) é de 273,2. então, o intervalo de confiança 95 ajustado sazonalmente é de 273,2-227,4 218,4 para 273,2227,4 328,0. Multiplicando esses limites por dezembro, o índice sazonal de 68,61. obtemos limites de confiança inferiores e superiores de 149,8 e 225,0 em torno da previsão do ponto de 93 de dezembro de 187,4. Os limites de confiança para as previsões mais de um período à frente geralmente aumentarão conforme o horizonte de previsão aumenta, devido à incerteza sobre o nível e a tendência, bem como os fatores sazonais, mas é difícil calculá-los em geral por métodos analíticos. (A maneira apropriada de calcular os limites de confiança para a previsão do LES é usando a teoria ARIMA, mas a incerteza nos índices sazonais é outra questão.) Se você quiser um intervalo de confiança realista para uma previsão mais de um período adiante, tomar todas as fontes de erro, sua melhor aposta é usar métodos empíricos: por exemplo, para obter um intervalo de confiança para uma previsão de 2 passos, você pode criar outra coluna na planilha para calcular uma previsão de 2 passos para cada período ( por bootstrapping a previsão de um passo à frente). Em seguida, calcule o RMSE dos erros de previsão de dois passos e use-o como base para um intervalo de confiança de dois passos. Previsão de tendências sazonais e tendências por médias móveis ponderadas exponencialmente O artigo fornece um desenvolvimento sistemático das expressões de previsão para exponenciais médias móveis ponderadas. Métodos para séries sem tendência, ou tendência aditiva ou multiplicativa são examinados. Da mesma forma, os métodos abrangem séries não sazonais e sazonais com estruturas de erro aditivas ou multiplicativas. O artigo é uma versão reimpressa do relatório de 1957 para o Escritório de Pesquisa Naval (ONR 52) e está sendo publicado aqui para fornecer maior acessibilidade. Alisamento exponencial Previsão Temporadas locais Tendências locais Cópia de direitos autorais 2004 Publicado por Elsevier B. V. Biografia: Charles C. HOLT é professor de administração emérito da Graduate School of Business, Universidade do Texas em Austin. Sua pesquisa atual é sobre métodos quantitativos de decisão, sistemas de apoio à decisão e previsão financeira. Anteriormente, ele fez pesquisa e ensino no M. I.T. Carnegie Mellon University, a London School of Economics, a Universidade de Wisconsin e o Urban Institute. Ele tem sido ativo em aplicações de computador desde 1947, e tem feito pesquisas sobre controle automático, simulação de sistemas econômicos, programação de produção, emprego e estoques, e a dinâmica da inflação e do desemprego.5.2 Suavização A suavização de séries temporais geralmente é feita para nos ajudar melhor ver padrões, tendências, por exemplo, em séries temporais. Geralmente suavize a aspereza irregular para ver um sinal mais claro. Para dados sazonais, podemos suavizar a sazonalidade para identificarmos a tendência. A suavização não nos fornece um modelo, mas pode ser um bom primeiro passo para descrever vários componentes da série. O termo filtro é usado às vezes para descrever um procedimento de suavização. Por exemplo, se o valor suavizado para um determinado tempo é calculado como uma combinação linear de observações para tempos circunvizinhos, pode-se dizer que aplicamos um filtro linear aos dados (não é o mesmo que dizer que o resultado é uma linha reta, por o caminho). O uso tradicional do termo média móvel é que, em cada ponto no tempo, determinamos as médias (possivelmente ponderadas) dos valores observados em torno de um tempo específico. Por exemplo, no tempo t. uma média móvel centrada de comprimento 3 com pesos iguais seria a média dos valores nos tempos t -1. t. e t1. Para tirar a sazonalidade de uma série, para que possamos ver melhor a tendência, usaríamos uma média móvel com um intervalo sazonal de comprimento. Assim, na série suavizada, cada valor suavizado foi calculado em todas as estações. Isso pode ser feito observando-se uma média móvel unilateral na qual você calcula a média de todos os valores para os anos anteriores que valem dados ou uma média móvel centralizada na qual você usa valores antes e depois da hora atual. Para dados trimestrais, por exemplo, poderíamos definir um valor suavizado para o tempo t como (x t x t-1 x t-2 x t-3) / 4, a média desse tempo e os 3 trimestres anteriores. No código R, este será um filtro unilateral. Uma média móvel centrada cria um pouco de dificuldade quando temos um número par de períodos de tempo no período sazonal (como costumamos fazer). Para suavizar a sazonalidade nos dados trimestrais. A fim de identificar tendências, a convenção usual é usar a média móvel suavizada no tempo t para suavizar a sazonalidade dos dados mensais. Para identificar a tendência, a convenção usual é usar a média móvel suavizada no tempo t. Ou seja, aplicamos o peso 1/24 aos valores nos tempos t6 e t6 e o peso 1/12 em todos os valores em todos os momentos entre t5 e t5. No comando R filter, especifique bem um filtro de dois lados quando quisermos usar valores que vêm antes e depois do tempo para o qual foram suavizados. Observe que na página 71 de nosso livro, os autores aplicam ponderações iguais em uma média móvel sazonal centralizada. Isso também está bem. Por exemplo, um suavizador trimestral pode ser suavizado no tempo t é frat x frac x frac x frac x frac x Um suavizador mensal pode aplicar um peso de 1/13 a todos os valores dos tempos t-6 a t6. O código usado pelos autores na página 72 aproveita um comando rep que repete um valor um determinado número de vezes. Eles não usam o parâmetro filter no comando filter. Exemplo 1 Produção Trimestral de Cerveja na Austrália Na Lição 1 e na Lição 4, analisamos uma série de produção trimestral de cerveja na Austrália. O seguinte código R cria uma série suavizada que nos permite ver o padrão de tendência e plota este padrão de tendência no mesmo gráfico da série temporal. O segundo comando cria e armazena a série suavizada no objeto chamado trendpattern. Observe que, dentro do comando filter, o parâmetro named filter fornece os coeficientes para nossa suavização e os lados 2 fazem com que uma suavidade centralizada seja calculada. beerprod scan (beerprod. dat) filtro de padrão de tendência (beerprod, filtro c (1/8, 1/4, 1/4, 1/4, 1/8), sides2) plotagem (beerprod, tipo b, tendência anual média móvel principal ) lines (trendpattern) Heres o resultado: Podemos subtrair o padrão de tendência dos valores de dados para obter uma melhor visão da sazonalidade. Veja como isso seria feito: seasonals beerprod - trendpattern plot (seasonals, tipo b, main Padrão sazonal para produção de cerveja) O resultado a seguir: Outra possibilidade de suavizar séries para ver a tendência é o filtro filterpattern2 de filtro unilateral (beerproduto, filtro c (1/4, 1/4, 1/4, 1/4), sides1) Com isso, o valor suavizado é a média do ano passado. Exemplo 2 Desemprego mensal nos EUA Na lição de casa da semana 4, você analisou uma série mensal de desemprego nos EUA de 1948 a 1978. Aqui está uma suavização feita para observar a tendência. trendunemployfilter (desempregado, filterc (1 / 24,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12, 1 / 12,1 / 24), sides2) trendunemploy st (trendunemploy, start c (1948,1), freq 12) enredo (trendunemploy, mainTrend in US Desemprego, 1948-1978, xlab Year) Apenas a tendência suavizada é plotada. O segundo comando identifica as características do tempo do calendário da série. Isso faz com que o enredo tenha um eixo mais significativo. O enredo segue. Para séries não sazonais, você não é obrigado a suavizar qualquer período específico. Para suavizar, você deve experimentar médias móveis de diferentes extensões. Esses períodos de tempo podem ser relativamente curtos. O objetivo é derrubar as arestas para ver qual tendência ou padrão pode estar lá. Outros Métodos de Suavização (Seção 2.4) A Seção 2.4 descreve várias alternativas úteis e sofisticadas para suavizar a média móvel. Os detalhes podem parecer incompletos, mas tudo bem, porque não queremos ficar atolados em muitos detalhes para esses métodos. Dos métodos alternativos descritos na Seção 2.4, o lowess (regressão ponderada localmente) pode ser o mais amplamente utilizado. Exemplo 2 Continuação O gráfico seguinte é uma linha de tendência suavizada para a série de Desemprego dos EUA, encontrada usando um suavizador de baixa densidade, em que uma quantidade substancial (2/3) contribuiu para cada estimativa suavizada. Note que isso suavizou a série de forma mais agressiva do que a média móvel. Os comandos utilizados foram: Desemprego (desempregado, início c (1948,1), freq12) (lowess (desempregado, f 2/3), principal suavização de Lowess da Tendência de Desemprego nos EUA) Suavização exponencial simples A equação básica de previsão para suavização exponencial simples Muitas vezes, é dado como um valor de x no tempo t1 para ser uma combinação ponderada do valor observado no tempo teo valor previsto no tempo t. Embora o método seja chamado de método de suavização, é usado principalmente para previsão de curto prazo. O valor de é chamado a constante de suavização. Por alguma razão, 0.2 é uma escolha padrão de programas. Isso coloca um peso de 0,2 na observação mais recente e um peso de 1,2,3 na previsão mais recente. Com um valor relativamente pequeno, a suavização será relativamente mais extensa. Com um valor relativamente grande de, o alisamento é relativamente menos extenso à medida que mais peso será colocado no valor observado. Esse é um método simples de previsão de um passo à frente que, à primeira vista, parece não exigir um modelo para os dados. De fato, este método é equivalente ao uso de um modelo ARIMA (0,1,1) sem constante. O procedimento ideal é ajustar um modelo ARIMA (0,1,1) ao conjunto de dados observado e usar os resultados para determinar o valor de. Isso é ótimo no sentido de criar o melhor para os dados já observados. Embora o objetivo seja suavizar e antecipar um passo à frente, a equivalência ao modelo ARIMA (0,1,1) traz um bom ponto. Não devemos aplicar cegamente suavização exponencial porque o processo subjacente pode não ser bem modelado por um ARIMA (0,1,1). ARIMA (0,1,1) e Equivalência de Suavização Exponencial Considere um ARIMA (0,1,1) com média 0 para as primeiras diferenças, xt - x t - 1: begin hat amp amp xt theta1 w amp amp xteta1 (xt - que t) amp amp (1 theta1) xt - theta que tendem. Se deixarmos (1 1) e, portanto, - (1) 1, vermos a equivalência à equação (1) acima. Por que o Método é Chamado Alisamento Exponencial Isto produz o seguinte: begin hat amp amp alpha xt (1-alpha) alpha x (1-alpha) hat amp amp alpha xt alfa (1-alfa) x (1-alfa) 2que end Continue desta forma substituindo sucessivamente o valor previsto no lado direito da equação. Isso leva a: hat alfa xt alfa (1-alfa) x alfa (1-alfa) 2 x pontos alfa (1-alfa) jx pontos alfa (1-alfa) x1 texto A equação 2 mostra que o valor previsto é uma média ponderada de todos os valores passados da série, com pesos exponencialmente variáveis à medida que voltamos à série. Alinhamento Exponencial Ótimo em R Basicamente, apenas ajustamos um ARIMA (0,1,1) aos dados e determinamos o coeficiente. Podemos examinar o ajuste da suavidade comparando os valores previstos com a série real. A suavização exponencial tende a ser usada mais como uma ferramenta de previsão do que como um verdadeiro suavizador, portanto, procuramos ver se temos um bom ajuste. Exemplo 3 n 100 observações mensais do logaritmo de um índice de preços do petróleo nos Estados Unidos. A série de dados é: Um ajuste de ARIMA (0,1,1) em R deu um coeficiente de MA (1) 0,3877. Assim (1 1) 1,3877 e 1-0,3877. A equação de previsão de suavização exponencial é 1.3877xt - 0.3877hat t No tempo 100, o valor observado da série é x 100 0,86601. O valor previsto para a série nesse momento é Assim, a previsão para o tempo 101 é hat 1.3877x - 0.3877hat 1.3877 (0.86601) -0.3877 (0.856789) 0.8696 A seguir está o quão bem o mais suave se encaixa na série. É um bom ajuste. Isso é um bom sinal para previsão, o principal objetivo para este mais suave. Aqui estão os comandos usados para gerar a saída para este exemplo: mapeamento de oilindex (oildata. dat) plot (índice de óleo, tipo b, Log principal da série de índices de petróleo) expsmoothfit arima (índice de óleo, ordem c (0,1,1)) expsmoothfit para ver os resultados estimados prevê indexe de óleo - expsmoothimagemresponíveis estimados valores de plotagem (índice de petróleo, typeb, suavização exponencial principal do registro do índice de petróleo) linhas (previsto) 1.3877oilindex100-0.3877preditos100 previsão para tempo 101 Suavização exponencial dupla A suavização exponencial dupla pode ser usada quando houver tendência (longo prazo ou curto prazo), mas sem sazonalidade. Essencialmente, o método cria uma previsão combinando estimativas exponencialmente suavizadas da tendência (inclinação de uma linha reta) e o nível (basicamente, a interceptação de uma linha reta). Dois pesos diferentes, ou parâmetros de suavização, são usados para atualizar esses dois componentes a cada vez. O nível suavizado é mais ou menos equivalente a uma suavização exponencial simples dos valores de dados e a tendência suavizada é mais ou menos equivalente a uma simples suavização exponencial das primeiras diferenças. O procedimento equivale à montagem de um modelo ARIMA (0,2,2), sem constante, pode ser realizado com um ajuste ARIMA (0,2,2). (1-B) 2 xt (1teta1B teta2B2) wt. Navegação
Комментариев нет:
Отправить комментарий