Saturday 8 July 2017

Mudança Média De Pandas


Estou tentando criar uma função para o Kaufman Adaptive Moving Average (KAMA), em Python Pandas ou usando Cython (eu já fiz isso em R amp Rcpp). Estou tendo problemas com o cálculo recursivo, filt1 Estou esperando que a Série KAMA deve ter (i) NAs para começar, o comprimento de n10 (ii) Para iniciar o KAMA, para 2010-01-19 a média bruta do preço 1142.393, em Este caso, a média dos fechamentos (iii) Posteriormente, os valores de KAMA das fórmulas recursivas filt1i fiz um começo, como faço eu calculo filt1i dentro de Pandas ou usando Cython, com resultado como banco de dados de pandas Muitos Agradecimentos. Testando um Crossover Médico Mover Em Python com pandas No artigo anterior sobre Ambientes de Backtesting de Pesquisa Em Python Com Pandas, criamos um ambiente de backtesting baseado em pesquisa orientado a objetos e testávamos isso em uma estratégia de previsão aleatória. Neste artigo, faremos uso da maquinaria que introduzimos para realizar pesquisas sobre uma estratégia real, a saber, o Crossover de média móvel na AAPL. Estratégia de Crossover média móvel A técnica de Crossover de média móvel é uma estratégia de impulso simplista extremamente conhecida. Muitas vezes é considerado o exemplo do Hello World para negociação quantitativa. A estratégia descrita aqui é longa apenas. São criados dois filtros de média móvel simples separados, com diferentes períodos de lookback, de uma série temporal específica. Os sinais para comprar o recurso ocorrem quando a média móvel de lookback mais curta excede a média móvel de lookback mais longa. Se a média mais longa exceder a média mais curta, o ativo é vendido de volta. A estratégia funciona bem quando uma série temporal entra em um período de forte tendência e, em seguida, inverte lentamente a tendência. Para este exemplo, escolhi a Apple, Inc. (AAPL) como a série temporal, com um curto lookback de 100 dias e um longo lookback de 400 dias. Este é o exemplo fornecido pela biblioteca de negociação algorítmica de tirolesa. Assim, se quisermos implementar nosso próprio backtester, precisamos garantir que ele coincida com os resultados na linha aérea, como um meio básico de validação. Implementação Certifique-se de seguir o tutorial anterior aqui. Que descreve como a hierarquia de objeto inicial para o backtester é construída, caso contrário, o código abaixo não funcionará. Para esta implementação particular eu usei as seguintes bibliotecas: A implementação do macross. py requer backtest. py do tutorial anterior. O primeiro passo é importar os módulos e objetos necessários: como no tutorial anterior, vamos sub-classificar a classe básica abstrata Estratégia para produzir MovingAverageCrossStrategy. Que contém todos os detalhes sobre como gerar os sinais quando as médias móveis da AAPL se cruzam. O objeto requer uma janela curta e uma longa janela para operar. Os valores foram configurados para padrões de 100 dias e 400 dias, respectivamente, que são os mesmos parâmetros usados ​​no exemplo principal de tirolesa. As médias móveis são criadas usando a função pandas rollingmean no preço de fechamento do fechamento de barras do estoque AAPL. Uma vez que as médias móveis individuais foram construídas, a série do sinal é gerada definindo a coluna igual a 1,0 quando a média móvel curta é maior do que a média móvel longa, ou 0,0 caso contrário. A partir disso, as ordens de posições podem ser geradas para representar sinais de negociação. O MarketOnClosePortfolio é subclassado do Portfolio. Que é encontrado em backtest. py. É quase idêntico à implementação descrita no tutorial anterior, com a exceção de que os negócios são agora realizados em uma base Close-to-Close, em vez de Open-to-Open. Para obter detalhes sobre como o objeto Portfolio está definido, consulte o tutorial anterior. Eu deixei o código em completo e mantenho esse tutorial autônomo. Agora que as classes MovingAverageCrossStrategy e MarketOnClosePortfolio foram definidas, uma função principal será chamada para amarrar toda a funcionalidade em conjunto. Além disso, o desempenho da estratégia será examinado através de um gráfico da curva de equidade. O objeto DataReader de pandas baixa os preços de ações da AAPL da OHLCV para o período de 1º de janeiro de 1990 a 1º de janeiro de 2002, em que ponto os sinais DataFrame são criados para gerar os sinais de longo tempo. Posteriormente, o portfólio é gerado com uma base de capital inicial de 100.000 USD e os retornos são calculados na curva de patrimônio. O passo final é usar matplotlib para plotar um gráfico de dois dígitos de ambos os preços AAPL, superado com as médias móveis e os sinais de buysell, bem como a curva de equidade com os mesmos sinais de compra. O código de plotagem é tomado (e modificado) do exemplo de implementação de tirolesa. A saída gráfica do código é a seguinte. Eu usei o comando de pasta IPython para colocar isso diretamente no console do IPython, enquanto no Ubuntu, de modo que a saída gráfica permaneceu em exibição. As barras-de-rosa cor-de-rosa representam a compra do estoque, enquanto os bastões negros representam vendê-lo de volta: como pode ser visto, a estratégia perde dinheiro durante o período, com cinco comércios de ida e volta. Isso não é surpreendente, dado o comportamento da AAPL durante o período, que estava em uma ligeira tendência descendente, seguido de um aumento significativo em 1998. O período de lookback dos sinais da média móvel é bastante grande e isso impactou o lucro do comércio final , O que de outra forma pode ter tornado a estratégia rentável. Em artigos subsequentes, criaremos um meio mais sofisticado de análise de desempenho, bem como descrevendo como otimizar os períodos de lookback dos indicadores de média móvel de ferramentas de comunicação. Analogamente, o DataFrame possui um método cov para calcular covariâncias em pares entre as séries no DataFrame, também Excluindo valores NAnull. Supondo que os dados em falta faltam aleatoriamente, isso resulta em uma estimativa para a matriz de covariância que é imparcial. No entanto, para muitas aplicações, esta estimativa pode não ser aceitável porque a matriz de covariância estimada não é garantida como positiva semi-definida. Isso poderia levar a correlações estimadas com valores absolutos que são superiores a uma, e uma matriz de covariância não reversível. Consulte Estimativa de matrizes de covariância para obter mais detalhes. DataFrame. cov também suporta uma palavra-chave de minperiods opcional que especifica o número mínimo de observações necessário para cada par de colunas para ter um resultado válido. Os pesos utilizados na janela são especificados pela palavra-chave wintype. A lista de tipos reconhecidos são: boxcar triang blackman hamming bartlett parzen bohman blackmanharris nuttall barthann kaiser (precisa de beta) gaussian (needs std) generalgaussian (precisa de poder, largura) slepian (precisa de largura). Observe que a caixa de caixa é equivalente à média (). Para algumas funções de janelagem, parâmetros adicionais devem ser especificados: Para. sum () com um wintype. Não há normalização feita para os pesos para a janela. Passar pesos personalizados de 1, 1, 1 produzirá um resultado diferente do que os pesos de 2, 2, 2. por exemplo. Ao passar um tipo de vitória em vez de especificar explicitamente os pesos, os pesos já estão normalizados para que o maior peso seja 1. Em contraste, a natureza do cálculo. mean () é tal que os pesos são normalizados uns com os outros. Os pesos de 1, 1, 1 e 2, 2, 2 produzem o mesmo resultado. Rolling Tempo-consciente Novo na versão 0.19.0. Novos na versão 0.19.0 são a capacidade de passar um deslocamento (ou conversível) para um método. rolling () e fazer com que eles produza janelas de tamanho variável com base na janela de tempo passada. Para cada ponto de tempo, isso inclui todos os valores anteriores que ocorrem dentro do delta de tempo indicado. Isso pode ser particularmente útil para um índice de freqüência de tempo não regular. Este é um índice de frequência regular. Usar um parâmetro de janela inteira funciona para rolar ao longo da freqüência da janela. Especificar um deslocamento permite uma especificação mais intuitiva da freqüência de rolamento. Usando um índice não regular, mas monotônico, rolar com uma janela inteira não fornece nenhum cálculo especial. Usando a especificação de tempo gera janelas variáveis ​​para esses dados esparsos. Além disso, agora permitimos um parâmetro opcional para especificar uma coluna (em vez do padrão do índice) em um DataFrame. Time-aware Rolling vs. Resampling Usando. rolling () com um índice baseado em tempo é bastante semelhante ao reesserramento. Ambos operam e realizam operações redutoras em objetos de pandas indexados no tempo. Ao usar. rolling () com um deslocamento. O deslocamento é um delta de tempo. Faça uma janela de visualização para trás, e agregue todos os valores nessa janela (incluindo o ponto final, mas não o ponto de início). Este é o novo valor nesse ponto no resultado. Estas são janelas de tamanho variável no espaço de tempo para cada ponto da entrada. Você receberá o mesmo resultado de tamanho que a entrada. Ao usar. resample () com um deslocamento. Construa um novo índice que seja a frequência do deslocamento. Para cada compartimento de frequência, agregue pontos da entrada dentro de uma janela de visualização para trás que se encontra naquela lixeira. O resultado dessa agregação é o resultado desse ponto de freqüência. As janelas são tamanho de tamanho fixo no espaço de frequência. Seu resultado terá a forma de uma freqüência regular entre o mínimo e o máximo do objeto de entrada original. Para resumir. Rolling () é uma operação de janela baseada no tempo, enquanto que. resample () é uma operação de janela baseada em freqüência. Centrando o Windows Por padrão, as etiquetas são definidas para a borda direita da janela, mas uma palavra-chave central está disponível para que as etiquetas possam ser definidas no centro. Funções de janela binária cov () e corr () podem calcular estatísticas de janela em movimento sobre duas séries ou qualquer combinação de DataFrameSeries ou DataFrameDataFrame. Aqui está o comportamento em cada caso: duas séries. Calcular a estatística para o emparelhamento. DataFrameSeries. Computa as estatísticas de cada coluna do DataFrame com a série passada, devolvendo um DataFrame. DataFrameDataFrame. Por padrão, computa a estatística para combinar nomes de colunas, retornando um DataFrame. Se o argumento da palavra-chave pairwiseTrue for passado, ele calcula a estatística para cada par de colunas, retornando um Painel cujos itens são as datas em questão (veja a próxima seção). Computação de rolamento de covariâncias e correlações em pares Na análise de dados financeiros e outros campos, it8217s comuns às margens de covariância e correlação de cálculo para uma coleção de séries temporais. Muitas vezes, um também está interessado em covariância de janela móvel e matrizes de correlação. Isso pode ser feito passando o argumento da palavra-chave pairwise, que no caso das entradas do DataFrame produzirá um Painel cujos itens são as datas em questão. No caso de um único argumento do DataFrame, o argumento pairwise pode ser omitido: os valores ausentes são ignorados e cada entrada é calculada usando as observações completas pairwise. Veja a seção de covariância para as advertências associadas a este método de cálculo de matrizes de covariância e correlação. Além de não ter um parâmetro de janela, essas funções têm as mesmas interfaces que suas contrapartes. Como acima, os parâmetros que todos eles aceitam são: minperíodos. Limite de pontos de dados não nulos para exigir. Padrões mínimos necessários para calcular estatística. Nenhum NaNs será emitido uma vez que os pontos de dados não-nulos de minperiods tenham sido vistos. centro. Booleano, seja para definir os rótulos no centro (o padrão é Falso) A saída dos métodos. rolling e. expanding não retorna um NaN se houver pelo menos minperiods valores não nulos na janela atual. Isso difere do cumsum. Cumprod. Cummax. E cummin. Que retornam NaN na saída onde quer que um NaN seja encontrado na entrada. Uma estatística de janela em expansão será mais estável (e menos responsivo) do que a contrapartida da janela rolante, pois o tamanho crescente da janela diminui o impacto relativo de um ponto de dados individual. Como exemplo, aqui está a saída média () para o conjunto de dados da série temporal anterior: Windows ponderado exponencial Um conjunto de funções relacionadas são versões ponderadas exponencialmente de várias das estatísticas acima. Uma interface semelhante a. rolling e. expanding é acessada através do método. ewm para receber um objeto EWM. Uma série de métodos EW expandidos (ponderados exponencialmente) são fornecidos:

No comments:

Post a Comment