Outros sites Medialivre
Caldeirão da Bolsa

Calculo de correlações de activos com sessões em falta

Espaço dedicado a todo o tipo de troca de impressões sobre os mercados financeiros e ao que possa condicionar o desempenho dos mesmos.

por yabadoo » 29/7/2011 18:04

ferreira10 Escreveu:A melhor solução é claramente a eliminação de dados.Se os não tens; simplesmente, ignora-os.

Quando estás a fazer a correlação de dados, estás a entrar com uma nuvem de pontos.Acontece às vezes serem desprezadas algumas ovelhas negras (pontos) que não seguem o figurino geral.Ou seja, são ignorados às vezes pontos que fogem demasiado à configuração da nuvem, vista como um todo.Faz-se isso de modo a melhorar o ajustamento do modelo.A remoção desses outsiders leva a que a correlação do modelo aumente.Assume-se que foram medições mal feitas, ou, no caso em discussão, assume-se que resultaram de dias atípicos.Pelo que não são facilmente repetiveis.

O importante não é desprezares alguns dados; o importante é saber se a quantidade de dados desprezados não põe em causa a validade do modelo.Em linguagem médica e para quem tome medicamentos, os médicos dizem; se se esqueceu de tomar a dose àquela hora, não é por ai que o gato vai às filhoses.

A sugestão da interpelação é curiosa; é uma pratica corrente substituir dados em falta fazendo uso dos dados adjacentes.Mas o dado assim obtido estaria encarreirado com os seus adjacentes; pelo que não acrescentaria nada de novo ao modelo.O que pode mudar o coeficiente de correlação são dados que não seguem o carreiro principal.E não aqueles que estão encarreirados.

Substituir os dados em falta por zero é um erro grave.O modelo pode não estar a passar pela "origem do referencial" pelo que provocarias uma distorção grave.


Também 'voto' nesta.
"Pedras no caminho? Guardo todas, um dia vou construir um castelo..." (Fernando Pessoa)
 
Mensagens: 535
Registado: 5/3/2010 17:06
Localização: 16

por Automech » 29/7/2011 17:52

Ferreira, obrigado pela excelente explicação. Penso que a opção de eliminar esses dias será realmente a mais adequada nestes caso.

Mares Escreveu:A sugestão do ferreira10 pareçe-me válida se entenderes que uma correlação mais alta reflecte melhor a interpretação dos resultados.

O que eu vou interpretar é a correlação que der, seja ela alta ou baixa. Para mim a interpretação não é melhor nem pior se a correlação for alta ou baixa. Aceito aquilo que vier, como dado estatístico e depois vou adequar o money management a isso.
No man is rich enough to buy back his past - Oscar Wilde
Avatar do Utilizador
 
Mensagens: 9360
Registado: 4/6/2010 12:12
Localização: 16

por Mares » 29/7/2011 17:46

AutoMech Escreveu:Temos então várias possibilidades:
1. Média dos últimos fechos
2. Manter o fecho da última sessão (é como se os preços não tivessem alterado)
3. Eliminar essa mesma sessão dos outros activos (como se o feriado tivesse sido comum a todas as bolsas)

Mares Escreveu:Compara os resultados dos diferentes testes e vê aquele que serve melhor às tuas análises.

Mares, como é que eu posso saber qual serve melhor ? Vai obviamente dar resultados diferentes, mas aqui não há valores melhores ou piores, certos ou errados. O que eu estava a procurar saber é se, do ponto de vista de tratamento estatístico, há alguma das opções que seja mais correcta.

Eu estava mais inclinado para a 3, por mera intuição, mas sem base nenhuma 'científica'.


Estás no campo da estatística e por isso mesmo dependerá muito da tua interpretação perante os resultados.

A sugestão do ferreira10 pareçe-me válida se entenderes que uma correlação mais alta reflecte melhor a interpretação dos resultados.
- A ganância dos outros poderá gerar-lhe lucros.
- A sua ganância poderá levá-lo à ruína.
Avatar do Utilizador
 
Mensagens: 2504
Registado: 20/10/2010 17:33
Localização: 16

por ferreira10 » 29/7/2011 17:10

A melhor solução é claramente a eliminação de dados.Se os não tens; simplesmente, ignora-os.

Quando estás a fazer a correlação de dados, estás a entrar com uma nuvem de pontos.Acontece às vezes serem desprezadas algumas ovelhas negras (pontos) que não seguem o figurino geral.Ou seja, são ignorados às vezes pontos que fogem demasiado à configuração da nuvem, vista como um todo.Faz-se isso de modo a melhorar o ajustamento do modelo.A remoção desses outsiders leva a que a correlação do modelo aumente.Assume-se que foram medições mal feitas, ou, no caso em discussão, assume-se que resultaram de dias atípicos.Pelo que não são facilmente repetiveis.

O importante não é desprezares alguns dados; o importante é saber se a quantidade de dados desprezados não põe em causa a validade do modelo.Em linguagem médica e para quem tome medicamentos, os médicos dizem; se se esqueceu de tomar a dose àquela hora, não é por ai que o gato vai às filhoses.

A sugestão da interpelação é curiosa; é uma pratica corrente substituir dados em falta fazendo uso dos dados adjacentes.Mas o dado assim obtido estaria encarreirado com os seus adjacentes; pelo que não acrescentaria nada de novo ao modelo.O que pode mudar o coeficiente de correlação são dados que não seguem o carreiro principal.E não aqueles que estão encarreirados.

Substituir os dados em falta por zero é um erro grave.O modelo pode não estar a passar pela "origem do referencial" pelo que provocarias uma distorção grave.
“Successful trading is really very simple. Buy a stock at the right time and sell it at
the right time.”«Mel Raiman»
Avatar do Utilizador
 
Mensagens: 1499
Registado: 29/11/2007 3:18

por Automech » 29/7/2011 17:00

Temos então várias possibilidades:
1. Média dos últimos fechos
2. Manter o fecho da última sessão (é como se os preços não tivessem alterado)
3. Eliminar essa mesma sessão dos outros activos (como se o feriado tivesse sido comum a todas as bolsas)

Mares Escreveu:Compara os resultados dos diferentes testes e vê aquele que serve melhor às tuas análises.

Mares, como é que eu posso saber qual serve melhor ? Vai obviamente dar resultados diferentes, mas aqui não há valores melhores ou piores, certos ou errados. O que eu estava a procurar saber é se, do ponto de vista de tratamento estatístico, há alguma das opções que seja mais correcta.

Eu estava mais inclinado para a 3, por mera intuição, mas sem base nenhuma 'científica'.
No man is rich enough to buy back his past - Oscar Wilde
Avatar do Utilizador
 
Mensagens: 9360
Registado: 4/6/2010 12:12
Localização: 16

por Elias » 29/7/2011 16:50

Se um dos mercados esteve fechado, então não será correcto manter o fecho da sessão anterior?
 
Mensagens: 35428
Registado: 5/11/2002 12:21
Localização: Barlavento

por Mares » 29/7/2011 16:49

AutoMech Escreveu:Mas Mares, se li bem:

Através da interpolação, pode-se construir uma função que aproximadamente se "encaixe" nestes dados pontuais, conferindo-lhes, então, a continuidade desejada.


Aí estou a criar dados fictícios baseado numa função que tem de ser criada e que terá as suas limitações.
Parece-me, nesse caso, que limitação por limitação sea mais correcto utilizar a sugestão do VirtuaGod e do Muhammad3010 de utilizar um preço médio, não ?

Isto sabendo que o preço de cotações não encaixa em nenhuma função minimamente fiável, senão já alguém a teria descoberto.



Faz o teste com o valor médio (interpolação linear), com outro tipo de interpolação ou entao retíra os elementos que estão a mais. Compara os resultados dos diferentes testes e vê aquele que serve melhor às tuas análises.
- A ganância dos outros poderá gerar-lhe lucros.
- A sua ganância poderá levá-lo à ruína.
Avatar do Utilizador
 
Mensagens: 2504
Registado: 20/10/2010 17:33
Localização: 16

por Automech » 29/7/2011 16:45

Mas Mares, se li bem:

Através da interpolação, pode-se construir uma função que aproximadamente se "encaixe" nestes dados pontuais, conferindo-lhes, então, a continuidade desejada.


Aí estou a criar dados fictícios baseado numa função que tem de ser criada e que terá as suas limitações.
Parece-me, nesse caso, que limitação por limitação sea mais correcto utilizar a sugestão do VirtuaGod e do Muhammad3010 de utilizar um preço médio, não ?

Isto sabendo que o preço de cotações não encaixa em nenhuma função minimamente fiável, senão já alguém a teria descoberto.
No man is rich enough to buy back his past - Oscar Wilde
Avatar do Utilizador
 
Mensagens: 9360
Registado: 4/6/2010 12:12
Localização: 16

por Mares » 29/7/2011 16:35

AutoMech Escreveu:Podes explicar melhor Mares ?

Para simplificar imagina que de 1 a 31 de Março há mercado todos os dias e tenho as cotações do Gold.

Mas no DAX, não tenho cotações a 22 de Fevereiro e 15 de Março porque esteve fechado.

O que é que faço com esses 2 dias se quiser obter a correlação entre o Dax e o Gold ?


Se faltarem-te apenas pontos discretos no teu gráfico poderás calcular a média com os dados vizinhos.

Dá uma olhada nesta referência http://pt.wikipedia.org/wiki/Interpola%C3%A7%C3%A3o

Ou então pesquisa por "interpolação" no google.
- A ganância dos outros poderá gerar-lhe lucros.
- A sua ganância poderá levá-lo à ruína.
Avatar do Utilizador
 
Mensagens: 2504
Registado: 20/10/2010 17:33
Localização: 16

por Automech » 29/7/2011 16:25

Podes explicar melhor Mares ?

Para simplificar imagina que de 1 a 31 de Março há mercado todos os dias e tenho as cotações do Gold.

Mas no DAX, não tenho cotações a 22 de Fevereiro e 15 de Março porque esteve fechado.

O que é que faço com esses 2 dias se quiser obter a correlação entre o Dax e o Gold ?
No man is rich enough to buy back his past - Oscar Wilde
Avatar do Utilizador
 
Mensagens: 9360
Registado: 4/6/2010 12:12
Localização: 16

Re: Calculo de correlações de activos com sessões em falta

por Mares » 29/7/2011 16:21

AutoMech Escreveu:Tenho algumas bases de dados de vários activos (indices, commodities, metals, etc) e estou a tentar encontrar a correlação entre eles. No entanto, como são bases de dados grandes, faltam-me pontualmente dados, neste ou naquele activo, nalguns dias (ainda não vi em pormenor, mas penso que seja por causa dos feriados).

Qual é o tratamento estatístico correcto ? Deve-se eliminar essa sessão de todos os activos ?

Ou seja, imaginemos que no dia X só não tenho DAX porque foi feriado, mas tenho EURUSD, Gold, Oil, etc.

No Excel não posso deixar caracteres alfabéticos no DAX tipo "ND". Também não me parece correcto colocar zero no DAX porque senão vai influenciar os cálculos. Deverei então eliminar esse dia do EURUSD, Gold e Oil (apesar de ter tido sessão), uma vez que não tenho sessão no DAX ?

Outra questão: alguém sabe se existe algum site já com esta informação disponível (correlação), para depois poder comparar resultados ?


Fazes uma interpolação dos dados para que assim tenhas o mesmo número de elementos.
- A ganância dos outros poderá gerar-lhe lucros.
- A sua ganância poderá levá-lo à ruína.
Avatar do Utilizador
 
Mensagens: 2504
Registado: 20/10/2010 17:33
Localização: 16

por VirtuaGod » 29/7/2011 11:23

Muhammad3010 Escreveu:Podes fazer uma média da cotação de fecho do dia anterior com a do dia seguinte ou colocar a cotação do dia anterior.


+1
Artigos e estudos: Página repositório dos meus estudos e análises que vou fazendo. Regularmente actualizada. É costume pelo menos mais um estudo por semana. Inclui a análise e acompanhamento das carteiras 4 e 8Fundos.
Portfolio Analyser: Ferramenta para backtests de Fundos e ETFs Europeus

"We don’t need a crystal ball to be successful investors. However, investing as if you have one is almost guaranteed to lead to sub-par results." The Irrelevant Investor
Avatar do Utilizador
 
Mensagens: 5707
Registado: 20/11/2002 21:56
Localização: Porto

por Muhammad3010 » 29/7/2011 11:13

Podes fazer uma média da cotação de fecho do dia anterior com a do dia seguinte ou colocar a cotação do dia anterior. Também podes eliminar os dados para esse dia, é tudo uma questão de tentares não "influenciar" a correlação pela falta desses dados.

Colocar 0 estaria fora de questão acho eu :S. Eu lembro-me de ver sites que vendiam esses serviços...mas não consigo agora encontrar no google :(
Avatar do Utilizador
 
Mensagens: 240
Registado: 20/6/2010 13:06
Localização: Lisboa

Calculo de correlações de activos com sessões em falta

por Automech » 29/7/2011 4:11

Tenho algumas bases de dados de vários activos (indices, commodities, metals, etc) e estou a tentar encontrar a correlação entre eles. No entanto, como são bases de dados grandes, faltam-me pontualmente dados, neste ou naquele activo, nalguns dias (ainda não vi em pormenor, mas penso que seja por causa dos feriados).

Qual é o tratamento estatístico correcto ? Deve-se eliminar essa sessão de todos os activos ?

Ou seja, imaginemos que no dia X só não tenho DAX porque foi feriado, mas tenho EURUSD, Gold, Oil, etc.

No Excel não posso deixar caracteres alfabéticos no DAX tipo "ND". Também não me parece correcto colocar zero no DAX porque senão vai influenciar os cálculos. Deverei então eliminar esse dia do EURUSD, Gold e Oil (apesar de ter tido sessão), uma vez que não tenho sessão no DAX ?

Outra questão: alguém sabe se existe algum site já com esta informação disponível (correlação), para depois poder comparar resultados ?
No man is rich enough to buy back his past - Oscar Wilde
Avatar do Utilizador
 
Mensagens: 9360
Registado: 4/6/2010 12:12
Localização: 16


Quem está ligado:
Utilizadores a ver este Fórum: Apramg, Bing [Bot], Google [Bot], Google Adsense [Bot] e 268 visitantes