ETFFIN Finance >> Finanças pessoais curso >  >> Gestão financeira >> finança

Soma dos quadrados

Qual é a soma dos quadrados?

A soma dos quadrados é uma técnica estatística usada na análise de regressão para determinar a dispersão dos pontos de dados. Em uma análise de regressão, o objetivo é determinar o quão bem uma série de dados pode ser ajustada a uma função que pode ajudar a explicar como a série de dados foi gerada. A soma dos quadrados é usada como uma forma matemática de encontrar a função que melhor se ajusta (varia menos) a partir dos dados.

A fórmula para a soma dos quadrados é

Para um conjunto X do n Unid: Soma dos quadrados = eu = 0 n ( X eu - X ) 2 Onde: X eu = o eu t h item no conjunto X = A média de todos os itens do conjunto ( X eu - X ) = O desvio de cada item da média \ begin {alinhados} &\ text {Para um conjunto} X \ text {de} n \ text {items:} \\ &\ text {Soma dos quadrados} =\ sum_ {i =0} ^ {n} \ left (X_i- \ overline {X} \ right) ^ 2 \\ &\ textbf {onde:} \\ &X_i =\ text {O} i ^ {th} \ text {item no conjunto} \\ &\ overline { X} =\ text {A média de todos os itens no conjunto} \\ &\ left (X_i- \ overline {X} \ right) =\ text {O desvio de cada item da média} \\ \ end {alinhado } Para um conjunto X de n itens:Soma dos quadrados =i =0∑n (Xi −X) 2 onde:Xi =O iº item no conjuntoX =A média de todos os itens no conjunto (Xi −X ) =O desvio de cada item da média

A soma dos quadrados também é conhecida como variação.

O que a soma dos quadrados diz a você?

A soma dos quadrados é uma medida de desvio da média. Nas estatísticas, a média é a média de um conjunto de números e é a medida de tendência central mais comumente usada. A média aritmética é calculada simplesmente somando os valores no conjunto de dados e dividindo pelo número de valores.

Digamos que os preços de fechamento da Microsoft (MSFT) nos últimos cinco dias foram 74,01, 74,77, 73,94, 73,61, e 73,40 em dólares americanos. A soma dos preços totais é $ 369,73 e o preço médio ou médio do livro seria $ 369,73 / 5 =$ 73,95.

Mas saber a média de um conjunto de medidas nem sempre é suficiente. As vezes, é útil saber quanta variação existe em um conjunto de medições. O quão distantes os valores individuais estão da média pode fornecer algumas dicas sobre como as observações ou valores são adequados ao modelo de regressão que é criado.

Por exemplo, se um analista quiser saber se o preço das ações da MSFT se move em conjunto com o preço da Apple (AAPL), ele pode listar o conjunto de observações para o processo de ambos os estoques por um determinado período, diga 1, 2, ou 10 anos e criar um modelo linear com cada uma das observações ou medições registradas. Se a relação entre as duas variáveis ​​(ou seja, o preço de AAPL e o preço de MSFT) não é uma linha reta, então, há variações no conjunto de dados que precisam ser examinadas.

Em estatísticas falam, se a linha no modelo linear criado não passa por todas as medidas de valor, então, parte da variabilidade observada nos preços das ações não é explicada. A soma dos quadrados é usada para calcular se existe uma relação linear entre duas variáveis, e qualquer variabilidade inexplicada é referida como a soma residual dos quadrados.

A soma dos quadrados é a soma do quadrado da variação, onde a variação é definida como o spread entre cada valor individual e a média. Para determinar a soma dos quadrados, a distância entre cada ponto de dados e a linha de melhor ajuste é elevada ao quadrado e depois somada. A linha de melhor ajuste minimizará esse valor.

Como calcular a soma dos quadrados

Agora você pode ver porque a medição é chamada de soma dos desvios quadrados, ou a soma dos quadrados para breve. Usando nosso exemplo MSFT acima, a soma dos quadrados pode ser calculada como:

  • SS =(74,01 - 73,95) 2 + (74,77 - 73,95) 2 + (73,94 - 73,95) 2 + (73,61 - 73,95) 2 + (73,40 - 73,95) 2
  • SS =(0,06) 2 + (0,82) 2 + (-0,01) 2 + (-0,34) 2 + (-0,55) 2
  • SS =1.0942

Adicionar a soma dos desvios sozinho sem quadratura resultará em um número igual ou próximo a zero, uma vez que os desvios negativos compensarão quase perfeitamente os desvios positivos. Para obter um número mais realista, a soma dos desvios deve ser elevada ao quadrado. A soma dos quadrados sempre será um número positivo porque o quadrado de qualquer número, seja positivo ou negativo, é sempre positivo.

Exemplo de como usar a soma dos quadrados

Com base nos resultados do cálculo MSFT, uma alta soma de quadrados indica que a maioria dos valores está mais longe da média, e, portanto, há grande variabilidade nos dados. Uma baixa soma de quadrados refere-se à baixa variabilidade no conjunto de observações.

No exemplo acima, 1.0942 mostra que a variabilidade no preço das ações da MSFT nos últimos cinco dias é muito baixa e os investidores que buscam investir em ações caracterizadas pela estabilidade de preços e baixa volatilidade podem optar pela MSFT.

Principais vantagens

  • A soma dos quadrados mede o desvio dos pontos de dados do valor médio.
  • Um resultado de soma de quadrados mais alto indica um grande grau de variabilidade no conjunto de dados, enquanto um resultado inferior indica que os dados não variam consideravelmente do valor médio.

Limitações do uso da soma dos quadrados

Tomar uma decisão de investimento sobre qual ação comprar requer muito mais observações do que as listadas aqui. Um analista pode ter que trabalhar com anos de dados para saber com maior certeza quão alta ou baixa é a variabilidade de um ativo. À medida que mais pontos de dados são adicionados ao conjunto, a soma dos quadrados torna-se maior à medida que os valores são mais dispersos.

As medidas de variação mais amplamente utilizadas são o desvio padrão e a variância. Contudo, para calcular qualquer uma das duas métricas, a soma dos quadrados deve primeiro ser calculada. A variância é a média da soma dos quadrados (ou seja, a soma dos quadrados dividida pelo número de observações). O desvio padrão é a raiz quadrada da variância.

Existem dois métodos de análise de regressão que utilizam a soma dos quadrados:o método dos mínimos quadrados linear e o método dos mínimos quadrados não linear. O método dos mínimos quadrados refere-se ao fato de que a função de regressão minimiza a soma dos quadrados da variância dos pontos de dados reais. Desta maneira, é possível desenhar uma função que forneça estatisticamente o melhor ajuste para os dados. Observe que uma função de regressão pode ser linear (uma linha reta) ou não linear (uma linha curva).