Onde é aplicado o método dos mínimos quadrados?

Onde é aplicado o método dos mínimos quadrados?

Que encontra a mais ampla aplicação em vários campos da ciência e da prática. Pode ser física, química, biologia, economia, sociologia, psicologia e assim por diante. Pela vontade do destino, muitas vezes tenho que lidar com a economia e, portanto, hoje vou providenciar para você uma passagem para um país incrível chamado Econometria=) … Como você não quer isso?! É muito bom lá - você só precisa decidir! …Mas o que você provavelmente quer mesmo é aprender a resolver problemas método mínimos quadrados . E leitores especialmente diligentes aprenderão a resolvê-los não apenas com precisão, mas também MUITO RÁPIDO ;-) Mas primeiro declaração geral do problema+ exemplo relacionado:

Que sejam estudados indicadores em alguma área disciplinar que tenham expressão quantitativa. Ao mesmo tempo, há todos os motivos para acreditar que o indicador depende do indicador. Essa suposição pode ser tanto uma hipótese científica quanto baseada em uma senso comum. Vamos deixar a ciência de lado, no entanto, e explorar áreas mais apetitosas - ou seja, mercearias. Denotar por:

– espaço comercial de uma mercearia, m2,
- faturamento anual de uma mercearia, milhões de rublos.

É bastante claro que quanto maior a área da loja, maior o seu faturamento na maioria dos casos.

Suponha que, após realizar observações / experimentos / cálculos / dançar com um pandeiro, tenhamos à nossa disposição dados numéricos:

Com as mercearias, acho que está tudo claro: - esta é a área da 1ª loja, - o seu volume de negócios anual, - a área da 2ª loja, - o seu volume de negócios anual, etc. A propósito, não é necessário ter acesso a materiais classificados - uma avaliação bastante precisa do volume de negócios pode ser obtida usando estatísticas matemáticas. Porém, não se distraia, o curso de espionagem comercial já é pago =)

Os dados tabulares também podem ser escritos na forma de pontos e representados da maneira usual para nós. sistema cartesiano .

Vamos responder a uma pergunta importante: quantos pontos são necessários para um estudo qualitativo?

Quanto maior melhor. O conjunto mínimo admissível consiste em 5-6 pontos. Além disso, com uma pequena quantidade de dados, resultados “anormais” não devem ser incluídos na amostra. Assim, por exemplo, uma pequena loja de elite pode ajudar ordens de grandeza mais do que “seus colegas”, distorcendo assim o padrão geral que precisa ser encontrado!

Se for bem simples, precisamos escolher uma função, cronograma que passa o mais próximo possível dos pontos . Tal função é chamada aproximando (aproximação - aproximação) ou função teórica . De um modo geral, aqui aparece imediatamente o "requerente" óbvio - o polinômio alto grau, cujo gráfico passa por TODOS os pontos. Mas esta opção é complicada e muitas vezes simplesmente incorreta. (porque o gráfico irá "enrolar" o tempo todo e refletir mal a tendência principal).

Assim, a função desejada deve ser suficientemente simples e ao mesmo tempo refletir adequadamente a dependência. Como você pode imaginar, um dos métodos para encontrar tais funções é chamado mínimos quadrados. Primeiro, vamos analisar sua essência em visão geral. Deixe alguma função aproximar os dados experimentais:


Como avaliar a precisão dessa aproximação? Vamos também calcular as diferenças (desvios) entre os valores experimentais e funcionais (nós estudamos o desenho). O primeiro pensamento que vem à mente é estimar o tamanho da soma, mas o problema é que as diferenças podem ser negativas. (por exemplo, ) e os desvios como resultado de tal soma se anulam. Portanto, como estimativa da precisão da aproximação, sugere-se tomar a soma módulos desvios:

ou em forma dobrada: (de repente, quem não sabe: é o ícone da soma, e é uma variável auxiliar- “contador”, que assume valores de 1 a ).

Aproximando-se dos pontos experimentais várias funções, Nós receberemos Significados diferentes, e obviamente, onde essa soma é menor, essa função é mais precisa.

Tal método existe e é chamado método de módulo mínimo. No entanto, na prática, tornou-se muito mais difundido. método dos mínimos quadrados, em que possíveis valores negativos são eliminados não pelo módulo, mas pela quadratura dos desvios:

, após o que os esforços são direcionados para a seleção de tal função que a soma dos desvios quadrados era o menor possível. Na verdade, daí o nome do método.

E agora estamos de volta para outro ponto importante: conforme observado acima, a função selecionada deve ser bastante simples - mas também existem muitas dessas funções: linear , hiperbólico, exponencial, logarítmico, quadrático etc. E, claro, aqui gostaria imediatamente de "reduzir o campo de atividade". Que classe de funções escolher para pesquisa? Técnica primitiva, mas eficaz:

- A maneira mais fácil de desenhar pontos no desenho e analise sua localização. Se eles tendem a estar em linha reta, você deve procurar equação da linha reta com valores ótimos e . Em outras palavras, a tarefa é encontrar TAIS coeficientes - de modo que a soma dos desvios quadrados seja a menor.

Se os pontos estiverem localizados, por exemplo, ao longo hipérbole, então fica claro que a função linear fornecerá uma aproximação ruim. Neste caso, estamos procurando os coeficientes mais “favoráveis” para a equação da hipérbole - aqueles que dão a soma mínima de quadrados .

Agora observe que em ambos os casos estamos falando sobre funções de duas variáveis, cujos argumentos são opções de dependência pesquisadas:

E, em essência, precisamos resolver um problema padrão - encontrar mínimo de uma função de duas variáveis.

Lembre-se do nosso exemplo: suponha que os pontos de "loja" tendam a estar localizados em linha reta e haja todos os motivos para acreditar na presença dependência linear volume de negócios da área comercial. Vamos encontrar TAIS coeficientes "a" e "ser" para que a soma dos desvios quadrados era o menor. Tudo como de costume - primeiro derivadas parciais de 1ª ordem. De acordo com regra de linearidade você pode diferenciar logo abaixo do ícone de soma:

Se você quiser usar essas informações para um ensaio ou trabalho de conclusão de curso, ficarei muito grato pelo link na lista de fontes, você não encontrará cálculos tão detalhados em nenhum lugar:

Vamos fazer um sistema padrão:

Reduzimos cada equação por um “dois” e, além disso, “separamos” as somas:

Observação : analise independentemente por que "a" e "ser" podem ser retirados do ícone de soma. A propósito, formalmente isso pode ser feito com a soma

Vamos reescrever o sistema em uma forma "aplicada":

após o que o algoritmo para resolver nosso problema começa a ser desenhado:

Conhecemos as coordenadas dos pontos? Nós sabemos. Somas podemos encontrar? Facilmente. Nós compomos o mais simples sistema de duas equações lineares com duas incógnitas("a" e "beh"). Resolvemos o sistema, por exemplo, método de Cramer, resultando em um ponto estacionário . verificando condição suficiente para um extremo, podemos verificar que neste ponto a função atinge precisamente mínimo. A verificação está associada a cálculos adicionais e, portanto, vamos deixá-la nos bastidores. (se necessário, o quadro ausente pode ser visualizado). Tiramos a conclusão final:

Função a melhor maneira (pelo menos em comparação com qualquer outra função linear) aproxima os pontos experimentais . Grosso modo, seu gráfico passa o mais próximo possível desses pontos. Na tradição econometria a função de aproximação resultante também é chamada equação de regressão linear pareada .

O problema em questão tem um grande valor prático. Na situação do nosso exemplo, a equação permite-lhe prever que tipo de volume de negócios ("yig") estará na loja com um ou outro valor da área de venda (um ou outro significado de "x"). Sim, a previsão resultante será apenas uma previsão, mas em muitos casos será bastante precisa.

Vou analisar apenas um problema com números "reais", pois não há dificuldades nele - todos os cálculos estão no nível currículo escolar 7-8 graus. Em 95 por cento dos casos, você será solicitado a encontrar apenas uma função linear, mas no final do artigo mostrarei que não é mais difícil encontrar as equações para a hipérbole ideal, expoente e algumas outras funções.

Na verdade, resta distribuir os presentes prometidos - para que você aprenda a resolver esses exemplos não apenas com precisão, mas também com rapidez. Estudamos cuidadosamente o padrão:

Uma tarefa

Como resultado do estudo da relação entre dois indicadores, foram obtidos os seguintes pares de números:

Usando o método dos mínimos quadrados, encontre a função linear que melhor se aproxima do empírico (com experiência) dados. Faça um desenho em que em cartesiano sistema retangular coordenadas para construir pontos experimentais e um gráfico da função de aproximação . Encontre a soma dos desvios quadrados entre os valores empíricos e teóricos. Descubra se a função é melhor (em termos do método dos mínimos quadrados) pontos experimentais aproximados.

Observe que os valores "x" são valores naturais, e isso tem um significado significativo característico, sobre o qual falarei um pouco mais tarde; mas eles, é claro, podem ser fracionários. Além disso, dependendo do conteúdo de uma determinada tarefa, os valores "X" e "G" podem ser totalmente ou parcialmente negativos. Bem, recebemos uma tarefa “sem rosto” e a iniciamos solução:

Encontramos os coeficientes da função ótima como uma solução para o sistema:

Para fins de uma notação mais compacta, a variável “contador” pode ser omitida, pois já está claro que a soma é feita de 1 a .

É mais conveniente calcular os valores necessários em uma tabela:


Os cálculos podem ser feitos em uma microcalculadora, mas é muito melhor usar o Excel - mais rápido e sem erros; assista a um pequeno vídeo:

Assim, obtemos o seguinte sistema:

Aqui você pode multiplicar a segunda equação por 3 e subtraia a 2ª da 1ª equação termo a termo. Mas isso é sorte - na prática, os sistemas geralmente não são superdotados e, nesses casos, economizam método de Cramer:
, então o sistema tem uma única solução.

Vamos fazer uma verificação. Eu entendo que não quero, mas por que pular erros onde você não pode perdê-los? Substitua a solução encontrada no lado esquerdo de cada equação do sistema:

As partes certas das equações correspondentes são obtidas, o que significa que o sistema é resolvido corretamente.

Assim, a função de aproximação desejada: – de todas as funções lineares os dados experimentais são melhor aproximados por ele.

Diferente direto dependência do faturamento da loja em relação a sua área, a dependência encontrada é marcha ré (princípio "quanto mais - menos"), e esse fato é imediatamente revelado pelo negativo coeficiente angular. Função nos informa que com o aumento de um determinado indicador em 1 unidade, o valor do indicador dependente diminui média por 0,65 unidades. Como se costuma dizer, quanto maior o preço do trigo sarraceno, menos vendido.

Para plotar a função de aproximação, encontramos dois de seus valores:

e execute o desenho:


A linha construída é chamada linha de tendência (ou seja, uma linha de tendência linear, ou seja, em caso Geral tendência não é necessariamente uma linha reta). Todo mundo conhece a expressão "estar na moda", e acho que esse termo dispensa comentários adicionais.

Calcular a soma dos desvios quadrados entre valores empíricos e teóricos. Geometricamente, esta é a soma dos quadrados dos comprimentos dos segmentos "carmesim" (dois dos quais são tão pequenos que você nem consegue vê-los).

Vamos resumir os cálculos em uma tabela:


Eles podem novamente ser executados manualmente, caso eu dê um exemplo para o 1º ponto:

mas é muito mais eficiente fazer da forma já conhecida:

Vamos repetir: qual o significado do resultado? A partir de todas as funções lineares função o expoente é o menor, ou seja, é a melhor aproximação de sua família. E aqui, aliás, a questão final do problema não é acidental: e se a função exponencial proposta será melhor aproximar os pontos experimentais?

Vamos encontrar a soma correspondente dos desvios quadrados - para distingui-los, vou designá-los com a letra "épsilon". A técnica é exatamente a mesma:


E novamente para cada cálculo de incêndio para o 1º ponto:

No Excel, usamos a função padrão EXP (A sintaxe pode ser encontrada na Ajuda do Excel).

Conclusão: , então a função exponencial aproxima os pontos experimentais pior que a reta .

Mas deve-se notar aqui que "pior" é ainda não significa, o que está errado. Agora construí um gráfico dessa função exponencial - e também passa perto dos pontos - tanto que sem um estudo analítico fica difícil dizer qual função é mais precisa.

Isso completa a solução e volto à questão dos valores naturais do argumento. NO vários estudos, via de regra, econômico ou sociológico, números "X" naturais meses, anos ou outros intervalos de tempo iguais. Considere, por exemplo, tal problema.

Após o alinhamento, obtemos uma função da seguinte forma: g (x) = x + 1 3 + 1 .

Podemos aproximar esses dados com uma relação linear y = a x + b calculando os parâmetros apropriados. Para fazer isso, precisaremos aplicar o chamado método dos mínimos quadrados. Você também precisará fazer um desenho para verificar qual linha alinhará melhor os dados experimentais.

Yandex.RTB R-A-339285-1

O que exatamente é OLS (método dos mínimos quadrados)

A principal coisa que precisamos fazer é encontrar tais coeficientes de dependência linear em que o valor da função de duas variáveis ​​F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 será o menor. Ou seja, para determinados valores de a e b, a soma dos desvios quadrados dos dados apresentados a partir da reta resultante terá um valor mínimo. Este é o significado do método dos mínimos quadrados. Tudo o que precisamos fazer para resolver o exemplo é encontrar o extremo da função de duas variáveis.

Como derivar fórmulas para calcular coeficientes

Para derivar fórmulas para calcular os coeficientes, é necessário compor e resolver um sistema de equações com duas variáveis. Para fazer isso, calculamos as derivadas parciais da expressão F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 em relação a a e b e as igualamos a 0 .

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

Para resolver um sistema de equações, você pode usar qualquer método, como a substituição ou o método de Cramer. Como resultado, devemos obter fórmulas que calculam os coeficientes usando o método dos mínimos quadrados.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n

Calculamos os valores das variáveis ​​para as quais a função
F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 assumirá o valor mínimo. No terceiro parágrafo, provaremos por que é assim.

Esta é a aplicação do método dos mínimos quadrados na prática. Sua fórmula, que é usada para encontrar o parâmetro a , inclui ∑ i = 1 n x i , ∑ i = 1 n y i , ∑ i = 1 n x i y i , ∑ i = 1 n x i 2 , e o parâmetro
n - denota a quantidade de dados experimentais. Aconselhamos que calcule cada valor separadamente. O valor do coeficiente b é calculado imediatamente após a .

Voltemos ao exemplo original.

Exemplo 1

Aqui temos n igual a cinco. Para tornar mais conveniente calcular os valores necessários incluídos nas fórmulas de coeficientes, preenchemos a tabela.

eu = 1 eu = 2 eu = 3 eu = 4 eu = 5 ∑ i = 1 5
XI 0 1 2 4 5 12
e eu 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x eu e eu 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x i 2 0 1 4 16 25 46

Solução

A quarta linha contém os dados obtidos pela multiplicação dos valores da segunda linha pelos valores da terceira para cada i individual. A quinta linha contém os dados do segundo quadrado. A última coluna mostra as somas dos valores das linhas individuais.

Vamos usar o método dos mínimos quadrados para calcular os coeficientes a e b de que precisamos. Para fazer isso, substitua os valores desejados da última coluna e calcule as somas:

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y in ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n ⇒ a = 5 33 , 8 - 12 12, 9 5 46 - 12 2 b = 12, 9 - a 12 5 ⇒ a ≈ 0, 165 b ≈ 2, 184

Conseguimos que a linha reta de aproximação desejada se pareça com y = 0, 165 x + 2, 184 . Agora precisamos determinar qual linha aproximará melhor os dados - g (x) = x + 1 3 + 1 ou 0 , 165 x + 2 , 184 . Vamos fazer uma estimativa usando o método dos mínimos quadrados.

Para calcular o erro, precisamos encontrar as somas dos desvios quadrados dos dados das linhas σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 e σ 2 = ∑ i = 1 n (y i - g (x i)) 2 , o valor mínimo corresponderá a uma linha mais adequada.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0 , 165 x i + 2 , 184)) 2 ≈ 0 , 019 σ 2 = ∑ i = 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0 , 096

Responda: desde σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0 , 165 x + 2 , 184 .

O método dos mínimos quadrados é claramente mostrado na ilustração gráfica. A linha vermelha marca a linha reta g (x) = x + 1 3 + 1, a linha azul marca y = 0, 165 x + 2, 184. Os dados brutos são marcados com pontos rosa.

Vamos explicar por que exatamente aproximações desse tipo são necessárias.

Eles podem ser usados ​​em problemas que requerem suavização de dados, bem como naqueles em que os dados precisam ser interpolados ou extrapolados. Por exemplo, no problema discutido acima, pode-se encontrar o valor da quantidade observada y em x = 3 ou em x = 6 . Dedicamos um artigo separado a esses exemplos.

Prova do método LSM

Para que a função tome o valor mínimo quando a e b são calculados, é necessário que em um determinado ponto a matriz da forma quadrática da diferencial da função da forma F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 ser positiva definida. Vamos mostrar como deve ficar.

Exemplo 2

Temos uma diferencial de segunda ordem da seguinte forma:

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; b) δ a δ b d a d b + δ 2 F (a ; b) δ b 2 d 2b

Solução

δ 2 F (a ; b) δ a 2 = δ δ F (a ; b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a; b) δ a δ b = δ δ F (a ; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + b)) δ b = 2 ∑ i = 1 n (1) = 2 n

Em outras palavras, pode ser escrito da seguinte forma: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b .

Obtivemos uma matriz de forma quadrática M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n .

Nesse caso, os valores dos elementos individuais não serão alterados dependendo de a e b . Essa matriz é positiva definida? Para responder a esta pergunta, vamos verificar se seus menores angulares são positivos.

Calcule o menor angular de primeira ordem: 2 ∑ i = 1 n (x i) 2 > 0 . Como os pontos x i não coincidem, a desigualdade é estrita. Manteremos isso em mente em cálculos posteriores.

Calculamos o menor angular de segunda ordem:

d e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2

Em seguida, procedemos à prova da desigualdade n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 por indução matemática.

  1. Vamos verificar se esta desigualdade é válida para n arbitrário. Vamos pegar 2 e calcular:

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

Obtivemos a igualdade correta (se os valores x 1 e x 2 não coincidirem).

  1. Vamos assumir que essa desigualdade será verdadeira para n , ou seja, n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – verdadeiro.
  2. Agora vamos provar a validade para n + 1 , ou seja que (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 > 0 se n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 .

Nós calculamos:

(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - ∑ i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1 n x i + ∑ i = 1 n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1 - x 2) 2 + . . . + (x n - 1 - x n) 2 > 0

A expressão entre chaves será maior que 0 (com base no que assumimos na etapa 2) e o restante dos termos será maior que 0 porque são todos quadrados de números. Provamos a desigualdade.

Responda: o a e b encontrados corresponderão ao menor valor da função F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2, o que significa que eles são os parâmetros necessários do método dos mínimos quadrados (LSM).

Se você notar um erro no texto, destaque-o e pressione Ctrl+Enter

Tem muitos usos, pois permite uma representação aproximada dada função outros são mais simples. O LSM pode ser extremamente útil no processamento de observações e é usado ativamente para estimar algumas quantidades a partir dos resultados das medições de outras que contêm erros aleatórios. Neste artigo, você aprenderá como implementar cálculos de mínimos quadrados no Excel.

Declaração do problema em um exemplo específico

Suponha que existam dois indicadores X e Y. Além disso, Y depende de X. Como o OLS nos interessa do ponto de vista da análise de regressão (no Excel, seus métodos são implementados usando funções internas), devemos prosseguir imediatamente considerar um problema específico.

Então, seja X a área de vendas de uma mercearia, medida em metros quadrados, e Y é o faturamento anual, definido em milhões de rublos.

É necessário fazer uma previsão do volume de negócios (Y) que a loja terá se tiver um ou outro espaço comercial. Obviamente, a função Y = f (X) é crescente, pois o hipermercado vende mais mercadorias do que a banca.

Algumas palavras sobre a exatidão dos dados iniciais usados ​​​​para previsão

Digamos que temos uma tabela construída com dados para n lojas.

De acordo com estatísticas matemáticas, os resultados serão mais ou menos corretos se os dados de pelo menos 5-6 objetos forem examinados. Além disso, resultados "anômalos" não podem ser usados. Em particular, uma pequena boutique de elite pode ter um faturamento muitas vezes maior do que o faturamento de grandes pontos de venda Classe "Masmercado".

A essência do método

Os dados da tabela podem ser exibidos no plano cartesiano como pontos M 1 (x 1, y 1), ... M n (x n, y n). Agora a solução do problema será reduzida à seleção de uma função aproximadora y = f (x), que tenha um gráfico passando o mais próximo possível dos pontos M 1, M 2, .. M n .

Claro, você pode usar um polinômio de alto grau, mas esta opção não é apenas difícil de implementar, mas simplesmente incorreta, pois não refletirá a tendência principal que precisa ser detectada. A solução mais razoável é buscar uma reta y = ax + b, que melhor se aproxime dos dados experimentais e, mais precisamente, dos coeficientes - a e b.

Pontuação de precisão

Para qualquer aproximação, a avaliação de sua precisão é de particular importância. Denote por e i a diferença (desvio) entre os valores funcionais e experimentais para o ponto x i , ou seja, e i = y i - f (x i).

Obviamente, para avaliar a precisão da aproximação, você pode usar a soma dos desvios, ou seja, ao escolher uma linha reta para uma representação aproximada da dependência de X em Y, deve-se dar preferência àquela que tiver o menor valor de a soma ei em todos os pontos considerados. Porém, nem tudo é tão simples, pois junto com os desvios positivos, praticamente virão os negativos.

Você pode resolver o problema usando os módulos de desvio ou seus quadrados. Este último método é o mais amplamente utilizado. É usado em muitas áreas, incluindo análise de regressão (no Excel, sua implementação é realizada usando duas funções internas) e há muito tempo provou ser eficaz.

método dos mínimos quadrados

No Excel, como você sabe, existe uma função interna de soma automática que permite calcular os valores de todos os valores localizados no intervalo selecionado. Assim, nada nos impedirá de calcular o valor da expressão (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

Em notação matemática, fica assim:

Como inicialmente foi tomada a decisão de aproximar usando uma linha reta, temos:

Assim, a tarefa de encontrar uma linha reta que melhor descreva uma relação específica entre X e Y equivale a calcular o mínimo de uma função de duas variáveis:

Isso requer igualar a derivadas parciais nulas em relação às novas variáveis ​​a e b, e resolver um sistema primitivo que consiste em duas equações com 2 incógnitas da forma:

Após transformações simples, incluindo divisão por 2 e manipulação das somas, obtemos:

Resolvendo, por exemplo, pelo método de Cramer, obtemos um ponto estacionário com certos coeficientes a * e b * . Esse é o mínimo, ou seja, para prever qual o faturamento que a loja terá para determinada área, é adequada a reta y = a * x + b *, que é um modelo de regressão para o exemplo em questão. Claro, não permitirá que você encontre o resultado exato, mas ajudará você a ter uma ideia se vale a pena comprar uma loja a crédito para uma determinada área.

Como implementar o método dos mínimos quadrados no Excel

O Excel tem uma função para calcular o valor dos mínimos quadrados. Tem a seguinte forma: TENDÊNCIA (valores Y conhecidos; valores X conhecidos; novos valores X; constante). Vamos aplicar a fórmula para calcular o OLS no Excel em nossa tabela.

Para isso, na célula em que deve ser exibido o resultado do cálculo pelo método dos mínimos quadrados no Excel, digite o sinal “=” e selecione a função “TENDÊNCIA”. Na janela que se abre, preencha os campos apropriados, destacando:

  • gama de valores conhecidos para Y (em este caso dados de volume de negócios);
  • intervalo x 1 , …x n , ou seja, o tamanho do espaço de varejo;
  • e valores conhecidos e desconhecidos de x, para os quais você precisa descobrir o tamanho do volume de negócios (para informações sobre sua localização na planilha, veja abaixo).

Além disso, há uma variável lógica "Const" na fórmula. Se você inserir 1 no campo correspondente, isso significará que os cálculos devem ser realizados, assumindo que b \u003d 0.

Se você precisar saber a previsão para mais de um valor x, depois de inserir a fórmula, não pressione "Enter", mas digite a combinação "Shift" + "Control" + "Enter" ("Enter" ) no teclado.

Algumas funcionalidades

Análise de regressão pode ser acessado até mesmo por manequins. A fórmula do Excel para prever o valor de uma matriz de variáveis ​​desconhecidas - "TENDÊNCIA" - pode ser usada até mesmo por quem nunca ouviu falar do método dos mínimos quadrados. Basta conhecer algumas características de seu trabalho. Em particular:

  • Se você colocar o intervalo de valores conhecidos da variável y em uma linha ou coluna, cada linha (coluna) com valores conhecidos de x será percebida pelo programa como uma variável separada.
  • Se o intervalo com x conhecido não for especificado na janela TREND, no caso de usar a função no Excel, o programa o considerará como uma matriz composta por números inteiros, cujo número corresponde ao intervalo com os valores fornecidos da variável y.
  • Para gerar uma matriz de valores "previstos", a expressão de tendência deve ser inserida como uma fórmula de matriz.
  • Se nenhum novo valor x for especificado, a função TREND os considera iguais aos conhecidos. Se eles não forem especificados, o array 1 será considerado um argumento; 2; 3; 4;…, que é compatível com o intervalo com os parâmetros y já fornecidos.
  • O intervalo que contém os novos valores de x deve consistir no mesmo ou mais linhas ou colunas, como um intervalo com valores y fornecidos. Em outras palavras, deve ser proporcional às variáveis ​​independentes.
  • Uma matriz com valores x conhecidos pode conter várias variáveis. No entanto, se nós estamos falando apenas cerca de um, então é necessário que os intervalos com os valores dados de x e y sejam proporcionais. No caso de várias variáveis, é necessário que o intervalo com os valores de y dados caiba em uma coluna ou em uma linha.

função PREVISÃO

Ele é implementado usando várias funções. Um deles é chamado de "PREDIÇÃO". É semelhante ao TREND, ou seja, fornece o resultado dos cálculos usando o método dos mínimos quadrados. Porém, apenas para um X, para o qual o valor de Y é desconhecido.

Agora você conhece as fórmulas do Excel para dummies que permitem prever o valor do valor futuro de um indicador de acordo com uma tendência linear.

método dos mínimos quadradosé usado para estimar os parâmetros da equação de regressão.
Número de linhas (Dados iniciais)

Um dos métodos para estudar relações estocásticas entre recursos é a análise de regressão.
A análise de regressão é a derivação de uma equação de regressão, que é usada para encontrar valor médio uma variável aleatória (característica-resultado), se o valor de outra (ou outras) variáveis ​​(características-fatores) for conhecido. Ele inclui as seguintes etapas:

  1. escolha da forma de ligação (tipo de equação de regressão analítica);
  2. estimativa de parâmetros de equações;
  3. avaliação da qualidade da equação de regressão analítica.
Na maioria das vezes, uma forma linear é usada para descrever a relação estatística de recursos. A atenção a uma relação linear é explicada por uma clara interpretação econômica de seus parâmetros, limitada pela variação de variáveis, e pelo fato de que, na maioria dos casos, formas não lineares de uma relação são convertidas (tomando um logaritmo ou mudando variáveis) em uma forma linear para realizar cálculos.
No caso de uma relação linear de pares, a equação de regressão assumirá a forma: y i =a+b·xi +u i . Os parâmetros desta equação aeb são estimados a partir dos dados de observação estatística x e y . O resultado dessa avaliação é a equação: , onde , - estimativas dos parâmetros aeb , - o valor da característica efetiva (variável) obtido pela equação de regressão (valor calculado).

O mais comumente usado para estimativa de parâmetros é método dos mínimos quadrados (LSM).
O método dos mínimos quadrados fornece as melhores estimativas (consistentes, eficientes e imparciais) dos parâmetros da equação de regressão. Mas somente se certas suposições sobre o termo aleatório (u) e a variável independente (x) forem atendidas (ver suposições OLS).

O problema de estimar os parâmetros de uma equação linear de pares pelo método dos mínimos quadrados consiste no seguinte: obter tais estimativas dos parâmetros , , em que a soma dos desvios quadrados dos valores reais do recurso efetivo - y i dos valores calculados - é mínima.
Formalmente critério OLS pode ser escrito assim: .

Classificação dos métodos de mínimos quadrados

  1. Método dos mínimos quadrados.
  2. Método da máxima verossimilhança (para um modelo de regressão linear clássico normal, postula-se a normalidade dos resíduos da regressão).
  3. O método dos mínimos quadrados generalizados do GLSM é usado no caso de autocorrelação de erro e no caso de heterocedasticidade.
  4. Mínimos quadrados ponderados ( caso especial GMS com resíduos heterocedásticos).

Ilustrar a essência o método clássico dos mínimos quadrados graficamente. Para fazer isso, construiremos um gráfico de pontos de acordo com os dados observacionais (x i , y i , i=1;n) em um sistema de coordenadas retangulares (tal gráfico de pontos é chamado de campo de correlação). Vamos tentar encontrar uma linha reta que esteja mais próxima dos pontos do campo de correlação. De acordo com o método dos mínimos quadrados, a linha é escolhida de forma que a soma dos quadrados das distâncias verticais entre os pontos do campo de correlação e esta linha seja mínima.

Notação matemática deste problema: .
Os valores de y i e x i =1...n são conhecidos por nós, são dados observacionais. Na função S eles são constantes. As variáveis ​​nesta função são as estimativas necessárias dos parâmetros - , . Para encontrar o mínimo de uma função de 2 variáveis, é necessário calcular as derivadas parciais dessa função em relação a cada um dos parâmetros e igualá-los a zero, ou seja, .
Como resultado, obtemos um sistema de 2 normais equações lineares:
Resolvendo este sistema, encontramos as estimativas dos parâmetros necessários:

A exatidão do cálculo dos parâmetros da equação de regressão pode ser verificada comparando as somas (alguma discrepância é possível devido ao arredondamento dos cálculos).
Para calcular estimativas de parâmetros, você pode construir a Tabela 1.
O sinal do coeficiente de regressão b indica a direção da relação (se b > 0, a relação é direta, se b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
Formalmente, o valor do parâmetro a é o valor médio de y para x igual a zero. Se o fator de sinal não tiver e não puder ter um valor zero, a interpretação acima do parâmetro a não faz sentido.

Avaliação da rigidez do relacionamento entre os recursos é realizada usando o coeficiente de correlação linear de pares - r x,y . Pode ser calculado através da fórmula: . Além disso, o coeficiente de correlação de par linear pode ser determinado em termos do coeficiente de regressão b: .
A faixa de valores admissíveis do coeficiente linear de correlação de pares é de –1 a +1. O sinal do coeficiente de correlação indica a direção da relação. Se r x, y >0, então a conexão é direta; se r x, y<0, то связь обратная.
Se este coeficiente estiver próximo da unidade em módulo, então a relação entre as feições pode ser interpretada como linear bastante próxima. Se seu módulo for igual a um ê r x , y ê =1, então a relação entre as feições é linear funcional. Se os recursos x e y são linearmente independentes, então r x,y está próximo de 0.
A Tabela 1 também pode ser usada para calcular r x,y.

tabela 1

N observaçõesXIe eux i ∙ y i
1 x 1a 1x 1 a 1
2 x2y2x 2 y 2
...
nx ny nx n s n
Soma da coluna∑x∑y∑x y
Significa
Para avaliar a qualidade da equação de regressão obtida, o coeficiente teórico de determinação é calculado - R 2 yx:

,
onde d 2 é a variância y explicada pela equação de regressão;
e 2 - variância residual (não explicada pela equação de regressão) y ;
s 2 y - variância total (total) y .
O coeficiente de determinação caracteriza a parcela de variação (dispersão) da feição resultante y, explicada pela regressão (e, conseqüentemente, do fator x), na variação total (dispersão) y. O coeficiente de determinação R 2 yx assume valores de 0 a 1. Assim, o valor 1-R 2 yx caracteriza a proporção da variância y causada pela influência de outros fatores não levados em consideração nos erros de modelo e especificação.
Com regressão linear emparelhada R 2 yx =r 2 yx .

Se alguma quantidade física depende de outra quantidade, essa dependência pode ser investigada medindo y em diferentes valores de x. Como resultado das medições, uma série de valores é obtida:

x 1 , x 2 , ..., x i , ... , x n ;

y 1 , y 2 , ..., y i , ... , y n .

Com base nos dados de tal experimento, é possível plotar a dependência y = ƒ(x). A curva resultante permite julgar a forma da função ƒ(x). No entanto, os coeficientes constantes que entram nessa função permanecem desconhecidos. Eles podem ser determinados usando o método dos mínimos quadrados. Os pontos experimentais, via de regra, não ficam exatamente sobre a curva. O método dos mínimos quadrados requer que a soma dos desvios quadrados dos pontos experimentais da curva, ou seja, 2 foi o menor.

Na prática, esse método é mais frequentemente (e mais simples) usado no caso de uma relação linear, ou seja, quando

y=kx ou y = a + bx.

A dependência linear é muito difundida na física. E mesmo quando a dependência não é linear, eles geralmente tentam construir um gráfico de forma a obter uma linha reta. Por exemplo, se for assumido que o índice de refração do vidro n está relacionado ao comprimento de onda λ da onda de luz pela relação n = a + b/λ 2 , então a dependência de n em λ -2 é plotada no gráfico .

Considere a dependência y=kx(linha reta passando pela origem). Vamos compor o valor φ a soma dos desvios quadrados de nossos pontos da linha reta

O valor de φ é sempre positivo e acaba sendo tanto menor quanto mais próximos nossos pontos estiverem da linha reta. O método dos mínimos quadrados afirma que para k deve-se escolher um valor no qual φ tenha um mínimo


ou
(19)

O cálculo mostra que a raiz do erro quadrático médio na determinação do valor de k é igual a

, (20)
onde n é o número de dimensões.

Vamos agora considerar um caso um pouco mais difícil, quando os pontos devem satisfazer a fórmula y = a + bx(uma linha reta que não passa pela origem).

A tarefa é encontrar os melhores valores de a e b do conjunto de valores dado x i , y i .

Novamente compomos uma forma quadrática φ igual à soma dos desvios quadrados dos pontos x i , y i da reta

e encontre os valores a e b para os quais φ tem um mínimo

;

.

.

A solução conjunta dessas equações dá

(21)

A raiz dos erros quadráticos médios da determinação de a e b são iguais

(23)

.  (24)

Ao processar os resultados da medição por este método, é conveniente resumir todos os dados em uma tabela na qual todos os valores incluídos nas fórmulas (19)(24) são calculados preliminarmente. As formas dessas tabelas são mostradas nos exemplos abaixo.

Exemplo 1 A equação básica da dinâmica do movimento rotacional ε = M/J (uma reta passando pela origem) foi estudada. Para vários valores do momento M, foi medida a aceleração angular ε de um determinado corpo. É necessário determinar o momento de inércia deste corpo. Os resultados das medições do momento de força e aceleração angular estão listados na segunda e terceira colunas tabelas 5.

Tabela 5
n M, N m ε, s-1 M2 M ε ε - kM (ε - kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Pela fórmula (19) determinamos:

.

Para determinar a raiz do erro quadrático médio, usamos a fórmula (20)

0.005775kg-1 · m -2 .

Pela fórmula (18) temos

; .

SJ = (2,996 0,005775)/0,3337 = 0,05185 kg m 2.

Dada a confiabilidade P = 0,95 , de acordo com a tabela de coeficientes de Student para n = 5, encontramos t = 2,78 e determinamos o erro absoluto ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m 2.

Escrevemos os resultados na forma:

J = (3,0 ± 0,2) kg m 2;


Exemplo 2 Calculamos o coeficiente de temperatura de resistência do metal usando o método dos mínimos quadrados. A resistência depende da temperatura de acordo com uma lei linear

R t \u003d R 0 (1 + α t °) \u003d R 0 + R 0 α t °.

O termo livre determina a resistência R 0 a uma temperatura de 0 ° C, e o coeficiente angular é o produto do coeficiente de temperatura α e a resistência R 0 .

Os resultados das medições e cálculos são dados na tabela ( ver tabela 6).

Tabela 6
n t °, s r, Ohm t-¯t (t-¯t) 2 (t-¯t)r r-bt-a (r - bt - a) 2,10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Pelas fórmulas (21), (22) determinamos

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ohm.

Vamos encontrar um erro na definição de α. Desde , então pela fórmula (18) temos:

.

Usando as fórmulas (23), (24) temos

;

0.014126 Ohm.

Dada a confiabilidade P = 0,95, de acordo com a tabela de coeficientes de Student para n = 6, encontramos t = 2,57 e determinamos o erro absoluto Δα = 2,57 0,000132 = 0,000338 graus -1.

α = (23 ± 4) 10 -4 saudação-1 em P = 0,95.


Exemplo 3É necessário determinar o raio de curvatura da lente dos anéis de Newton. Os raios dos anéis de Newton r m foram medidos e os números desses anéis m foram determinados. Os raios dos anéis de Newton estão relacionados com o raio de curvatura da lente R e o número do anel pela equação

r 2 m = mλR - 2d 0 R,

onde d 0 a espessura do espaço entre a lente e a placa plana paralela (ou deformação da lente),

λ é o comprimento de onda da luz incidente.

λ = (600 ± 6) nm;
r2m = y;
m = x;
λR = b;
-2d 0 R = a,

então a equação terá a forma y = a + bx.

.

Os resultados das medições e cálculos são inseridos em mesa 7.

Tabela 7
n x = m y \u003d r 2, 10 -2 mm 2 milímetros (m-¯m) 2 (m-¯m)y y-bx-a, 10-4 (y - bx - a) 2, 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –