Ao calcular o coeficiente de variação, são usados ​​indicadores.  Parâmetros estatísticos

Ao calcular o coeficiente de variação, são usados ​​indicadores. Parâmetros estatísticos

Variação de recursos determinado por vários fatores, alguns desses fatores podem ser identificados se a população estatística for dividida em grupos de acordo com um determinado atributo. Então, junto com o estudo da variação da característica na população como um todo, é possível estudar a variação para cada um de seus grupos constituintes e entre esses grupos. Em um caso simples, quando a população é dividida em grupos de acordo com um fator, o estudo da variação é feito calculando e analisando três tipos de variâncias: geral, intergrupo e intragrupo.

Coeficiente de determinação empírico

Coeficiente de determinação empírico amplamente utilizado em análise estatística e é um indicador que representa a parcela de dispersão intergrupo na característica resultante e caracteriza a força da influência da característica de agrupamento na formação da variação geral. Pode ser calculado através da fórmula:

Ele mostra a parcela de variação do recurso resultante y sob a influência do recurso do fator x, está associado ao coeficiente de correlação por uma dependência quadrática. Na ausência de uma conexão, o coeficiente de determinação empírico é zero e, no caso de uma conexão funcional, é um.

Por exemplo, quando se estuda a dependência da produtividade do trabalho dos trabalhadores em suas qualificações, o coeficiente de determinação é 0,7, então 70% da variação da produtividade do trabalho dos trabalhadores se deve a diferenças em suas qualificações e 30% se deve à influência de outros fatores.

A correlação empírica é Raiz quadrada do coeficiente de determinação. A relação mostra o aperto da conexão entre o agrupamento e os recursos efetivos. A taxa de correlação empírica assume valores de -1 a 1. Se não houver conexão, a taxa de correlação é zero, ou seja, As médias de todos os grupos são iguais e não há variação intergrupo. Isso significa que o traço de agrupamento não afeta a formação da variação geral.

Se a conexão for funcional, a taxa de correlação será igual a um. Nesse caso, a variância das médias do grupo é igual à variância total, ou seja, nenhuma variação intragrupo. Isso significa que o recurso de agrupamento determina completamente a variação do recurso resultante.

Quanto mais próximo o valor da razão de correlação estiver de um, mais forte e próxima da dependência funcional será a relação entre as características. Para uma avaliação qualitativa da força do relacionamento com base no indicador do coeficiente de correlação empírica, você pode usar a proporção de Chaddock.

Proporção Chaddock

  • A conexão é muito próxima - o coeficiente de correlação está na faixa de 0,9 - 0,99
  • Fechar conexão - Rxy = 0,7 - 0,9
  • A conexão é perceptível - Rxy \u003d 0,5 - 0,7
  • A comunicação é moderada - Rxy = 0,3 - 0,5
  • A conexão é fraca - Rxy = 0,1 - 0,3

Os valores obtidos da experiência inevitavelmente contêm erros devido a vários motivos. Entre eles, devem ser distinguidos erros sistemáticos e aleatórios. Os erros sistemáticos são devidos a causas que agem de maneira muito específica e sempre podem ser eliminadas ou levadas em consideração com precisão suficiente. Erros aleatórios são causados ​​por um número muito grande de causas individuais que não podem ser contabilizadas com precisão e agem de maneira diferente em cada medição individual. Esses erros não podem ser completamente descartados; eles podem ser levados em consideração apenas na média, para a qual é necessário conhecer as leis às quais os erros aleatórios estão sujeitos.

Denotaremos o valor medido por A e o erro aleatório na medição x. Como o erro x pode assumir qualquer valor, é contínuo variável aleatória, que é totalmente caracterizado por sua lei de distribuição.

A realidade mais simples e que reflete com mais precisão (na grande maioria dos casos) é a chamada distribuição normal de erros:

Essa lei de distribuição pode ser obtida a partir de várias premissas teóricas, em particular, da exigência de que o valor mais provável de uma quantidade desconhecida para a qual uma série de valores com o mesmo grau de precisão é obtida por medição direta é a média aritmética de esses valores. O valor 2 é chamado dispersão desta lei normal.

Média

Determinação da dispersão de acordo com dados experimentais. Se para qualquer quantidade A, n valores a i forem obtidos por medição direta com o mesmo grau de precisão, e se os erros na quantidade A estiverem sujeitos à lei de distribuição normal, então o valor mais provável de A será média:

a - média aritmética,

a i - valor medido na i-ésima etapa.

Desvio do valor observado (para cada observação) a i do valor A de média aritmética: a eu - a.

Para determinar a dispersão da distribuição normal de erros neste caso, use a fórmula:

2 - dispersão,
a - média aritmética,
n é o número de medições de parâmetros,

desvio padrão

desvio padrão mostra o desvio absoluto dos valores medidos de média aritmética. De acordo com a fórmula para a medida de precisão de combinação linear raiz do erro quadrático médio a média aritmética é determinada pela fórmula:

, Onde


a - média aritmética,
n é o número de medições de parâmetros,
a i - valor medido na i-ésima etapa.

O coeficiente de variação

O coeficiente de variação caracteriza o grau relativo de desvio dos valores medidos de média aritmética:

, Onde

V - coeficiente de variação,
- desvio padrão,
a - média aritmética.

Quão mais valor coeficiente de variação, quanto maior for a dispersão e menor a uniformidade dos valores estudados. Se um o coeficiente de variação menos de 10%, então a variabilidade série de variação considerado insignificante, de 10% a 20% refere-se a médio, mais de 20% e menos de 33% a significativo, e se o coeficiente de variação excede 33%, isso indica a heterogeneidade das informações e a necessidade de excluir os maiores e menores valores.

Desvio linear médio

Um dos indicadores do alcance e intensidade da variação é desvio linear médio(módulo de desvio médio) da média aritmética. Desvio linear médio calculado pela fórmula:

, Onde

_
a - desvio linear médio,
a - média aritmética,
n é o número de medições de parâmetros,
a i - valor medido na i-ésima etapa.

Para verificar a conformidade dos valores estudados com a lei da distribuição normal, utiliza-se a relação índice de assimetria ao seu erro e atitude indicador de curtose ao erro dele.

índice de assimetria

índice de assimetria(A) e seu erro (m a) é calculado usando as seguintes fórmulas:

, Onde

A - indicador de assimetria,
- desvio padrão,
a - média aritmética,
n é o número de medições de parâmetros,
a i - valor medido na i-ésima etapa.

Indicador de curtose

Indicador de curtose(E) e seu erro (m e) é calculado usando as seguintes fórmulas:

, Onde

A variação é medida usando valores relativos chamados coeficientes de variação e definidos como a razão entre o desvio médio e a média. O coeficiente de variação é utilizado não apenas para avaliação comparativa da variação de unidades populacionais, mas também como característica de homogeneidade populacional. Os valores do coeficiente de variação variam de 0 a 100%, e quanto mais próximo de zero, mais típico é o valor médio encontrado para a população estatística em estudo e, consequentemente, melhor os dados estatísticos são selecionados. O conjunto é considerado quantitativamente homogêneo se o coeficiente de variação não ultrapassar 33% (para distribuições próximas da normal). Existem os seguintes indicadores relativos de variação:

O coeficiente de variação:

onde é o desvio padrão, é a média aritmética.

Coeficiente de variação linear:

onde é o desvio linear médio.

Fator de oscilação:

onde é o intervalo de variação.

Calculamos os coeficientes de variação para um grupo de organizações em termos de volume de negócios de frete de transporte rodoviário (tabela 5.1) usando as fórmulas 5.9, 5.10, 5.11

O coeficiente de variação será igual a: , que ultrapassa 33%, portanto, a população é heterogênea.

Vamos calcular o coeficiente de variação linear: . Consequentemente, a parcela do valor médio dos desvios absolutos das organizações de tamanho médio igual a 30,7%

Encontre o coeficiente de oscilação: . Conclui-se que a diferença entre os valores máximo e mínimo das organizações supera o valor médio em quase 1,078 vezes.

Vamos determinar os coeficientes de variação para agrupar as áreas de instalações residenciais (em média por habitante) (Tabela 5.3).

Vamos calcular o coeficiente de variação usando a fórmula (5.9):

. Isso significa que o coeficiente de variação não ultrapassa 33%, portanto, a população é homogênea.

Vamos calcular o coeficiente de variação linear de acordo com a fórmula (5.10):

. Isso significa que a parcela do valor médio dos desvios absolutos das áreas dos imóveis residenciais em relação ao valor médio é de 5,56%.

Vamos encontrar o coeficiente de oscilação pela fórmula (5.11):

. A diferença entre os valores máximo e mínimo das instalações residenciais não excede o valor médio.

CÁLCULO E CONSTRUÇÃO DAS CARACTERÍSTICAS ESTRUTURAIS DE UMA SÉRIE VARIACIONAL

Um pouco mais sobre o tema

Economia Política de D. Ricardo como Ideólogo da Revolução Industrial
No último terço do século XVIII. A Revolução Industrial começou na Inglaterra. Por várias décadas na indústria leve, uma invenção seguiu a outra. Todo o processo de produção nesta indústria foi transferido para uma base de máquina. Gradualmente, a revolução se espalhou para outros ramos da indústria leve e depois para a indústria pesada. O onipresente p...

Um dos principais indicadores estatísticos da sequência de números é o coeficiente de variação. Para encontrá-lo, cálculos bastante complexos são feitos. Ferramentas Microsoft Excel torná-los muito mais fáceis para o usuário.

Este indicador é a relação entre o desvio padrão e a média aritmética. O resultado obtido é expresso em porcentagem.

No Excel, não existe uma função separada para calcular esse indicador, mas existem fórmulas para calcular o desvio padrão e a média aritmética de uma série de números, ou seja, são usadas para encontrar o coeficiente de variação.

Passo 1: Calcular o Desvio Padrão

O desvio padrão, ou, como é chamado de outra forma, desvio padrão, é a raiz quadrada de . A função é usada para calcular o desvio padrão STDEV. A partir do Excel 2010, ele é dividido dependendo população há um cálculo ou por amostragem, em duas opções distintas: STDEV.G e STDEV.V.

A sintaxe dessas funções se parece com isso:

STDEV(Número1, Número2,…)
= STDEV.G(Número1, Número2,…)
= STDEV.B(Número1, Número2,…)


Passo 2: Calcular a Média Aritmética

A média aritmética é a razão entre a soma total de todos os valores da série numérica e seu número. Para calcular este indicador, também existe uma função separada - MÉDIA. Vamos calcular seu valor em um exemplo específico.


Passo 3: Encontrando o Coeficiente de Variação

Agora temos todos os dados necessários para calcular diretamente o próprio coeficiente de variação.


Assim, calculamos o coeficiente de variação, referente às células em que já foram calculados o desvio padrão e a média aritmética. Mas você pode fazer isso de uma forma um pouco diferente, sem calcular esses valores separadamente.


Há uma distinção condicional. Acredita-se que, se o coeficiente de variação for inferior a 33%, o conjunto de números é homogêneo. Caso contrário, costuma-se caracterizá-lo como heterogêneo.

Como você pode ver, o programa Excel permite simplificar bastante o cálculo de um cálculo estatístico tão complexo quanto a busca pelo coeficiente de variação. Infelizmente, o aplicativo ainda não possui uma função que calcule esse indicador em uma etapa, mas com a ajuda de operadores STDEV e MÉDIA esta tarefa é bastante simplificada. Assim, mesmo uma pessoa que não tem alto nível conhecimentos relacionados com regularidades estatísticas.

CÁLCULO DE INDICADORES DE VARIAÇÃO

TRABALHO PRÁTICO 3

Objetivo: obtenção de competências práticas no cálculo de vários indicadores (medidas) de variação em função das tarefas definidas pelo estudo.

ordem de trabalho:

1. Determinar o tipo e a forma (simples ou ponderada) dos indicadores de variação.

3. Formular conclusões.

1. Determinação do tipo e forma dos indicadores de variação.

Os indicadores de variação são divididos em dois grupos: absolutos e relativos. Os absolutos incluem: a faixa de variação, desvio quartil, desvio linear médio, variância e desvio padrão. Indicadores relativos são coeficientes de oscilação, variações, desvio linear relativo, indicador relativo de variação quartil, etc.

Faixa de variação (R)é a medida mais simples de variação de característica e é determinada pela seguinte fórmula:

Onde - valor mais alto sinal variável;

– o menor valor do recurso variável.

Desvio de quartil (Q)- usado para caracterizar a variação de uma característica no agregado. Pode ser usado em vez da faixa de variação para evitar as desvantagens de usar extremos.

onde e são o primeiro e terceiro quartis da distribuição, respectivamente.

Quartis- são os valores do atributo na série ranqueada de distribuição, escolhidos de forma que 25% das unidades populacionais sejam menores que ; 25% das unidades serão incluídas entre e ; 25% das unidades estarão entre e , e os 25% restantes são superiores a .

Os quartis 1 e 3 são determinados pelas fórmulas:

,

Onde é o limite inferior do intervalo no qual o primeiro quartil está localizado;

- a soma das frequências acumuladas dos intervalos anteriores ao intervalo em que se encontra o primeiro quartil;

- a frequência do intervalo em que o primeiro quartil está localizado.

onde Me é a mediana da série;

,

as convenções são as mesmas que para as quantidades.

Em distribuições simétricas ou moderadamente assimétricas, Q»2/3s. Como o desvio quartil não é afetado pelos desvios de todos os valores do atributo, seu uso deve ser limitado aos casos em que a determinação do desvio padrão é difícil ou impossível.

Desvio linear médio () representa o valor médio dos desvios absolutos das variantes de traço de sua média. Pode ser calculada pela fórmula da média aritmética, tanto não ponderada quanto ponderada, dependendo da ausência ou presença de frequências nas séries de distribuição.



Desvio linear médio não ponderado,

- desvio linear médio ponderado.

variância()– desvios médios quadrados valores individuais sinal de seu valor médio. A variância é calculada usando as fórmulas simples não ponderadas e ponderadas.

- não ponderado,

- pesada.

Desvio padrão)- o indicador de variação mais comum, é a raiz quadrada do valor da variação.

A amplitude de variação, desvio quartil, desvios médios lineares e quadráticos são denominados quantidades, eles têm a dimensão do recurso médio. A variância não tem unidade de medida.

Para efeitos de comparação da volatilidade vários sinais na mesma população ou quando se compara a flutuação de uma mesma característica em várias populações, são calculados indicadores relativos de variação. A base de comparação é a média aritmética. Na maioria das vezes, os indicadores relativos são expressos em porcentagem e caracterizam não apenas uma avaliação comparativa da variação, mas também caracterizam a homogeneidade da população.

Fator de oscilação(intervalo relativo de variação) é calculado pela fórmula:

,

Coeficiente de variação linear(desvio linear relativo):

Indicador relativo de variação quartil:

ou

O coeficiente de variação:

,

O indicador de volatilidade relativa mais comumente usado nas estatísticas é o coeficiente de variação. É usado não apenas para uma avaliação comparativa da variação, mas também como uma característica da homogeneidade da população. Quanto maior o valor do coeficiente de variação, maior a dispersão dos valores do traço em torno da média, maior a heterogeneidade da população. Existe uma escala para determinar o grau de homogeneidade da população, dependendo dos valores do coeficiente de variação (17; C.61).

Para se ter uma ideia aproximada da forma da distribuição, são construídos gráficos de distribuição (um polígono e um histograma).

Na prática da pesquisa estatística, é preciso encontrar uma variedade de distribuições. Ao estudar populações homogêneas, lidamos, via de regra, com distribuições unimodais. Multivértice indica a heterogeneidade da população estudada, o aparecimento de dois ou mais vértices indica a necessidade de reagrupar os dados a fim de identificar grupos mais homogêneos. Conhecer a generalidade da distribuição envolve avaliar o grau de sua homogeneidade, bem como calcular os indicadores de assimetria e curtose. simétricoé uma distribuição na qual as frequências de quaisquer duas variantes igualmente espaçadas em ambos os lados do centro de distribuição são iguais. Para distribuições simétricas, a média aritmética, moda e mediana são iguais. Por esta razão, a medida mais simples assimetrias com base na proporção de indicadores do centro de distribuição: do que mais diferença entre as médias, maior a assimetria da série.

Para caracterizar a assimetria na parte central da distribuição, ou seja, o volume das unidades, ou para análise comparativa o grau de assimetria de várias distribuições calcule o indicador relativo da assimetria de K. Pearson:

O valor As pode ser positivo ou negativo. Um valor positivo do indicador indica a presença de assimetria do lado direito (o ramo direito é mais estendido em relação à ordenada máxima do que o esquerdo). Com assimetria do lado direito, existe uma relação entre os indicadores do centro de distribuição: . O sinal negativo do índice de assimetria indica a presença de assimetria do lado esquerdo (fig. 1). Neste caso, existe uma relação entre os indicadores do centro de distribuição: .



Arroz. 1. Distribuição:

1 - com assimetria do lado esquerdo; 2 - com assimetria à direita.

Outro indicador, proposto pelo matemático sueco Lindberg, é calculado pela fórmula:

onde P é a porcentagem desses valores de característica que excedem a média aritmética em valor.

O mais preciso e comum é o indicador baseado na determinação do momento central de terceira ordem (em uma distribuição simétrica, seu valor é zero):

onde é o momento central de terceira ordem:

σ é o desvio padrão.

A utilização deste indicador permite não só determinar o grau de assimetria, mas também responder à questão da presença ou ausência de assimetria na distribuição de uma característica na população em geral. Uma avaliação do grau de significância desse indicador é dada usando o erro quadrático médio, que depende do volume de observações n e é calculado pela fórmula:

.

Se a razão for , a assimetria é significativa e a distribuição da característica na população geral não é simétrica. Se a relação , a assimetria for insignificante, sua presença pode ser explicada pela influência de várias circunstâncias aleatórias.

Para distribuições simétricas, o indicador é calculado curtose(pontudo). Lindberg propôs o seguinte indicador para avaliar a curtose:

,

onde P é a proporção (%) do número de opções que estão no intervalo igual à metade do desvio padrão em uma direção ou outra da média aritmética.

O mais preciso é o indicador que usa o momento central de quarta ordem:

onde é o momento central do quarto momento;

- para dados não agrupados;

- para dados agrupados.

A Figura 2 mostra duas distribuições: uma é pontiaguda (o valor de curtose é positivo), a segunda é achatada (o valor de curtose é negativo). Curtose é uma queda do topo da distribuição empírica para cima ou para baixo do topo da curva de distribuição normal. Em uma distribuição normal, a razão .



Arroz. 2. Distribuição:

1.4 - normais; 2 - pontudo; 3 - topo plano

A raiz do erro quadrático médio da curtose é calculada pela fórmula:

,

onde n é o número de observações.

Se , então a curtose é significativa; se , então é insignificante.

Uma avaliação da significância dos indicadores de assimetria e curtose permite concluir se este estudo empírico pode ser atribuído ao tipo de curvas de distribuição normal.

2. Considere o método de cálculo dos indicadores de variação.