DETERMINAÇÃO DO TAMANHO DE UMA AMOSTRA COM BASE NA ESTIMATIVA DA MÉDIA POPULACIONAL

Exemplo:

Estimar o atraso médio(RTT) da comunicação entre o computador A e B.
1. Quantos valores (amostras) devemos incluir em nossa amostra?

A determinação do tamanho de uma amostra é problema de grande importância, porque:
1. Amostras desnecessariamente grandes acarretam desperdício de tempo (Tenho que fazer mais simulações e/ experimento);
2. Amostras excessivamente pequenas podem levar a resultados não confiáveis.

Em muitos casos é possível determinar o tamanho mínimo de uma amostra para estimar um parâmetro estatístico, como por exemplo, a MÉDIA POPULACIONAL (µ) .

A fórmula para cálculo do tamanho da amostra para uma estimativa confiável da MÉDIA POPULACIONAL (µ) é dada por:

Equação 1

n=(Zα/2 . σ / E)^2

Onde:

n = Número de indivíduos na amostra (tamanho da amostra)
Zα/2 = Valor da tabela TStudent com grau de confiança desejado (Ex 90% ).
1. Grau de Liberdade (G.L.) = numero de amostras (n) - 1.
σ = Desvio-padrão populacional da variável estudada (no exemplo, RTT).
E = Margem de erro ou ERRO MÁXIMO DE ESTIMATIVA.
1. Identifica a diferença máxima entre a MÉDIA AMOSTRAL ( X ) e a verdadeira MÉDIA POPULACIONAL.

Tabela TStudent

Exemplo 1

Um mestrando deseja estimar o RTT médio para a comunicação entre os computadores A e B.

Quantos valores de RTT médios devem ser medidos, se o mestrando deseja ter 95% de confiança em que a média amostral esteja a menos de 0,01ms da verdadeira média populacional?
Suponha que é conhecido por simulações/testes, que para o RTT, σ = 0,1ms.

σ = Desvio-padrão populacional.
S. = Desvio-padrão calculado dos experimentos.

Solução

Queremos determinar o numero de simulações necessárias n (a simulação gera uma amostra, média).

É pedido que o intervalo de confiança no resultado seja de 95% ⇒ α = 0,05.
É pedido que a média amostral esteja a menos de 0,01ms da verdadeira média populacional ⇒ E = 0,01
σ = 0,1ms. ( Caso não seja conhecido, substitui por S () e calcula-se com as amostras sempre que for usar com novo n)

n=(Zα/2 . σ / E)^2= ( 1,96 . 0,1 / 0,01 ) ˆ2 = 384,16 ==> **385 amostras serão necessárias.**

IMPORTANTE! Como normalmente estamos simulando propostas, NÃO CONHECEMOS o σ. Precisamos usar o desvio padrão calculado das simulações (S) =⇒ calcular o S.

Geramos n0 simulações Ex n0 = 10.
Calculamos o Desvio padrão destes resultados (amostras) que é o S.
usamos na formula o S no lugar do σ que não conhecemos.
Quando tivermos o valor de n, geramos as n simulações e voltamos a calcular o novo S com n simulações desta vez.
Assim teremos o novo n. Se o n for maior devemos complementar o numero de novas simulações (novas sementes) e recalcular o S até que novos cálculos tenham um n menor ou igual ao anterior.

A mesma Solução mas sem conhecer o σ. COM BASE NA ESTIMATIVA DA MÉDIA POPULACIONAL (Mundo da simulação)

Cacular o S.
1. simular e colher o resultado de n0 simulações. Ex n0 = 20.
  1. simular 20 vezes e calcular o desvio padrão dos 20 resultados, Ex S = 0,1ms.
    1. Apesar do valor ser igual ao σ, como não temos como saber disso (na vida real) pois o σ seria calculado com n = ∞.
      1. Para resolver este problema falamos que nosso resultado tem Graus de Liberdade (G.L.) = 20 - 1 = 19.
      2. Procurando na tabela TStudent temos o valor de 2,093 no lugar de 1,96 ( caso n = ∞).
Cacular o n.

n=(Zα/2 . S / E)^2= ( 2,093 . 0,1 / 0,01 ) ˆ2 = 438,06 ==> **439 amostras serão necessárias.**

Veja que aumentou o numero de simulações necessárias devido ao não conhecimento do σ.
1. Nesse caso usamos S calculado.

Observe que se for aceito um Erro maior ex.: E= 0,02

n=(Zα/2 . S / E)^2= ( 2,093 . 0,1 / 0,02 ) ˆ2 = 109,51 ==> **110 amostras serão necessárias. 25,05% do inicial**

Observe que se for aceito um Erro maior ainda ex.: E= 0,03

n=(Zα/2 . S / E)^2= ( 2,093 . 0,1 / 0,03 ) ˆ2 = 48,67 ==> **49 amostras serão necessárias. 11,16 do inicial**

Observe que se for aceito um intervalo de confiança no resultado menor ex.: 90% =⇒ α = 0,10

n=(Zα/2 . S / E)^2= ( 1,729 . 0,1 / 0,01 ) ˆ2 = 298,944 ==> **299 amostras serão necessárias. 68,10% do inicial**

Observe que se for aceito um intervalo de confiança maior ainda ex.: 80% =⇒ α = 0,20

n=(Zα/2 . S / E)^2= ( 1,328 . 0,1 / 0,01 ) ˆ2 = 176,35 ==> **177 amostras serão necessárias. 40,31% do inicial**

Prof. Mauro Fonseca - UTFPR - DAINF

Table of Contents

DETERMINAÇÃO DO TAMANHO DE UMA AMOSTRA COM BASE NA ESTIMATIVA DA MÉDIA POPULACIONAL

Exemplo 1

Solução