Um levantamento será realizado a respeito de uma população normal N(μ, σ2), em que μ e σ2 são, respectivamente, a média e a variância. Os parâmetros μ e σ2 são desconhecidos. O coordenador do levantamento, sabendo da possibilidade de ocorrência de muitos valores atípicos (outliers) na amostra, contratou um consultor de estatística para auxiliá-lo. Considerando que uma amostra aleatória simples X1, X2,..., Xn será retirada dessa população, o consultor determinou que as três funções aleatórias seguintes são possíveis estimadores para μ.
!$ T_{1(n)}={\large{\sum\limits^{n}_{k=1} X_k\over n}},~T_{2(n)}=\large{(\sqrt{2})\sum\limits^{n}_{k=1} X_{k}w(X_k)\over n} !$ e !$ T_{3(n)}=\large{\sum\limits^{n}_{k=1} X_{k}h(X_k)\over\sum\limits^{n}_{k=1}h(X_k)}, !$
em que w(Xk) = exp{–(Xk – μ)2 / 2σ2}, h(Xk) = exp{–(Xk – T1)2 / 2S2} e S2 é a variância amostral.
Para avaliar a robustez do estimador T3 na presença de dados atípicos, o consultor apresentou um experimento Monte Carlo com 5 mil replicações de amostras com n = 300 para cada uma das situações hipotéticas: N(10, 1), N(10, 10) e N(10, 100). Em seguida, dentro de cada situação, valores atípicos foram adicionados em cada amostra, da seguinte forma:
!$ \begin{cases}~~~~~ Y_{k,d} = X_k,~~~~~~\mathrm{se}~~ 1\le k\le200,\\Y_{k,d} = X_k + 5\sigma_d,~~~~ \mathrm{se}~~k>200, \end{cases} !$
em que σd é o desvio-padrão da distribuição na situação hipotética e d = 1, 2 ou 3. Finalmente, foram obtidas as realizações:
!$ T^*_{1(n)d}={\large{\sum\limits^{300}_{k=1} Y_{k,d}\over 300}} !$ e !$ T^*_{3(n)d}=\large{\sum\limits^{300}_{k=1} Y_{k,d}h(Y_{k,d})\over\sum\limits^{300}_{k=1}h(Y_{k,d})} !$
em que !$ h(Y_{k,d})=\mathsf{exp}\left \{\large{-(Y_{k,d}-T^*_{1(n)d})^2\over2S^2_d} \right \}. \quad !$
A tabela seguinte mostra as estimativas dos erros quadráticos médios (EQM) e das variâncias (VAR) dos estimadores.
| T * 1(n)d | T * 3(n)d | ||||
| d | população | EQM | VAR | EQM | VAR |
| 1 | N(10, 1) | 2,780 | 0,003 | 1,418 | 0,004 |
| 2 | N(10, 10) | 27,812 | 0,034 | 14,216 | 0,043 |
| 3 | N(10, 100) | 278,101 | 0,315 | 141,884 | 0,409 |
Considerando as informações acima, julgue o próximo item.
Considerando a amostra aleatória com presença de observações atípicas Y1,d, Y2,d,..., Y300,d, o viés (ou vício) do estimador !$ T^*_{1(300)d} !$ é igual a !$ \large{5\sigma_d\over3} !$.
Provas
Questão presente nas seguintes provas
Consultor Técnico Legislativo - Estatístico
120 Questões