Foram encontradas 60 questões.
Sobre o teste qui-quadrado, é correto afirmar:
Provas
Um pesquisador em educação infantil deseja verificar se existe (ou não) associação entre desenvolvimento da fala e o engatinhar (se engatinhou ou não engatinhou) de bebês de uma determinada região. Para isso, ele observou uma amostra de 70 bebês de uma mesma faixa etária e sexo. Na tabela a seguir é apresentado um resumo (frequências absolutas) obtido desse estudo.

Considerando um nível de significância de 10%, o valor aproximado calculado do teste (utilize para os cálculos os valores inteiros aproximados das frequências esperadas), juntamente com a sua conclusão, são, respectivamente:
Provas
Um modelo de regressão linear simples (Yi = a + b Xi + ei, sendo i = 1, 2, ...,33) foi ajustado a uma amostra aleatória de uma determinada população, onde se obteve as seguintes informações referentes à análise de variância desse modelo: (i) a soma de quadrados referente a regressão foi igual a 3 390; e (ii) a soma de quadrados totais foi igual a 3 713. A estimativa não viciada para a variância populacional e a interpretação do coeficiente de determinação desse modelo são, respectivamente:
Provas
No ajuste de qualquer modelo estatístico, uma das principais tarefas do analista é avaliar se as pressuposições assumidas por determinada metodologia são satisfeitas, bem como a qualidade desse ajuste aos dados. Para isso, fazer uma análise de resíduos se torna imprescindível. Há três tipos de violações das suposições que são prontamente detectados por meio do uso de gráficos residuais; são elas: (i) presença de valores discrepantes; (ii) variância do erro heterogênea; e (iii) especificação do modelo inadequada.
Diante disso, o gráfico de valores preditos ( \( \hat{y} \) ) versus resíduos padronizados ( ei ), que indica uma especificação do modelo inadequada para a situação em estudo, é:
Provas
Em relação ao coeficiente de correlação de Pearson populacional e amostral ( ρ e r, respectivamente), é correto afirmar:
Provas
São vários os procedimentos para a busca do “subconjunto ótimo” de variáveis, na ausência da ortogonalidade, para obter uma equação de estimação adequada que relaciona uma variável Y a todas ou a um subconjunto de variáveis independentes. Considere o seguinte procedimento:
PASSO 1: Escolha a variável que fornece a maior soma de quadrados da regressão em regressão linear simples com Y ou, de maneira equivalente, que forneça o maior valor de R2. Chamaremos essa variável inicial de X1.
PASSO 2: Escolha a variável que, quando inserida no modelo, fornece o maior aumento em R2, na presença de X1, sobre o valor de R2 encontrado no passo 1, isto é, a variável Xj para a qual:
R(βj | β1) = R(β1, βj) – R(β1)
é maior. Vamos chamá-la de variável X2. O modelo de regressão com X1 e X2 é, então, ajustado e R2 é observado.
PASSO 3: Escolha a variável Xj que fornece o maior valor de:
R(βj | β1, β2) = R(β1, β2, βj) – R(β1, β2),
resultando novamente em um aumento em R2 sobre aquele dado no PASSO 2. Ao chamar essa variável de X3, agora temos um modelo de regressão que envolve X1, X2 e X3. Esse processo é continuado até que a variável inserida mais recentemente falhe ao produzir um aumento significativo na regressão explicada. Tal aumento pode ser determinado em cada passo, devendo- se usar o teste F (ou t) apropriado.
Por exemplo, no PASSO 2, o valor: f = R(β2 | β1)/s1,2 2 pode ser determinado para testar a adequação de X2 no modelo. De maneira similar, no PASSO 3 a razão: f = R(β3 | β1, β2 )/s1,2,3 2 testa a adequação de X3 no modelo.
Se f < f(1, n - 3; α) no PASSO 2, para um nível de significância preestabelecido, X2 não é incluído e o processo é encerrado, resultando em uma equação linear simples que relaciona Y e X1.
Contudo, se f >f(1, n - 3; α) deve-se seguir para o PASSO 3. Novamente, se f < f(1, n - 4; α) no PASSO 3, X3 não é incluído e o processo é encerrado com a equação de regressão apropriada que contém as variáveis X1 e X2.
Notações utilizadas:
R2 é o coeficiente de determinação do modelo de regressão;
R(.) é a soma dos quadrados do modelo de regressão em questão;
βj é o coeficiente do modelo de regressão que acompanha a variável Xj;
A notação ‘|’ indica a probabilidade condicional;
s1,2 2 é o quadrado do erro médio para o modelo que contém as variáveis X1 e X2;
s1,2,3 2 é o quadrado do erro médio para o modelo que contém as variáveis X1, X2 e X3.
Essa descrição se refere ao método de seleção de variáveis:
Provas
Considere a população de crianças, do sexo masculino, de faixa etária de 6 a 7 anos de uma determinada região. É de desejo realizar o seguinte teste de hipóteses para a proporção (p) de crianças com o índice de massa corpórea (IMC) maior que 30 dessa população (que é normalmente distribuída para essa variável): p = 0,6 contra p > 0,6. Fixando um nível de significância de 5%; considerando pc o um ponto crítico para a tomada de decisão e o estimador \( \hat{p} \) da verdadeira proporção de crianças com o índice de massa corpórea (IMC) maior que 30, p, é correto afirmar que:
Provas
A abordagem do teste de hipóteses para a inferência estatística é muito próxima à abordagem do intervalo de confiança. Essa equivalência se estende às diferenças entre duas médias, variâncias, razão de variâncias e assim por diante. Para o caso de uma única média populacional \( \mu \) com variância \( σ^2 \) conhecida, considerando um nível de significância α e uma amostra aleatória de tamanho n dessa população, é correto afirmar:
Provas
Em uma fábrica de ar-condicionado, nove máquinas do mesmo modelo foram selecionadas aleatoriamente a fim de determinar o efeito da limpeza do filtro de ar no gasto de energia elétrica. Todas as máquinas novas foram instaladas em um mesmo lado de um prédio, e durante dois meses (numa mesma estação do ano) foram ligadas durante o mesmo período por dia, numa mesma temperatura. O gasto médio diário em kW da última semana apresentou um valor de 156. Terminado esse mês, foi realizada a limpeza do filtro de ar de todas as máquinas e, durante mais uma semana, elas foram ligadas nas mesmas condições. No final do último dia, calculou-se o consumo médio, resultando no valor de 140 kW. O desvio-padrão da diferença entre o consumo antes da limpeza menos o consumo depois da limpeza foi de 15 kW. Ao nível de 5%, de significância, foram testadas as hipóteses: de o consumo médio antes ser igual ao consumo médio depois da limpeza das máquinas contra o consumo médio antes ser maior que o consumo médio depois da limpeza. O valor calculado da estatística de teste e sua conclusão para esse teste de hipóteses são, respectivamente:
Provas
Um fabricante de pilhas AAA afirma que a vida útil delastem distribuição aproximadamente normal com média de 0,17 ano e desvio-padrão de 0,3 ano. Uma amostra aleatória de 37 dessas pilhas apresentou um desvio- -padrão de 0,4 ano. Considerando a hipótese alternativa de o desvio-padrão ser maior que 0,3 ano, o resultado do valor da estatística calculada e a conclusão desse teste de hipótese ao nível de significância de 0,05 serão respectivamente:
Provas
Caderno Container