Foram encontradas 338 questões.
Uma biblioteca está classificando os seus frequentadores em grupos literários para facilitar a aquisição e a organização dos livros. Isso foi feito aplicando o algoritmo KNN ao banco de dados de usuários da biblioteca, incluindo alguns dos campos de informação como atributos, tais como idade e nível de formação acadêmica. Em um experimento, uma segunda classificação foi feita usando um conjunto maior de atributos, incluindo ambos de maior ou menor relevância percebida com relação aos grupos definidos.
A segunda classificação tende a ser:
Provas
Em um trabalho de pesquisa, as idades das pessoas são: 23, 27, 32, 33, 34, 35, 36, 38, 42, 56 e 58. Deseja-se construir um boxplot similar ao gráfico a seguir.

No boxplot acima, os valores das estatísticas nas posições indicadas pelas letras A, B, C, D, E e F são:
Provas
Uma prefeitura recebeu uma denúncia de que o número de autuações feitas pela equipe de fiscalização variava conforme o dia da semana. Para verificar a procedência da denúncia, as autuações foram agregadas por dia de semana, como mostra a tabela a seguir.
| Segundas Terças Quartas Quintas Sextas Sábados Domingos | 6 12 9 8 15 13 7 |
Realizando um teste estatístico adequado para verificar se essas autuações ocorrem com a mesma frequência, teremos:
Provas
- Estatística InferencialEstimadoresDistribuição Amostral dos EstimadoresDistribuição Amostral da Proporção
Uma empresa recebeu um lote muito grande, milhões de peças de refugo, e deseja saber quantas peças deverá examinar para estimar a proporção de itens defeituosos, de modo que o erro de estimação seja no máximo 2%. Será empregada uma seleção aleatória de itens onde cada um será classificado como defeituoso ou não defeituoso. Deseja-se extrair uma amostra aleatória de tamanho !$ n !$.
Tendo como padrão um grau de confiança de 95%, o tamanho da amostra necessário para garantir o processo é:
Provas
Em um processo de descontaminação é importante manter um controle da variabilidade da contaminação residual que persiste após o processo. Sabe-se que a mensuração do resíduo tem distribuição normal, e que a partir de uma amostra aleatória, de 21 unidades, foi calculada a variância S2 = 54,25. Para estabelecer uma medida máxima de referência, decidiu-se utilizar o intervalo de confiança superior para o desvio padrão.
O valor desse limite a 95% de confiança é:
Provas
Abaixo temos o gráfico quantil-quantil para distribuição normal onde estão desenhados os valores de duas amostras da distribuição Normal. A amostra 1, representada por círculos, e a amostra 2, representada por “x”.

Com base no gráfico, é correto afirmar que as duas distribuições têm:
Provas
Na avaliação de um modelo para detecção de fraude, foi utilizado um conjunto de dados conhecido que resultou na matriz de confusão abaixo.
| Predito | ||
| Modelo | Fraude | Não Fraude |
| Fraude | 4 | 96 |
| Não Fraude | 1 | 9999 |
É correto afirmar que o modelo apresenta:
Provas
Uma sociedade empresária precisa decidir sobre o uso de 3 algoritmos distintos em uma tarefa específica. Então, fez um experimento onde aplicou cada um dos algoritmos de forma aleatória em um conjunto de tarefas similares, medindo sua performance. Os resultados estão na tabela a seguir:
| Repetições |
| !$ \begin{matrix} \text{modelo} \quad \quad & \quad \text{ X1} \quad & \quad \text{X2} \quad & \text{X3} \quad & \text{total} \quad \end{matrix} !$ |
| !$ \begin{matrix} \text{algoritmo_1} \quad & \quad 4 \quad & \quad 5 \quad & \quad 3 \quad & \quad 12 \quad \\ \text{algoritmo_2} \quad & \quad 6 \quad & \quad 5 \quad & \quad 4 \quad & \quad 15 \quad \\ \text{algoritmo_3} \quad & \quad 4 \quad & \quad 7 \quad & \quad 5 \quad & \quad 16 \quad \end{matrix} !$ |
Se a performance é representada por !$ Y !$ e sabendo-se que
!$ \textstyle \sum_{i=1}^3 \ \textstyle \sum_{j=1}^3 \ y_{ij} = y_{..} = 43 !$,
!$ \textstyle \sum_{i=1}^3 \textstyle \sum_{j=1}^3 \ y^2_{ij} = 217 !$,
!$ \textstyle \sum_{i=1}^3 \ {y^2_{i.} \over n} = 208,33 !$
os demais pressupostos inferenciais são atendidos, deseja-se saber se há evidências estatísticas que ao menos um algoritmo tenha performance diferente dos demais.
Considerando o ponto crítico da distribuição F(2,6) = 5,14, ao nível de significância !$ a !$ = 0,05, conclui-se que:
Provas
Seja !$ x !$ uma amostra aleatória de tamanho 12. Foram então geradas 10 amostras aleatórias com reposição de tamanho 12 de !$ x !$ e para cada uma delas foi calculada a mediana gerando os seguintes valores: 3, 4, 4, 4 ,4, 5, 5 ,6 ,7 e 8.
A estimativa do erro padrão da mediana amostral é, aproximadamente:
Provas
Considere um processo onde é observada uma variável aleatória X que tem distribuição Normal com média 4 e desvio padrão 2. Após uma modificação no processo, os valores se alteraram e a nova variável é Y = 2X + 4.
É correto afirmar que Y tem distribuição Normal com:
Provas
Caderno Container