Foram encontradas 32.247 questões.
Julgue o item a seguir, relacionado aos fundamentos da teoria estatística.
Se X1, X2, ... , Xn é uma sequência de uma variável aleatória com distribuição exponencial de parâmetro β, e, para essa sequência, m(X) é a média e dp(X) é a variância, então, quando n tende ao infinito, \( P \left( \dfrac{m(X) - \beta} {dp(X)} < 2 \right) \) é aproximadamente 97,5%.
Provas
Julgue os itens a seguir, relacionados aos fundamentos da teoria estatística.
Se, em uma amostra aleatória, a covariância entre as variáveis X e Y é 256, e a covariância entre as variáveis X e Z é 1.024, então a variável X é mais correlacionada com Z do que com Y.
Provas
Uma distribuição conjunta das variáveis X e Y é dada pela função de densidade \( f(x,y) = 1 -\dfrac{x}{2} - \dfrac{y}{3} \), em que \( 0 \le x \ge 2,0 \le y \le 2 \) e \( f(x,y)= 0 \). Considerando essas informações, bem comopara os demais pontos, julgue o item a seguir.
X e Y são independentes.
Provas
Uma distribuição conjunta das variáveis \( X \) e \( Y \) é dada pela função de densidade \( f(x,y) = 1 - \dfrac{x}{2} - \dfrac{y}{3} \), em que \( 0 \le x \le 2 \), \( 0 \le y \le 2 \) e \( 3x+2y\le2 \). Considerando essas informações, bem como \( f(x,y) = 0 \) para os demais pontos, julgue os itens a seguir.
\(E[X]>E[Y]\)
Provas
Uma empresa de mineração de ferro está analisando os dados coletados durante suas operações para melhorar os processos de extração e beneficiamento. O conjunto de dados inclui as seguintes variáveis:
- teor_de_ferro: percentual de ferro presente em amostras do minério.
- toneladas_extraidas: quantidade de minério extraída por turno.
Durante o estudo, foi utilizada a técnica de categorização de dados e, mais especificamente, a discretização de dados. Além disso, os conjuntos de dados presentes nas tabelas 22A6-I e 22A6-II, a seguir, serão utilizados como input de algoritmos de aprendizagem de máquina. Na tabela 22A6-I, as variáveis quantidade de minério e profundidade são dadas em toneladas e em metros, respectivamente, e, na tabela 22A6-II, as variáveis temperatura e precipitação são dadas em graus Celsius e em milímetros, respectivamente.
| mina | quantidade de minério | profundidade |
|---|---|---|
| A | 1.500 | 200 |
| B | 4.000 | 350 |
| C | 2.800 | 500 |
| D | 3.600 | 300 |
| E | 1.200 | 150 |
| F | 10.000 | 100 |
| G | 10.000 | 100 |
| H | 10.000 | 100 |
| dia | temperatura | precipitação |
|---|---|---|
| 1 | 20 | 10 |
| 2 | 22 | 12 |
| 3 | 21 | 8 |
| 4 | 19 | 6 |
| 5 | 23 | 5 |
A partir da situação hipotética precedente, julgue os próximos itens.
Para a variável teor_de_ferro, a discretização baseada em intervalos é adequada para classificá-la em categorias como baixo, médio e alto, utilizando faixas predefinidas de percentual de ferro.
Provas
Uma empresa de mineração de ferro está analisando os dados coletados durante suas operações para melhorar os processos de extração e beneficiamento. O conjunto de dados inclui as seguintes variáveis:
- teor_de_ferro: percentual de ferro presente em amostras do minério.
- toneladas_extraidas: quantidade de minério extraída por turno.
Durante o estudo, foi utilizada a técnica de categorização de dados e, mais especificamente, a discretização de dados. Além disso, os conjuntos de dados presentes nas tabelas 22A6-I e 22A6-II, a seguir, serão utilizados como input de algoritmos de aprendizagem de máquina. Na tabela 22A6-I, as variáveis quantidade de minério e profundidade são dadas em toneladas e em metros, respectivamente, e, na tabela 22A6-II, as variáveis temperatura e precipitação são dadas em graus Celsius e em milímetros, respectivamente.
| mina | quantidade de minério | profundidade |
|---|---|---|
| A | 1.500 | 200 |
| B | 4.000 | 350 |
| C | 2.800 | 500 |
| D | 3.600 | 300 |
| E | 1.200 | 150 |
| F | 10.000 | 100 |
| G | 10.000 | 100 |
| H | 10.000 | 100 |
| dia | temperatura | precipitação |
|---|---|---|
| 1 | 20 | 10 |
| 2 | 22 | 12 |
| 3 | 21 | 8 |
| 4 | 19 | 6 |
| 5 | 23 | 5 |
A partir da situação hipotética precedente, julgue os próximos itens.
Quanto à normalização estatística, na tabela 22A6-I, as variáveis quantidade de minério e profundidade devem ser normalizadas. Já na tabela 22A6-II, não há necessidade de se normalizar as variáveis temperatura e precipitação.
Provas
Sobre o uso do Microsoft Excel para criação de planilhas, funções, gráficos e análise de dados, analise as afirmativas a seguir.
I. Permite a criação de gráficos dinâmicos, os quais são atualizados automaticamente quando os dados de origem são alterados, sem a necessidade de redefinir o gráfico.
II. Permite a utilização de funções avançadas de análise de dados, como modelos de regressão, diretamente através do suplemento “Análise de Dados”, sem a necessidade de programação em VBA.
III. Tem a capacidade de trabalhar com grandes volumes de dados utilizando tabelas dinâmicas, mas essas tabelas não podem ser conectadas a fontes de dados externas, como bancos de dados SQL ou planilhas do Google Sheets.
IV. A função SOMASE() permite somar valores que atendem a múltiplos critérios, de forma simultânea e em diferentes intervalos.
Está correto o que se afirma apenas em
Provas
Considerando que a Resolução CNJ nº 462/2022 dispõe sobre a gestão de dados e estatística, cria a Rede de Pesquisas Judiciárias (RPJ) e os Grupos de Pesquisas Judiciárias (GPJ) no âmbito do Poder Judiciário e dá outras providências, assinale a afirmativa INCORRETA.
Provas
- Estatística DescritivaMedidas de Tendência CentralMédiasMédia AritméticaMédia Simples (Não Agrupados)
No software R, o pacote dplyr oferece uma sintaxe intuitiva e ágil para manipulação de dados. Considere que uma base de dados contendo as quatro variáveis listadas a seguir foi armazenada no objeto processos:
• ID: identificador único do processo.
• Status: status do processo (“em andamento”, “finalizado” ou “arquivado”).
• Numero Decisoes: número de decisões ou despachos no processo.
• Data Conclusao: data de conclusão do processo (se o status for “finalizado”), no formato AAAA-MM-DD.
Nesse contexto, considere que um analista deseja calcular a soma total de decisões ou despachos proferidas nos processos “finalizados” para cada ano de conclusão. Qual das alternativa a seguir realiza essa operação corretamente, utilizando funções dplyr, e salva o resultado no objeto Soma_Decisoes?
Provas
No contexto de análises estatísticas, os dados podem estar disponíveis em diferentes tipos de organização. Dependendo da forma de definição e armazenamento, os conjuntos de dados são tipicamente caracterizados como estruturados, semiestruturados e não estruturados. Diante do exposto, analise as afirmativas a seguir.
I. Enquanto dados não estruturados são normalmente armazenados em seu formato nativo (como vídeos, imagens ou documentos de texto), dados estruturados são armazenados em linhas e colunas e podem ser mapeados para campos predefinidos.
II. Ao contrário dos dados estruturados, que podem ser organizados e acessados por meio de bancos de dados relacionais, dados não estruturados não têm um modelo rígido de organização predefinido.
III. Conjuntos de dados semiestruturados usam tags e marcadores (ou seja, metadados) em vez de exigir um esquema predefinido em tabelas, linhas e colunas, como nos dados estruturados.
IV. Os data lakes podem ser projetados para armazenar dados semiestruturados juntamente com dados estruturados, permitindo a coexistência de dados de ambos os tipos.
Está correto o que se afirma em
Provas
Caderno Container