Foram encontradas 656 questões.
Em processamento de linguagem natural, o modelo Skip-Gram é uma técnica popular para treinar word embeddings.
O treinamento do modelo Skip-Gram destaca-se de outras técnicas, como o Continuous Bag of Words (CBOW), por ter a seguinte característica:
Provas
Um pesquisador iniciante em aprendizado de máquina trabalhava com um modelo de classificação binário com as duas classes equilibradas. Inicialmente, ele fez a avaliação de seu modelo, separando 20% dos dados disponíveis para a avaliação, e o treinou com 80% dos dados, fazendo o processo apenas uma vez. Depois, a pedido de seu chefe, ele trocou a forma de avaliação, separando o conjunto de dados em 10 partes e escolhendo, em 10 rodadas, uma parte diferente para avaliação e as outras para treinamento.
Essas duas formas de avaliar um modelo são conhecidas, respectivamente, como
Provas
Na avaliação de um modelo criado por aprendizado de máquina em um experimento que buscava identificar textos de opinião sobre o desempenho da economia, separando- os dos que não forneciam opinião alguma, só fatos e dados, foi encontrada a seguinte matriz de confusão:
| Opinião |
Não Opinião |
|
|
Opinião |
440 | 60 |
|
Não Opinião |
20 | 480 |
Considerando-se que, nessa matriz, as linhas indicam a resposta correta e as colunas indicam a previsão, a acurácia é de
Provas
Ao criar um índice para um corpus de notícias políticas, um pesquisador decidiu usar o modelo vetorial com a medida TF-IDF.
Descobriu, porém, que essa medida pode ser calculada de várias formas, com a característica comum de calcular o peso de cada termo a partir da ideia de que esse termo
Provas
- Estatística InferencialFunções Densidade de ProbabilidadeFunção Densidade de Probabilidade (Avançado)
Uma pesquisa recente estudou a distribuição de renda familiar per capita, em salários mínimos (s.m.), de duas comunidades, Alfa e Beta, com, aproximadamente, o mesmo número de habitantes. Considerando-se e a base dos logaritmos naturais ou neperianos, na comunidade Alfa, verificou-se que tal renda pode ser bem aproximada por uma variável aleatória contínua (v.a.c.) X com função densidade de probabilidade (f.d.p.) da forma f(X = x) = r ex, 0 !$ \le !$ x !$ \le !$ 1 s.m.; já para a comunidade Beta, constatou- -se que a renda em estudo seguia aproximadamente a distribuição de uma variável aleatória contínua (v.a.c.) Y com função densidade de probabilidade (f.d.p.) da forma g(Y = y) = s y ey, 0 !$ \le !$ y !$ \le !$ 1 s.m.
Um técnico deve decidir por apenas uma das duas comunidades para receber um programa assistencial, qual seja, aquela que possua o maior número de habitantes com renda familiar per capita até meio salário mínimo. Nesses termos, o técnico deverá optar pela comunidade:
Dado: !$ \sqrt{e}\approx 1,645 !$
Provas
O Quadro abaixo fornece informações sobre o índice de vendas no varejo por estado em agosto de 2023.
|
Estado |
AC | AL | AM | AP | BA | CE | DF | ES |
GO |
|
2023.08 |
106,13 | 101,87 | 105,07 | 101,42 | 104,39 | 108,94 | 100,46 | 105,30 |
102,22 |
|
Estado |
MA | MG | MT | MS | PA | PB | PE | PI |
PR |
|
2023.08 |
118,16 | 106,14 | 104,23 | 103,77 | 105,21 | 88,22 | 100,77 | 103,18 |
102,57 |
|
Estado |
RJ | RN | RO | RR | RS | SC | SE | SP |
TO |
|
2023.08 |
100,04 | 100,37 | 98,45 | 103,15 | 103,34 | 101,80 | 102,25 | 99,03 |
113,00 |
Um analista de dados resolveu verificar se há presença de outliers nesse conjunto de índices e decidiu fazer isso por meio de um Box Plot dos dados fornecidos.
Com base na técnica escolhida pelo analista, quantos índices podem ser enquadrados como outliers?
Provas
Considere que o salário médio de empregados de um determinado setor de serviços do Brasil é R$ 2.300,00, com um desvio padrão conhecido de R$ 400,00. Uma empresa desse setor é selecionada ao acaso, e dela é selecionada uma amostra de 36 funcionários, resultando em um salário médio de R$ 2.500,00. Um pesquisador decide realizar um teste de hipótese unilateral com um nível de confiança de 95% para verificar se a empresa selecionada paga salários médios maiores do que a média do setor.
Considere o extrato da Tabela a seguir.
|
Tabela da Distribuição Normal Padrão |
||||||||||
| z | 0,0 | 0,01 | 0,02 | 0,03 | 0,04 | 0,05 | 0,06 | 0,07 | 0,08 |
0,09 |
|
0,0 |
0,5000 | 0,5040 | 0,5080 | 0,5120 | 0,5160 | 0,5199 | 0,5239 | 0,5279 | 0,5319 |
0,5359 |
|
0,1 |
0,5398 | 0,5438 | 0,5478 | 0,5517 | 0,5557 | 0,5596 | 0,5636 | 0,5675 | 0,5714 |
0,5753 |
|
0,2 |
0,5793 | 0,5832 | 0,5871 | 0,5910 | 0,5948 | 0,5987 | 0,6026 | 0,6064 | 0,6103 |
0,6141 |
|
... |
||||||||||
|
2,7 |
0,9965 | 0,9966 | 0,9967 | 0,9968 | 0,9969 | 0,9970 | 0,9971 | 0,9972 | 0,9973 |
0,9974 |
|
2,8 |
0,9974 | 0,9975 | 0,9976 | 0,9977 | 0,9977 | 0,9978 | 0,9979 | 0,9979 | 0,9980 |
0,9981 |
|
2,9 |
0,9981 | 0,9982 | 0,9982 | 0,9983 | 0,9984 | 0,9984 | 0,9985 | 0,9985 | 0,9986 |
0,9986 |
|
3,0 |
0,9987 | 0,9987 | 0,9987 | 0,9988 | 0,9988 | 0,9989 | 0,9989 | 0,9989 | 0,9990 |
0,9990 |
|
3,1 |
0,9990 | 0,9991 | 0,9991 | 0,9991 | 0,9992 | 0,9992 | 0,9992 | 0,9992 | 0,9993 |
0,9993 |
|
3,2 |
0,9993 | 0,9993 | 0,9994 | 0,9994 | 0,9994 | 0,9994 | 0,9994 | 0,9995 | 0,9995 |
0,9995 |
Qual o valor-p do teste aplicado pelo pesquisador?
Provas
Até o Censo de 2010, a região Norte ainda possuía mais homens do que mulheres, mas, segundo os dados do Censo 2022, divulgados em outubro de 2023 pelo IBGE, as mulheres já são a maioria em todas as regiões do Brasil.
A matéria a seguir mostra os municípios do Brasil com maior proporção de mulheres em relação a homens.
Santos (SP) tem o maior percentual de mulheres no Brasil; veja lista
Santos, no litoral paulista, é a cidade brasileira com a maior proporção de mulheres em relação a homens, segundo dados do Censo 2022 divulgados hoje pelo IBGE.
A cidade paulista lidera o ranking de municípios com mais mulheres, com uma proporção de 54,68%.
1. Santos (SP) - 54,68%
2. Salvador (BA) - 54,49%
3. São Caetano do Sul (SP) - 54,32%
4. Niterói (RJ) - 54,19%
5. Aracaju (SE) - 54,11%
Disponível em: https://noticias.uol.com.br/cotidiano/ultimas-noticias/2023/10/27/santos-ibge-censo-2022-cidades-com-mais-mulheres.htm.
Acesso em: 11 jan. 2024. Adaptado.
Suponha que a Prefeitura de Santos, cidade brasileira com o maior percentual de mulheres, de aproximadamente 55%, realize um sorteio de 4 habitantes que cadastraram suas notas fiscais num aplicativo do município. Considere, ainda, que cada munícipe efetue tais cadastramentos de forma independente dos demais habitantes.
A probabilidade de que o número de mulheres sorteadas seja maior que o de homens sorteados é de aproximadamente:
Provas
Um técnico, a fim de monitorar a mobilidade social de renda em uma região geográfica, criou um modelo agrupando as tradicionais classes sociais A, B, C, D e E em três extratos:
Classes A e B: Alta renda
Classe C: Média renda
Classes D e E: Baixa renda
A partir de uma extensa pesquisa, verificou que as probabilidades de um indivíduo transitar de um extrato para outro ou
permanecer no mesmo extrato dependiam apenas de seu extrato atual e permaneciam constantes ao longo do tempo.
Levantou, assim, para cada extrato, as seguintes probabilidades de permanência ou mudança de extrato, após o período de tempo de um ano:
Alta renda
Permanência: 80%
Mudança para média renda: 10%
Mudança para baixa renda: 10%
Média renda
Permanência: 60%
Mudança para alta renda: 20%
Mudança para baixa renda: 20%
Baixa renda
Permanência: 70%
Mudança para alta renda: 10%
Mudança para média renda: 20%
A probabilidade de um indivíduo, inicialmente de média renda, ter mobilidade social de renda (ascenso ou descenso), terminando num extrato diferente do inicial, após um período de 2 anos é de
Provas
Ao fim do ano de 2022, 21 instituições financeiras fizeram estimativas para o Ibovespa, principal índice de ações da bolsa brasileira (B3), mostradas na notícia do Jornal Valor Econômico de 22/12/2022, que também apresenta a média aritmética e a mediana dos dados.

Disponível em: https://valor.globo.com/financas/noticia/2022/12/22/previsao-para-a-bolsa-e-de-alta-em-20233.ghtml. Acesso em: 29 dez. 2023. Adaptado.
No último pregão do ano de 2023, o Ibovespa fechou em 134.185,23 pontos, conforme dados da B3.
Considerando-se os dados apresentados, a medida de posição das estimativas das instituições financeiras que mais se aproximou do resultado real, apresentado pelo Ibovespa no último pregão do ano, foi a:
Provas
Caderno Container