Magna Concursos

Foram encontradas 656 questões.

3076547 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

A paralelização em rotinas de ciência de dados traz benefícios importantes, especialmente quando é necessário tratar uma grande quantidade de dados.

O principal motivador para paralelizar uma rotina é

 

Provas

Questão presente nas seguintes provas
3076546 Ano: 2024
Disciplina: TI - Desenvolvimento de Sistemas
Banca: CESGRANRIO
Orgão: IPEA

Em Python 3, existem várias formas de se imprimir um número float com um formato específico. Por exemplo, para imprimir o número 12.45667 aproximado para 1 casa decimal, isto é, como 12.5, é possível usar a formatação no estilo da linguagem C, como em

print("%.1f" % 12.45667)

Outra forma correta de, em Python, imprimir o número 12.45667 exatamente como 12.5 é

 

Provas

Questão presente nas seguintes provas
3076545 Ano: 2024
Disciplina: TI - Desenvolvimento de Sistemas
Banca: CESGRANRIO
Orgão: IPEA

Fazendo seu primeiro programa na linguagem Scala, um programador experiente em Python criou o seguinte código:

object SumProgram {
  def main(args: Array[String]): Unit = {
    val a = 5
    val b = 10
    val result = sum(a, b)
  
    println(s"A soma de $a e $b é: $result")
  }

  def sum(a: Int, b: Int): Int = {
    return a + b
  }
}

De acordo com a especificação de Scala, a palavra-chave return, nesse caso, é

 

Provas

Questão presente nas seguintes provas
3076544 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Considere um conjunto de dados estruturados composto por colunas, que refletem as características desses dados, e por linhas, que combinam essas características.

No tratamento desses dados, o processo de enriquecimento consiste em

 

Provas

Questão presente nas seguintes provas
3076543 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Considere o seguinte texto sobre integração de dados.

Como viabilizar o compartilhamento efetivo de dados e informações das cadeias agropecuárias entre instituições de governo e dessas com a sociedade? Esta foi a principal questão que os participantes do 1º Painel de Cadeias Agropecuárias e Dados Abertos buscaram responder na tarde de quinta-feira (2/12), durante webinar realizado pelo Instituto de Pesquisa Econômica Aplicada (Ipea).

Disponível em: https://www.ipea.gov.br/portal/categorias/45-todas- as-noticias/noticias/11394-especialistas-debatem-abertura- -e-integracao-de-dados-de-cadeias-agropecuarias?highlight= WyJhYmFzdGVjaW1lbnRvIiwiYWd1YSIsIidcdTAwZTFndWEiLCJhZ3VhJywiXQ==. Acesso em: 5 jan. 2024.

Considerando-se o questionamento apresentado no texto e sabendo-se que, quando da integração de conjuntos de dados de múltiplas fontes, matching é uma questão relevante, o problema de identificação de entidades em múltiplas fontes de dados remete ao desafio de

 

Provas

Questão presente nas seguintes provas
3076542 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Outliers são pontos ou observações em um conjunto de dados que diferem significativamente da maioria dos demais outros pontos. Eles podem ser resultados de variações na medição, erros de entrada de dados ou, ainda, podem indicar uma variação genuína da fonte de coleta.

Em preparação para análise de um conjunto de dados, o tratamento de outliers

 

Provas

Questão presente nas seguintes provas
3076541 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Em um estudo de saúde pública, um pesquisador está analisando um conjunto de dados que inclui informações sobre idade, peso, altura e nível de atividade física dos participantes, no entanto ele percebe que alguns dados referentes ao peso estão ausentes.

Considerando-se a necessidade de manter a precisão e a confiabilidade do estudo, qual das seguintes abordagens seria a mais apropriada para tratar esses dados ausentes sobre o peso dos participantes?

 

Provas

Questão presente nas seguintes provas
3076540 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Considere um conjunto de dados que inclui as variáveis idade, altura e peso. Os dados de idade estão entre 0 e 100 anos, os dados de altura estão entre 1,50 e 2,00 metros e os dados de peso estão entre 50 e 100 kg.

Qual das seguintes técnicas de normalização numérica é mais adequada para esse conjunto de dados?

 

Provas

Questão presente nas seguintes provas
3076539 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

A deduplicação de dados é uma técnica importante no gerenciamento de informações, especialmente em ambientes onde grandes volumes de dados são gerados e armazenados. Essa técnica é necessária em ambientes onde grandes volumes de dados são gerados porque pode ajudar a reduzir o consumo de armazenamento e a aumentar a eficiência dos processos de análise de dados.

A deduplicação de dados é útil, por exemplo, no domínio da medicina, em que há grandes conjuntos de dados genômicos que são analisados para identificar padrões e mutações associadas a doenças específicas. Nesse cenário, a deduplicação é vital para assegurar a precisão das análises, pois, se amostras de DNA de um mesmo paciente são coletadas e sequenciadas em diferentes momentos e locais, pode haver uma repetição inadvertida dessas amostras no banco de dados. Nesse contexto, a deduplicação de dados é crucial para a integridade da pesquisa, pois dados duplicados podem levar a interpretações errôneas, como a superestimação da prevalência de uma mutação genética rara.,

A técnica de deduplicação de dados consiste em um processo de

 

Provas

Questão presente nas seguintes provas
3076538 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

A partir de dados da pesquisa Perfil do Processado e Produção de Provas nas Ações Criminais por Tráfico de Drogas, realizada em dezembro de 2023 pelo Instituto de Pesquisa Econômica Aplicada (Ipea), é possível levantar informações sociodemográficas sobre os bairros em que o direito à inviolabilidade domiciliar é relativizado. Os resultados revelam que os bairros mais ricos e aqueles de população predominantemente branca são praticamente imunes às entradas em domicílio, as quais se concentram substancialmente nos bairros mais pobres e naqueles com população predominantemente negra ou minoritariamente branca.

Qual técnica de desidentificação de dados sensíveis é a mais adequada para preservar a privacidade dos indivíduos processados, permitindo, ainda, a análise sociodemográfica dos bairros?

 

Provas

Questão presente nas seguintes provas