Questões do Concurso IPEA - CESGRANRIO

3076537 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAplicaçõesPLN: Processamento de Linguagem Natural

Algoritmos fuzzy matching em processamento de linguagem natural são métodos que permitem encontrar correspondências aproximadas entre strings, ou seja, sequências de caracteres, como palavras ou frases. Esses algoritmos são úteis para lidar com situações, tais como erros de digitação, variações ortográficas, sinônimos, abreviações. Eles também podem ser aplicados para comparar textos, extrair informações, classificar sentimentos, entre outras finalidades. Existem diferentes tipos de algoritmos fuzzy matching, como a Similaridade de Jaccard, que mede a proporção de elementos comuns entre dois conjuntos de strings.

Qual das palavras a seguir apresenta o maior valor da similaridade de Jaccard, quando comparada com a palavra “computador”?

Provas

Questão presente nas seguintes provas

3076536 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

Governança de DadosQualidade de Dados

A limpeza de dados, data cleansing, é uma tarefa importante que pode ser complexa e demorada, no entanto é um investimento fundamental que pode melhorar a qualidade e a utilidade dos dados para futuras análises.

Seja um conjunto de dados com informações de saúde referentes a uma população. Pode-se limpar esses dados para identificar e tratar valores extremos, discrepantes, contraditórios ou inválidos. Com isso, há maior confiabilidade para estimar a prevalência, a incidência, a mortalidade e os fatores de risco de uma doença naquela população representada por aqueles dados.

Por exemplo, seja o conjunto de dados abaixo referente a uma amostra de 5 indivíduos em uma mesma cidade, na qual um analista percebeu a necessidade de limpeza de dados por conta de potenciais inconsistências

Indivíduo 1: Sexo: Feminino; Idade: 8 anos; Altura: 1,15m; Peso: 40kg; Batimento Cardíaco em Repouso: 85 bpm

Indivíduo 2: Sexo: Masculino; Idade: 22 anos; Altura: 1,60m; Peso: 60kg; Batimento Cardíaco em Repouso: 72 bpm

Indivíduo 3: Sexo: Feminino; Idade: 40 anos; Altura: 1,60m; Peso: 55kg; Batimento Cardíaco em Repouso: 10 bpm

Indivíduo 4: Sexo: Masculino; Idade: 55 anos; Altura: 1,90m; Peso: 100kg; Batimento Cardíaco em Repouso: 70 bpm

Indivíduo 5: Sexo: Feminino; Idade: 70 anos; Altura: 1,50m; Peso: 60kg; Batimento Cardíaco em Repouso: 70 bpm

Qual ação é a única claramente necessária para realizar data cleansing neste conjunto de dados específico?

A

Corrigir o valor da altura no indivíduo 1, pois parece anormalmente alto.

B

Verificar o peso no indivíduo 2, pois nessa idade e altura deveria ser um valor maior.

C

Confirmar o valor do batimento cardíaco no indivíduo 3, que parece anormalmente baixo.

D

Alterar o peso no indivíduo 4, pois não condiz com os valores de sexo, idade e altura indicados.

E

Modificar o valor da altura do indivíduo 5, pois é anormalmente baixo para a idade e sexo.

Provas

Questão presente nas seguintes provas

3076535 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

Análise de DadosTécnicas de Pré-processamentoDiscretização

Um cientista de dados precisa discretizar uma variável, representando distâncias entre cidades em quilômetros em 10 intervalos com, aproximadamente, o mesmo número de observações.

Nesse contexto, a técnica mais adequada é a discretização

Provas

Questão presente nas seguintes provas

3076534 Ano: 2024
Disciplina: TI - Banco de Dados
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

SQLDMLSELECTGROUP BY e HAVING

Para a avaliação de políticas públicas na área de Segurança Alimentar e Nutricional, um município brasileiro utilizou dados persistidos em três relações (tabelas) organizadas de acordo com o seguinte modelo relacional:

PRODUTO (cod-produto, nome-produto, grupo-alimentar)
FORNECEDOR (CNPJ, nome-empresa, tipo)
COMPRADO (CNPJ, cod-produto, data, quantidade, valor)

Os atributos que formam as chaves primárias de cada tabela estão sublinhados.

Nesse contexto, considere o comando SQL apresentado a seguir.

SELECT P.cod-produto, SUM (quantidade)
FROM PRODUTO P, FORNECEDOR F, COMPRADO C
WHERE P.cod-produto = C.cod-produto
AND C.CNPJ = F.CNPJ
AND F.tipo = 'agricultura familiar'
GROUP BY P.cod-produto
HAVING SUM (quantidade) > 10000

Os resultados produzidos pela execução desse comando apresentam o código do produto e a soma das quantidades compradas dos produtos de

Provas

Questão presente nas seguintes provas

3076533 Ano: 2024
Disciplina: TI - Banco de Dados
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

Banco de Dados RelacionalÁlgebra Relacional

Para um estudo do tema Educação, foram coletados dados de escolas e de professores em todos os municípios brasileiros.

Esses dados foram armazenados em duas relações (tabelas), organizadas de acordo com o seguinte modelo relacional:

ESCOLA (cod-escola, nome-escola, cod-municipio, quantidade-alunos)
PROFESSOR (CPF, nome-prof, data-nascimento, cod-municipio-residencia, cod-escola-prof)

A chave primária de ESCOLA é cod-escola, e a de PROFESSOR é CPF. A coluna cod-escola-prof em PROFESSOR é uma chave estrangeira e indica em que escola o professor leciona. Considere a utilização dos operadores de Projeção (p ou PROJETE), Seleção (σ ou SELECIONE) e Junção ( ou JUNTE) da Álgebra Relacional.

Que sequência de operações, em Álgebra Relacional, produz como resultado uma relação R-X com CPF e nome dos professores que NÃO residem no mesmo município onde lecionam?

A

R-X ← SELECIONE CPF, nome-prof de PROFESSOR onde cod-municipio-residencia é diferente de cod-municipio

B

R-A ← JUNTE PROFESSOR a ESCOLA onde cod-municipio-residencia é diferente de cod-municipio
R-X ← PROJETE CPF, nome-prof de R-A

C

R-A ← SELECIONE CPF, nome-prof de PROFESSOR
R-X ← JUNTE R-A a ESCOLA onde cod-escola-prof = cod-escola

D

R-A ← JUNTE PROFESSOR a ESCOLA onde cod-escola-prof = cod-escola
R-B ← SELECIONE R-A onde cod-municipio-residencia é diferente de cod-municipio
R-X ← PROJETE CPF, nome-prof de R-B

E

R-A ← PROJETE CPF, nome-prof de PROFESSOR
R-B ← JUNTE R-A a ESCOLA onde cod-escola-prof = cod-escola
R-X ← SELECIONE R-B onde cod-municipio-residencia é diferente de cod-municipio

Provas

Questão presente nas seguintes provas

3076532 Ano: 2024
Disciplina: TI - Banco de Dados
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

NoSQLFundamentos de NoSQL

Uma das principais características de sistemas gerenciadores de bancos de dados (SGBD) NoSQL, quando comparados aos sistemas gerenciadores bancos de dados relacionais (SGBDR), é que seu esquema é considerado flexível ou não existente (schemaless).

O esquema de um SGBD NoSQL ser flexível ou não existente tem como consequência o fato de que

A

a qualidade de dados pode ser mais difícil de ser garantida, quando comparado a um SGBDR.

B

a realização de adaptações para persistir conteúdos distintos é mais demorada do que em um SGBDR.

C

o desempenho de uma consulta aos dados é maior do que em um SGBDR.

D

os formatos de data são padronizados, da mesma forma que em SGBDR.

E

dados binários de qualquer natureza podem ser persistidos, o que um SGBDR não consegue fazer.

Provas

Questão presente nas seguintes provas

3076531 Ano: 2024
Disciplina: TI - Banco de Dados
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

SGBDsPostgreSQL

Sistemas Gerenciadores de Bancos de Dados, SGBD, via de regra, permitem acesso às suas funcionalidades por meio de interfaces interativas e, também, por meio de programas de apoio ou comandos específicos. O SGBD PostgreSQL possui um conjunto de programas de apoio. O programa a ser utilizado para realizar o backup de um banco de dados ou de um esquema, no PostgreSQL, é o pg_dump.

Nesse contexto, considere o seguinte comando:

pg_dump -a -Fp Alfa > Beta

Esse comando gera um backup

Provas

Questão presente nas seguintes provas

3076530 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

Big DataHadoopMapReduce

Nas últimas décadas, a automatização e a inserção de máquinas agrícolas transformaram profundamente o panorama do trabalho nas áreas rurais [...] e, em menos de 50 anos, a produtividade do agronegócio brasileiro aumentou 400%. [...]

Esses resultados vieram com a adoção da tecnologia nos processos cotidianos, e também com o investimento em pesquisas [...]. Agora, o agronegócio pode estar diante de um novo salto de produtividade; big data e machine learning são ferramentas que estão ganhando espaço e que podem, novamente, transformar o cenário do campo.

Disponível em: https://summitagro.estadao.com.br/tendencias-e- -tecnologia/como-big-data-e-machine-learning-sao-aplicados-no- -agronegocio/. Acesso em: 5 jan. 2024. Adaptado.

A utilização da plataforma paralela de processamento MapReduce aplica-se adequadamente como um framework de processamento de Big Data, visando à escalabilidade para as aplicações.

Nesse contexto, uma característica inerente à MapReduce é a

A

sua abordagem, que reflete uma solução simplificada de processamento de dados paralelos em um cluster.

B

sua função map(), que gera, para cada registro de entrada, um ou mais pares (chave,valor).

C

sua função reduce(), que gera um resultado combinado em valores que compartilham chaves distintas.

D

sua demanda pela existência de um esquema de dados.

E

natureza estática de suas funções, que devem respeitar a especificação original, caracterizando uma restrição inerente a essa abordagem.

Provas

Questão presente nas seguintes provas

3076529 Ano: 2024
Disciplina: TI - Banco de Dados
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

Banco de Dados DistribuídoFragmentação de Dados (Horizontal e Vertical)
Banco de Dados DistribuídoReplicação de Dados

Sistemas de bancos de dados apresentam benefícios e desafios potencializados quando é possível adotar uma solução de gerência distribuída, coordenada por um sistema de banco de dados distribuído.

Nesse contexto, uma importante questão de projeto refere- se à

A

autonomia, dimensão a ser considerada na arquitetura de um banco de dados distribuído, pois indica como a distribuição dos dados será processada, com a designação de fragmentos por nó.

B

confiabilidade do sistema, que pode, em função da natureza dos dados e da natureza das aplicações clientes, ser relaxada, em prol do desempenho de execução das consultas.

C

fragmentação vertical de dados, uma técnica que particiona um conjunto de dados em tuplas, ou registros, entre os nós do sistema distribuído.

D

replicação de dados seja ela total ou parcial, pois demanda a implementação de protocolos que garantam a consistência das réplicas.

E

execução de consultas, que se concentram na minimização dos custos de processador e de entrada e saída, sendo os custos de comunicação parcela de menor impacto no total.

Provas

Questão presente nas seguintes provas

3076528 Ano: 2024
Disciplina: TI - Organização e Arquitetura dos Computadores
Banca: CESGRANRIO
Orgão: IPEA

Provas:

Técnico de Planejamento e Pesquisa - Ciência de Dados
Provas ×

ProcessadoresArquiteturaArquitetura MIMD

O Banco Nossa Caixa é o primeiro banco do hemisfério sul a implantar o GDPS (Processamento Paralelo em Locais Geograficamente Distantes, na sigla em inglês), sistema que processa, simultaneamente, todos os dados da instituição em dois locais fisicamente separados. A tecnologia garante o armazenamento e a continuidade do funcionamento de todos os canais de atendimento e de negócios do banco, ainda que a operação de um dos equipamentos responsáveis por essas funções seja interrompida por um blecaute ou incêndio, por exemplo. O banco investiu R$ 80 milhões no projeto, que levou quatro anos desde a concepção até a implantação.

Do Banco Nossa Caixa Disponível em: https://www.saopaulo.sp.gov.br/ultimas-noticias/ nossa-caixa-usa-sistema-pioneiro-de-processamento-de-dados/. Acesso em: 5 jan. 2024.

No modelo de arquitetura Massively Parallel Processor, MPP, extensibilidade e escalabilidade são características comuns e vantajosas no armazenamento e no processamento de dados paralelos. Nesse contexto, qual modelo de processamento se enquadra à arquitetura MPP?