Prova Completa: Analista de TI - Ciência de Dados (IF-SP

2753122 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: IF-SP
Orgão: IF-SP

Provas:

Analista de TI - Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAplicaçõesPLN: Processamento de Linguagem Natural

A biblioteca NLTK (Natural Language Toolkit) engloba ferramentas para processamento de linguagem natural, tais como funções de tokenização e radicalização. Dessa forma, considerando o código apresentado:

frase = “Não esqueçam a lista de materiais: 1 lápis e 2 canetas!”

from nltk.tokenize import RegexpTokenizer

tokenizador = RegexpTokenizer(r’w+’)

tokens = tokenizador.tokenize(frase)

print(tokens)

Qual o resultado correto?

A

[‘Não’, ‘esqueçam’, ‘a’, ‘lista’, ‘de’, ‘materiais’, ‘1’, ‘lápis’, ‘e’, ‘2’, ‘canetas’]

B

[‘Não’, ‘esqueçam’, ‘a’, ‘lista’, ‘de’, ‘materiais’, ‘lápis’, ‘e’, ‘canetas’]

C

[‘Não’, ‘esqueçam’, ‘a’, ‘lista’, ‘de’, ‘materiais’, ‘:’, ‘1’, ‘lápis’, ‘e’, ‘2’, ‘canetas’, ‘!’]

D

[‘Não’, ‘esqueçam’, ‘a’, ‘lista’, ‘de’, ‘materiais’, ‘:’, ‘lápis’, ‘e’, ‘canetas’, ‘!’]

Provas

Questão presente nas seguintes provas

2753121 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: IF-SP
Orgão: IF-SP

Provas:

Analista de TI - Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningRedes Neurais

Uma rede neural é um modelo preditivo motivado pela forma como o cérebro funciona. Redes neurais artificiais são formadas por neurônios artificiais, que desenvolvem cálculos similares sobre suas entradas. Elas podem resolver uma variedade de problemas, tais como o reconhecimento de caligrafia e a detecção facial, entre outros. São geralmente representadas por meio de um grafo orientado, onde os vértices representam os neurônios e as arestas representam as sinapses. Podem ser classificadas em três categorias específicas: Redes Neurais Feed-Forward, Redes Recorrentes e Redes Conectadas Simetricamente. Dentro dessas categorias, existem diversos tipos de arquiteturas.

Assinale a alternativa que define corretamente uma Rede Neural Perceptron Multicamadas.

A

Uma Rede Neural Perceptron Multicamadas é uma rede neural profunda, que pode ser utilizada para classificar imagens, agrupá-las por similaridade e realizar o reconhecimento de objetos dentro de cenas.

B

Uma Rede Neural Perceptron Multicamadas é uma rede neural artificial composta por mais de um Perceptron. Elas são compostas por uma camada de entrada, para receber o sinal, e uma camada de saída, que toma uma decisão ou previsão sobre a entrada. Entre essas camadas podem existir um número arbitrário de camadas ocultas.

C

Uma Rede Neural Perceptron Multicamadas é um tipo de rede neural artificial projetada para reconhecer padrões em sequências de dados, como texto, genomas, sons, dados de série temporais ou linguagem natural.

D

Uma Rede Neural Perceptron Multicamadas é um tipo de rede neural recorrente estocástica, na qual os nós tomam decisões binárias com alguma tendência. Esse tipo de rede neural é capaz de representar e resolver problemas combinatórios difíceis.

Provas

Questão presente nas seguintes provas

2753120 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: IF-SP
Orgão: IF-SP

Provas:

Analista de TI - Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAplicaçõesPLN: Processamento de Linguagem Natural

O Processamento de Linguagem Natural (PLN) é a subárea da Inteligência Artificial responsável por estudar a capacidade e as limitações de uma máquina de entender a linguagem dos seres humanos. Para poder realizar essa modelagem, são necessários pré-processamentos que abstraem e estruturam a língua, deixando apenas aquilo que representa uma informação relevante. Uma das etapas desse processo compreende a normalização. Uma tarefa que pode ser realizada dentro do processo de normalização é denominada de tokenização lexical. Considere a seguinte sentença:

A área de Ciência de Dados é muito interessante!

Assinale a alternativa correta que representa o resultado da tokenização lexical para essa sentença.

Provas

Questão presente nas seguintes provas

2753119 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: IF-SP
Orgão: IF-SP

Provas:

Analista de TI - Ciência de Dados
Provas ×

Inteligência ArtificialMachine Learning

Entre os modelos de aprendizado de máquina mais comuns, estão as árvores de decisão. Elas são métodos de aprendizado de máquinas muito utilizados em tarefas de classificação e regressão. Em problemas de classificação, os modelos em árvore são designados de árvore de decisão. Para resolver um problema de decisão, esse tipo de método utiliza a estratégia de dividir para conquistar. Uma proposta natural é rotular cada conjunto da divisão por sua classe mais frequente e escolher a divisão que tem menores erros. O conceito fundamental nessa proposta é denominado de entropia. Considerando as árvores de decisão, assinale a alternativa que define corretamente o conceito de entropia.

A

A entropia é uma medida que representa a soma de todos os valores, dividida pelo número de valores do conjunto de dados.

B

A entropia é uma medida que representa a probabilidade de obter uma ocorrência do evento, a partir de uma seleção aleatória do subconjunto de dados.

C

A entropia é uma medida que representa a diferença entre o maior e o menor valor, dentro de um conjunto de dados.

D

A entropia é uma medida que representa a categoria, ou o valor, de maior ocorrência em um conjunto de dados.

Provas

Questão presente nas seguintes provas

2753118 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: IF-SP
Orgão: IF-SP

Provas:

Analista de TI - Ciência de Dados
Provas ×

Inteligência ArtificialMachine Learning

Machine Learning, ou aprendizado de máquina, é um subcampo da inteligência artificial baseada na ideia de que os sistemas podem aprender a identificar padrões e tomar decisões, por meio da análise de dados. De acordo com o tipo de técnica utilizada no processo de aprendizagem, existem vários algoritmos que podem ser aplicados para gerar o modelo de aprendizado. Os parâmetros desse modelo podem ser atualizados por meio de técnicas de otimização. Com base nessas informações, assinale a alternativa correta.

A

O gradiente descendente é um algoritmo de otimização utilizado pelos cientistas de dados para encontrar um máximo local de uma função diferenciável, movendo-se iterativamente na direção da descida mais íngreme, conforme definido pelo negativo do gradiente.

B

O método do gradiente descendente é utilizado pelos cientistas de dados para encontrar os valores de parâmetros de uma função, que reduzem ao máximo uma função de custo.

C

O gradiente descendente é um algoritmo de otimização iterativa, que necessita do cálculo da segunda derivada para poder realizar atualizações dos parâmetros do modelo preditivo.

D

No método do gradiente descendente, o tamanho do passo (também conhecido como taxa de aprendizado, ou learning rate) não exerce nenhuma influência no resultado.

Provas

Questão presente nas seguintes provas

2753117 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: IF-SP
Orgão: IF-SP

Provas:

Analista de TI - Ciência de Dados
Provas ×

Inteligência Artificial

Você recebeu um chamado para colaborar no desenvolvimento de um dos módulos do software acadêmico. O referido módulo deve apresentar um gráfico estatístico para simplificar a interpretação dos dados e facilitar a tomada de decisões. Anexo ao chamado, consta um exemplo de uma matriz de dados extraída do Sistema Gerenciador de Banco de Dados oficial da instituição, possuindo dados relacionados à altura, peso, idade, renda familiar e número de reprovações. Assinale a alternativa que representa o tipo de gráfico mais adequado para análise dos referidos dados.

Provas

Questão presente nas seguintes provas

2753108 Ano: 2022
Disciplina: TI - Desenvolvimento de Sistemas
Banca: IF-SP
Orgão: IF-SP

Provas:

Analista de TI - Ciência de Dados
Provas ×

LinguagensPython

Trabalhar com álgebra linear está associado aos vetores e matrizes, com suas regras e cálculos. Para isso, é necessário conhecer tanto a matemática envolvida quanto os recursos da linguagem de programação. Assinale a alternativa correta que implementa o cálculo algébrico apresentado:

!$ A = \begin{bmatrix} 10 & 20 & 30 \\ 40 & 50 & 60 \\ 70 & 80 & 90 \end{bmatrix} \ B = \begin{bmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{bmatrix} \ C = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix} !$

Sendo D = (A+B)•C

A

import numpy as np
A = np.arange(10,100,10).reshape(3,3)
B = np.arange(1,9,1).reshape(3,3)
C = np.eye(3)
D = (A+B)*C
print(D)

B

import numpy as np
A = np.arange(10,100,10).reshape(3,3)
B = np.arange(1,9,1).reshape(3,3)
C = np.eye(3)
D = A+B*C
print(D)

C

import numpy as np
A = np.arange(10,100,10).reshape(3,3)
B = np.linspace(1,9,9).reshape(3,3)
C = np.eye(3)
D = (A+B)*C
print(D)

D

import numpy as np
A = np.arange(10,100,10).reshape(3,3)
B = np.linspace(1,9,9).reshape(3,3)
C = np.ones(3)
D = (A+B)*C
print(D)

Provas

Questão presente nas seguintes provas

2753088 Ano: 2022
Disciplina: TI - Desenvolvimento de Sistemas
Banca: IF-SP
Orgão: IF-SP

Provas:

Analista de TI - Ciência de Dados
Provas ×

LinguagensPython

a = {1,2,3}

b = (1,2,3)

c = [1,2,3]

d = {“a”: 1,”b”: 2,”c”: 3}

print(type(a))

print(type(b))

print(type(c))

print(type(d))

Assinale a alternativa que corresponde à saída gerada pelo algoritmo acima:

Provas

Questão presente nas seguintes provas

2753087 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: IF-SP
Orgão: IF-SP

Provas:

Analista de TI - Ciência de Dados
Provas ×

ProgramaçãoPythonScipy

from scipy import stats

…

Y, Z = stats.normaltest(X)

Considerando o trecho do algoritmo acima, assinale a alternativa que corresponde ao significado do valor de Z.

Provas

Questão presente nas seguintes provas

2753086 Ano: 2022
Disciplina: TI - Desenvolvimento de Sistemas
Banca: IF-SP
Orgão: IF-SP

Provas:

Analista de TI - Ciência de Dados
Provas ×

LinguagensPython

Uma tarefa muito comum durante a etapa de pré-processamento de dados é o tratamento de valores ausentes. Na linguagem R, os valores ausentes são representados por NA (Not Avaliable). Considere os dados exibidos pela figura abaixo:

Enunciado 3134379-1

Esses dados correspondem aos valores que foram carregados e armazenados em um dataframe da linguagem R. A linguagem R, assim como a linguagem Python, é muito utilizada na área de Ciência de Dados. Ela oferece diversas bibliotecas que podem ser empregadas para auxiliar nas etapas de pré-processamento e transformação dos dados. Ao analisar as informações exibidas pela figura, o cientista de dados percebe a existência de diversos valores ausentes e decide substituí-los da seguinte forma:

• Gravidez: substituir NA pelo valor 0;
• Pressão Sanguínea: substituir NA pela média dos valores da coluna;
• Resultado: substituir NA pelo valor 0.

Assinale a alternativa correta, que indica o trecho de código escrito em linguagem R, que pode ser utilizado para realizar essa tarefa.

A

df <- df %>%
mutate (
across(c(‘Gravidez’,’Resultado’), ~replace_na(.x, 0)),
across(‘Pressão Sanguínea’, ~replace_na(.x, mean(.x, na.rm=TRUE)))
)

B

df <- df %>%
mutate (
across(c(‘Gravidez’,’Resultado’), 0),
across(‘Pressão Sanguínea’, mean())
)

C

df <- df %>%
mutate_all (
across(c(‘Gravidez’,’Resultado’), ~replace_na(.x, 0)),
across(‘Pressão Sanguínea’, ~replace_na(.x, mean(.x, na.rm=TRUE)))
)

D

df <- df %>%
mutate_at (
across(c(‘Gravidez’,’Resultado’), ~replace_na(.x, 0)),
across(‘Pressão Sanguínea’, ~replace_na(.x, mean(.x, na.rm=TRUE)))
)

Comentários

×

Cadernos