Foram encontradas 5.008 questões.
Considere o código abaixo escrito na linguagem Python (versão 3.11.1) com uso das bibliotecas numpy (versão 1.23.5) e scipy (versão 1.10.0).
1 import numpy as np
2 from scipy.stats import pearsonr
3 np.random.seed(110)
4 s1 = np.random.normal(size=1000)
5 s2 = s1.copy()
6 s2[0] = 100.0
7 print(pearsonr(s1,s2))
Ao ser executado o código acima, após a linha 7 foi escrito na tela o seguinte:
PearsonRResult(statistic=0.3104130838548752, pvalue=8.891269104323198e-24)
Acerca do exposto, analise os itens a seguir.
I. Os valores possíveis para ‘statistic’ estão no intervalo entre 0 e 1.
II. Os valores da mediana de s1 e de s2 são os mesmos.
III. O resultado da linha 7 escrito na tela indica que ‘s1’ e ‘s2’ possuem uma fraca relação linear.
Está correto o que se afirma em
Provas
Considere dois conjuntos de dados distintos, denotados por C1 e C2, ambos do mesmo tamanho, isto é, com a mesma quantidade de valores. A cada conjunto foi aplicado o mesmo método de regressão linear. O erro médio quadrático obtido para C1 foi menor do que para C2. Com base no exposto, analise as afirmativas a seguir, e assinale V para a afirmativa verdadeira e F para a falsa.
( ) O erro médio quadrático é uma métrica típica de erro em problemas de regressão cujo valor varia entre 0 e 1.
( ) Pode-se afirmar que o conjunto de dados C1 está melhor ajustado ao modelo do que o conjunto de dados C2.
( ) Pode-se afirmar que para melhorar o ajuste do conjunto de dados C2 é preciso aumentar seu tamanho.
As afirmativas são, respectivamente,
Provas
Considere certo método de aprendizado de máquina do tipo classificador, para realizar uma tarefa de classificação para k classes (sendo k um número natural maior do que 1) em um conjunto de dados com n objetos (sendo n um número natural maior do que k). Acerca da matriz de confusão correspondente, analise os itens a seguir.
I. A soma de todos os elementos da matriz é igual a n.
II. A taxa de acerto do classificador é dada pela razão entre a soma da diagonal principal da matriz e a soma de todos os elementos.
III. A precisão do classificador para certa classe i é dada pela razão entre o elemento da diagonal principal na linha i e a soma de todos os elementos da coluna i.
Está correto o que se afirma em
Provas
O Power BI é uma plataforma que agrega diversos serviços e aplicações com o objetivo de adquirir e analisar grandes conjuntos de dados.
Sobre o Power BI, assinale a afirmativa correta:
Provas
Descobrir regras de associação consiste em analisar as relações entre os atributos de uma base de dados transacional para tentar correlacioná-los.
Sobre regras de associação, assinale a afirmativa correta.
Provas
Dados podem ser classificados em algumas definições, que podem variar a depender de sistemas, processos e aplicações a que se destinam. Com relação a sua estrutura, podemos classificá-los, dentre outras formas, entre estruturados, semiestruturados e não estruturados.
Os itens a seguir contém alguns exemplos de dados que podem se enquadrar dentro dessas três definições.
I. Um banco de dados relacional.
II. Grafos que representam relações de usuários em uma rede social.
III. Um e-mail, que contém texto, imagens e um campo destinado a informar a data e a hora onde foi enviado.
O(s) item(s) que contém dados do tipo não estruturado é(são):
Provas
Uma das etapas fundamentais da Ciência de Dados é o tratamento dos dados, que podem com frequência apresentar incorreções, pela maneira como foram adquiridos em suas fontes. O tratamento de dados é, então, essencial para aprimorar a sua qualidade e corrigir possíveis desvios.
Dessa maneira, relacione os principais problemas que podem ser solucionados pelo tratamento de dados com as suas respectivas definições.
1. Enviesamento
2. Ruídos
3. Inconsistência
4. Redundância
( ) Ocorre quando existem alguns desvios dos valores verdadeiros, em geral por imprecisões existentes nos dispositivos que realizam a coleta dos dados.
( ) Ocorre quando dados repetem informações já presentes no conjunto obtido.
( ) Ocorre quando os dados não reproduzem bem a situação a ser analisada e produzem um modelo frequentemente preconceituoso.
( ) Ocorre quando atributos de dados são preenchidos de maneira incorreta, seja por engano ou com intenções fraudulentas, por exemplo.
Assinale a opção que indica a relação correta na ordem apresentada.
Provas
A Inteligência de Negócios (BI – Business Intelligence) é um termo abrangente que consiste em um conjunto de técnicas, metodologias, processos, ferramentas e arquiteturas com finalidade de aprimorar a gestão estratégica de negócios.
Com relação aos sistemas de Inteligência de Negócios (BI) e suas finalidades, assinale V para a afirmativa verdadeira e F para a falsa.
( ) Dashboards são interfaces para manipulação de dados que possibilitam exibições visuais detalhadas, utilizadas com frequência por gestores de empresas por sua capacidade de agrupamento de informações em uma mesma tela.
( ) Armazéns de dados (Data Warehouses) não podem ser hospedados, ou seja, desenvolvidos e mantidos por uma empresa terceira, devido a preocupações com a segurança e com o sigilo dos dados, que toda empresa deve possuir.
( ) Um dos objetivos do BI em uma empresa é proporcionar a transformação de dados em informações, que podem contribuir para a tomada de decisões estratégicas pelos líderes e gestores de uma instituição.
As afirmativas são, respectivamente:
Provas
A Ciência de Dados é uma área multidisciplinar, que engloba conceitos de Matemática, Estatística e Computação.
Sobre os fundamentos da Ciência de Dados, assinale a alternativa que contém a afirmação correta.
Provas
A empresa de e-commerce Shopping Inteligente está desenvolvendo um sistema de recomendação de produtos para melhorar a experiência do usuário e aumentar as vendas. Para isso, eles precisam armazenar grandes volumes de dados de cliques e visualizações de produtos de maneira eficiente e com alta performance, permitindo até mesmo escalabilidade. Considerando a necessidade de lidar com grandes quantidades de dados em tempo real, qual tecnologia de banco de dados seria mais adequada para esse tipo de aplicação?
Provas
Caderno Container