Logo Passei Direto
Buscar

Simulado AV TÓPICOS DE BIG DATA EM PYTHON

Ferramentas de estudo

Questões resolvidas

Em relação ao protocolo de transporte para transmissão de aplicações de streaming, selecione a opção correta.


MQTT
UDP
CoAP
HTTP
TCP

Selecione a opção correta que contenha a operação responsável por retornar
um subconjunto aleatório dos dados de entrada.
filter
sample
distinct
random
mapRandom

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Em relação ao protocolo de transporte para transmissão de aplicações de streaming, selecione a opção correta.


MQTT
UDP
CoAP
HTTP
TCP

Selecione a opção correta que contenha a operação responsável por retornar
um subconjunto aleatório dos dados de entrada.
filter
sample
distinct
random
mapRandom

Prévia do material em texto

29/03/2022 00:37 Estácio: Alunos
https://simulado.estacio.br/alunos/ 1/5
 
Simulado AV
Teste seu conhecimento acumulado
 
Disc.: TÓPICOS DE BIG DATA EM PYTHON 
Aluno(a): VICTOR AMADEU OLIVEIRA PIRES DOS SANTOS 202107296313
Acertos: 7,0 de 10,0 29/03/2022
 
 
Acerto: 1,0 / 1,0
Em relação aos desafios do processamento de fluxo de dados, selecione a opção correta.
Garantir a qualidade dos dados através de ferramentas de controle que não aceitem qualquer
inconsistência.
Usar algoritmos de criptografia nos dados para evitar o acesso indevido.
 Garantir a consistência da informação através da ordenação dos dados.
Dimensionar o projeto logo no início para evitar a necessidade de expansão posteriormente.
Aplicar recursos de redundância no projeto para reduzir a volatilidade dos dados.
Respondido em 29/03/2022 00:34:32
 
 
Explicação:
Nas aplicações de streaming de dados, dificilmente não vai ocorrer alguma inconsistência, pois, normalmente,
elas estão contextualizadas em ambientes dinâmicos. Portanto, deve-se ordenar os dados para manter a
consistência dos dados e, além disso, o sistema deve ter uma tolerância a falhas sendo capaz de operar ainda
que haja problemas, desde que estejam dentro de um patamar de qualidade pré-estabelecido.
 
 
Acerto: 1,0 / 1,0
Em relação ao protocolo de transporte para transmissão de aplicações de streaming, selecione a opção correta.
CoAP
 UDP
HTTP
TCP
MQTT
Respondido em 29/03/2022 00:17:58
 
 
Explicação:
O protocolo UDP - protocolo de datagrama do usuário - é utilizado para aplicações de streaming por ser mais
rápido. O protocolo TCP é orientado à confiabilidade e, no caso de aplicações de streaming, ele é muito lento
inviabilizando a aplicação. Os protocolos HTTP, MQTT e CoAP não se enquadram no transporte de dados.
 
 Questão1
a
 Questão2
a
https://simulado.estacio.br/alunos/inicio.asp
javascript:voltar();
29/03/2022 00:37 Estácio: Alunos
https://simulado.estacio.br/alunos/ 2/5
 
Acerto: 1,0 / 1,0
O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta
que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop.
Lua
Java Script
Perl
 Java
Python
Respondido em 29/03/2022 00:11:59
 
 
Explicação:
O Hadoop foi desenvolvido usando, originalmente, a linguagem de programação Java na distribuição livre da
Apache Foundation. Atualmente, diferentes distribuições do framework estão implementadas em diversas
linguagens, entre as quais o Python.
 
 
Acerto: 0,0 / 1,0
O Hadoop é um framework de código aberto voltado para aplicações de Big Data. Neste sentido, selecione
a alternativa correta que apresenta um grande desafio no processo de configuração e gerenciamento do
Hadoop.
Tratar dados não-estruturados.
 Aplicar políticas de segurança.
Processos de extração, transformação e carregamento dos dados.
Gerenciamento do armazenamento de dados.
 Mecanismo para melhorar o processamento dos dados.
Respondido em 29/03/2022 00:27:03
 
 
Explicação:
O tratamento da segurança da informação é um grande desafio para o Hadoop, pois o profissional responsável
por essa etapa terá que configurar o sistema que, pela natureza dos problemas de Big Data, é uma tarefa
complexa.
 
 
Acerto: 1,0 / 1,0
Selecione a opção correta que contenha a operação responsável por retornar um subconjunto aleatório dos
dados de entrada.
distinct
mapRandom
random
 sample
filter
Respondido em 29/03/2022 00:28:31
 
 
Explicação:
Gabarito: sample
 Questão3
a
 Questão4
a
 Questão5
a
29/03/2022 00:37 Estácio: Alunos
https://simulado.estacio.br/alunos/ 3/5
Justificativa: A operação responsável por retornar um subconjunto aleatório dos dados é a sample. É uma
operação da categoria de transformação, sendo que se encaixa em transformações amplas, pois pode ser
necessário realizar movimentações entre as partições. Filter é uma função que retorna um subconjunto de
dados em relação a alguma condição imposta, portanto não há aleatoriedade. Random e mapRandom não são
funções válidas para o Spark. Distinct retorna um RDD com elementos diferentes de um RDD de entrada.
 
 
Acerto: 1,0 / 1,0
Atualmente, o Apache Spark, é o mais bem-sucedido framework para Big Data. Selecione a opção correta que
contenha apenas funções que podem ser categorizadas como transformações no Spark.
 map, filter e union.
count, collect e take.
map, take e reduce.
map, sample e collect.
reduce, first e map.
Respondido em 29/03/2022 00:35:56
 
 
Explicação:
Gabarito: map, filter e union.
Justificativa: Algumas das funções de transformação no Spark são: map, filter, union, flatMap, mapPartitions e
sample. As citadas transformações, denominadas de transformações estreitas, resultam da aplicação de funções
de mapeamento e de filtragem, sendo que os dados se originam de uma única partição.
 
 
Acerto: 1,0 / 1,0
A linguagem Python se destaca como intuitiva e de fácil aprendizagem. Analise o código abaixo que apresenta
laços condicionais e instruções de repetição.
for i in range(10):
 if (i%2==0):
 print(i)
 Qual a saída esperada após a execução do programa?
Serão impressos no console os números ímpares entre 0 e 9.
Serão impressos no console os números pares entre 1 e 10.
 Serão impressos no console os números pares entre 0 e 9.
Serão impressos no console os números ímpares entre 0 e 10.
Serão impressos no console os números racionais entre 0 e 9.
Respondido em 29/03/2022 00:30:10
 
 
Explicação:
O constructo de laço que itera sobre uma sequência dos números reais de 0 a 9, e cujo condicional dentro do
laço escolhe apenas os números cujo resto de sua divisão por 2 seja 0, condição lógica que define se um
número é par ou não.
 
 
Acerto: 0,0 / 1,0
Dados categóricos são aqueles normalmente expressos por texto, que representam rótulos, nomes e símbolos.
 Questão6
a
 Questão7
a
 Questão8
a
29/03/2022 00:37 Estácio: Alunos
https://simulado.estacio.br/alunos/ 4/5
Qual tipo de visualização de dados abaixo é recomendado para dados categóricos?
 Gráficos de Barra.
Gráficos de Linha.
Gráfico de Estrela.
Gráfico de Faces de Chernoff.
 Gráfico de Matriz de Dispersão.
Respondido em 29/03/2022 00:32:42
 
 
Explicação:
O gráfico de barras mostra as proporções dos dados categóricos assim evidenciando os extratos da amostra.
Lembrando que os dados categóricos não se encaixam nos gráficos de dados numéricos, como o de dispersão
causando confusão na função de visualização ou quebrando a mesma dependendo da biblioteca escolhida.
 
 
Acerto: 0,0 / 1,0
Como podemos checar as métricas de classificação do modelo neural da biblioteca Scikit-Learn?
 Gráfico de Histograma
Regressão Linear
 Classification Report
Gráfico de Matriz de Dispersão
Plotly
Respondido em 29/03/2022 00:36:26
 
 
Explicação:
O classification report é um dos métodos oferecidos pelo scikit-learn que nos permite usar um conjunto ground
truth para comparar contra as predições de um modelo e este calculará as métricas de acurácia, precisão e
medida F de cada classe possível e também as mesmas métricas em um nível macro.
 
 
Acerto: 1,0 / 1,0
Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial?
KDM.
SIGKDD.
SIGM.
KDD-DM.
 CRISP-DM.
Respondido em 29/03/2022 00:15:56
 
 
Explicação:
O processo de tamanho similar ao KDD cujo âmbito industrial se beneficia mais devido à suas etapas de
entendimento do negócio é o CRISP-DM, processo esse que, diferentemente do KDD, contempla a entrega do
artefato de aprendizado de máquina.
 
 
 
 Questão9
a
 Questão10
a
29/03/2022 00:37 Estácio: Alunos
https://simulado.estacio.br/alunos/ 5/5
 
 
 
 
 
 
 
 
javascript:abre_colabore('38403','279167845','5167478947');

Mais conteúdos dessa disciplina