BIG DATA PYTHON - TEMA 03 ex01

ESTÁCIO

Daniel Moura

em 09/06/2025

Questões resolvidas

Em relação às fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela geração de pares intermediários de valor e chave.
A) Embaralhamento
B) Combinação
C) Agrupamento
D) Redução

Considerando a função desses componentes, qual deles é responsável por armazenar os dados efetivos dentro do cluster Hadoop?
A) YARN, por ser o componente responsável pelo agendamento e gerenciamento de tarefas distribuídas
B) NameNode, por conter os metadados que descrevem a localização dos arquivos armazenados
C) MapReduce, por possibilitar a divisão das tarefas em pares chave-valor para processamento paralelo
D) DataNode, por ser o responsável direto pelo armazenamento físico dos dados no cluster
E) Hadoop Common, por fornecer bibliotecas e scripts necessários à execução dos demais componentes

Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. A Apenas não estruturado B Estruturado, não estruturado e semiestruturado C Estruturado e semiestruturado D Apenas estruturado E Apenas tabelas relacionais

A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados.
A YARN
B NameNode
C Bloco de dados
D Replicação
E DataNode

Qual componente da arquitetura Hadoop é responsável por gerenciar os recursos computacionais disponíveis e monitorar o uso de CPU, memória e disco em cada máquina do cluster?
A) NameNode
B) NodeManager
C) DataNode
D) TaskTracker
E) Mapper

Selecione a opção correta a respeito do nível do Data Lake responsável por fornecer dados para a análise de negócios. a) Nível de gerenciamento b) Nível de governança c) Nível de Metadados d) Nível de consumo e) Nível de admissão

Durante a execução de aplicações com Hadoop, a fase de redução desempenha papel fundamental no processamento final dos dados. Essa etapa é precedida por um processo que organiza e redistribui os pares chave-valor gerados pelas tarefas de mapeamento, otimizando a carga de trabalho entre os nós.
Qual é o nome desse processo e qual é sua principal contribuição?
A) Combinação – reduz a quantidade de tarefas no redutor ao eliminar duplicatas
B) Classificação – organiza os dados em ordem alfabética antes da gravação final
C) Embaralhamento – redistribui os dados intermediários para os redutores corretos
D) Particionamento – divide os dados em grupos com base em similaridade semântica
E) Agendamento – determina quais tarefas devem ser executadas com prioridade

O Hadoop é um framework de código aberto voltado para aplicações de Big Data.
Neste sentido, selecione a alternativa correta que apresenta um grande desafio no processo de configuração e gerenciamento do Hadoop.
A- Processos de extração, transformação e carregamento dos dados.
B- Mecanismo para melhorar o processamento dos dados.
C- Aplicar políticas de segurança.
D- Gerenciamento do armazenamento de dados.
E- Tratar dados não-estruturados.

O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop.
A) Python
B) Java
C) Lua
D) JavaScript
E) Perl

Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia da Informação.
Selecione a opção correta a respeito do Data Lake.
A- Possui alta latência para acesso dos dados.
B- Aplica processos de tratamento nos dados.
C- Armazena os dados de modo eficiente.
D- Demanda por equipamentos especiais.
E- São exclusivos da distribuição Hadoop Apache.

Conteúdos escolhidos para você

4 pág.

Tópicos de bigData com python - EX 2

ESTÁCIO

14 pág.

BIG DATA PYTHON - TEMA 03 ex04

ESTÁCIO

71 pág.

Tecnologias Avançadas Tema 3 Hadoop e armazenamento de dados

ESTÁCIO EAD

13 pág.

3 Hadoop e Armazenamento de Dados

UNINASSAU CARUARU

100 pág.

Tema 03 Hadoop e armazenamento de dados

ESTÁCIO EAD

Perguntas dessa disciplina

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

UniCesumar

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

UniCesumar

ETAPA 1 - Apresentação do Desafio Profissional. Você foi contratado recentemente como Analista de Banco de Dados pela "MedLife Clínicas", uma rede ...

UniCesumar

Texto 01: Fonte: AWS Amazon. Bancos de dados SQL (relacional) vs. NoSQL (não relacional). Disponível em: https://aws.amazon.com/pt/nosql/#:~:text=Em%2

ENADE – BANCO DE DADOS II 5 Considere um banco de dados relacional formado por três tabelas, conforme é apresentado na figura a seguir. As chaves prim

Material

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Em relação às fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela geração de pares intermediários de valor e chave.
A) Embaralhamento
B) Combinação
C) Agrupamento
D) Redução

Considerando a função desses componentes, qual deles é responsável por armazenar os dados efetivos dentro do cluster Hadoop?
A) YARN, por ser o componente responsável pelo agendamento e gerenciamento de tarefas distribuídas
B) NameNode, por conter os metadados que descrevem a localização dos arquivos armazenados
C) MapReduce, por possibilitar a divisão das tarefas em pares chave-valor para processamento paralelo
D) DataNode, por ser o responsável direto pelo armazenamento físico dos dados no cluster
E) Hadoop Common, por fornecer bibliotecas e scripts necessários à execução dos demais componentes

Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. A Apenas não estruturado B Estruturado, não estruturado e semiestruturado C Estruturado e semiestruturado D Apenas estruturado E Apenas tabelas relacionais

A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados.
A YARN
B NameNode
C Bloco de dados
D Replicação
E DataNode

Qual componente da arquitetura Hadoop é responsável por gerenciar os recursos computacionais disponíveis e monitorar o uso de CPU, memória e disco em cada máquina do cluster?
A) NameNode
B) NodeManager
C) DataNode
D) TaskTracker
E) Mapper

Selecione a opção correta a respeito do nível do Data Lake responsável por fornecer dados para a análise de negócios. a) Nível de gerenciamento b) Nível de governança c) Nível de Metadados d) Nível de consumo e) Nível de admissão

Durante a execução de aplicações com Hadoop, a fase de redução desempenha papel fundamental no processamento final dos dados. Essa etapa é precedida por um processo que organiza e redistribui os pares chave-valor gerados pelas tarefas de mapeamento, otimizando a carga de trabalho entre os nós.
Qual é o nome desse processo e qual é sua principal contribuição?
A) Combinação – reduz a quantidade de tarefas no redutor ao eliminar duplicatas
B) Classificação – organiza os dados em ordem alfabética antes da gravação final
C) Embaralhamento – redistribui os dados intermediários para os redutores corretos
D) Particionamento – divide os dados em grupos com base em similaridade semântica
E) Agendamento – determina quais tarefas devem ser executadas com prioridade

O Hadoop é um framework de código aberto voltado para aplicações de Big Data.
Neste sentido, selecione a alternativa correta que apresenta um grande desafio no processo de configuração e gerenciamento do Hadoop.
A- Processos de extração, transformação e carregamento dos dados.
B- Mecanismo para melhorar o processamento dos dados.
C- Aplicar políticas de segurança.
D- Gerenciamento do armazenamento de dados.
E- Tratar dados não-estruturados.

O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop.
A) Python
B) Java
C) Lua
D) JavaScript
E) Perl

Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia da Informação.
Selecione a opção correta a respeito do Data Lake.
A- Possui alta latência para acesso dos dados.
B- Aplica processos de tratamento nos dados.
C- Armazena os dados de modo eficiente.
D- Demanda por equipamentos especiais.
E- São exclusivos da distribuição Hadoop Apache.

Conteúdos escolhidos para você

4 pág.

Tópicos de bigData com python - EX 2

ESTÁCIO

14 pág.

BIG DATA PYTHON - TEMA 03 ex04

ESTÁCIO

71 pág.

Tecnologias Avançadas Tema 3 Hadoop e armazenamento de dados

ESTÁCIO EAD

13 pág.

3 Hadoop e Armazenamento de Dados

UNINASSAU CARUARU

100 pág.

Tema 03 Hadoop e armazenamento de dados

ESTÁCIO EAD

Perguntas dessa disciplina

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

UniCesumar

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

UniCesumar

ETAPA 1 - Apresentação do Desafio Profissional. Você foi contratado recentemente como Analista de Banco de Dados pela "MedLife Clínicas", uma rede ...

UniCesumar

Texto 01: Fonte: AWS Amazon. Bancos de dados SQL (relacional) vs. NoSQL (não relacional). Disponível em: https://aws.amazon.com/pt/nosql/#:~:text=Em%2

ENADE – BANCO DE DADOS II 5 Considere um banco de dados relacional formado por três tabelas, conforme é apresentado na figura a seguir. As chaves prim

Prévia do material em texto

Verifique o seu desempenho e continue
treinando! Você pode refazer o exercício
quantas vezes quiser.
A
B
C
D
1
Em relação às fases do Hadoop, selecione a
opção correta que apresenta o componente
responsável pela geração de pares
intermediários de valor e chave.
Embaralhamento
Combinação
Agrupamento
Redução
Questão de 10
Corretas
Incorretas
Em branco
1 2 3 4 5
6 7 8 9 10
Hadoop e…
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/683f94f9ba09c64b17...
1 of 14 08/06/2025, 22:43
E Gravação da saída
Opa! A alternativa correta é a letra
A. Confira o gabarito comentado!
O processo de embaralhamento, também
conhecido pelo termo em inglês "shuffling",
é o componente do Hadoop responsável
pela geração de pares intermediários de
valor e chave. Esses pares são transferidos
para a fase de redução. Este processo
ocorre em paralelo com outras tarefas da
fase de mapeamento, otimizando o uso dos
recursos e aumentando a eficiência do
processamento de dados. Portanto, a
alternativa correta é a "A�
Embaralhamento".
2
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/683f94f9ba09c64b17...
2 of 14 08/06/2025, 22:43
A
B
C
D
E
Organizações que lidam com grandes volumes
de dados, como redes sociais e plataformas de
streaming, frequentemente adotam soluções
específicas para garantir desempenho,
escalabilidade e tolerância a falhas. Uma
dessas soluções é o Hadoop, cuja arquitetura é
composta por diversos componentes que
trabalham em conjunto. Considerando a função
desses componentes, qual deles é 
?
YARN, por ser o componente
responsável pelo agendamento e
gerenciamento de tarefas distribuídas
NameNode, por conter os metadados
que descrevem a localização dos
arquivos armazenados
MapReduce, por possibilitar a divisão
das tarefas em pares chave-valor para
processamento paralelo
DataNode, por ser o responsável direto
pelo armazenamento físico dos dados
no cluster
Hadoop Common, por fornecer
bibliotecas e scripts necessários à
execução dos demais componentes
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/683f94f9ba09c64b17...
3 of 14 08/06/2025, 22:43
A
B
C
Opa! A alternativa correta é a letra
D. Confira o gabarito comentado!
O DataNode é o componente da arquitetura
Hadoop responsável por armazenar os
dados reais em cada nó do cluster. Ele atua
como "escravo" na estrutura mestre-
escravo, sendo coordenado pelo
NameNode, que apenas gerencia
metadados. Enquanto outros componentes
como YARN e MapReduce se concentram
em processamento e gerenciamento, o
DataNode se encarrega do armazenamento
em si.
3
Em relação ao Data Lake, selecione a opção
correta que contenha o(s) formato(s) de dados
que pode(m) ser armazenado(s) nele.
Apenas estruturado
Estruturado e semiestruturado
Estruturado, não estruturado e
semiestruturado
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/683f94f9ba09c64b17...
4 of 14 08/06/2025, 22:43
D
E
Apenas não estruturado
Apenas tabelas relacionais
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
O Data Lake é uma solução de
armazenamento de dados que permite a
inclusão de diferentes formatos de dados,
sejam eles estruturados, semiestruturados
ou não estruturados. Essa característica de
variedade dos dados é uma das principais
vantagens do Data Lake, especialmente em
aplicações de Big Data, onde a diversidade
de formatos de dados é uma constante.
Portanto, a alternativa correta é a C, que
afirma que o Data Lake pode armazenar
dados estruturados, semiestruturados e
não estruturados.
4
A respeito do HDFS, selecione a opção correta
cujo componente lógico mantém os dados do
usuário na forma de blocos de dados.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/683f94f9ba09c64b17...
5 of 14 08/06/2025, 22:43
A
B
C
D
E
YARN
NameNode
Bloco de dados
Replicação
DataNode
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
O componente lógico que mantém os
dados do usuário na forma de blocos de
dados no HDFS é o DataNode. Ele é uma
parte essencial da arquitetura do HDFS,
pois é responsável pelo armazenamento
dos dados. Cada arquivo no HDFS é
dividido em blocos de dados, que são
armazenados em DataNodes. Portanto, a
alternativa correta é a E, que menciona o
DataNode.
5
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/683f94f9ba09c64b17...
6 of 14 08/06/2025, 22:43
A
B
C
D
E
A arquitetura do Hadoop é projetada para
garantir alto desempenho na manipulação de
grandes volumes de dados distribuídos. Um de
seus principais diferenciais é a capacidade de
dividir tarefas entre diversos nós do cluster.
Qual componente da arquitetura Hadoop é
responsável por 
?
NameNode
NodeManager
DataNode
TaskTracker
Mapper
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
O NodeManager atua como o agente em
cada máquina (nó) do cluster, sendo
responsável por monitorar os recursos
locais e repassar essas informações ao
ResourceManager, parte integrante do
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/683f94f9ba09c64b17...
7 of 14 08/06/2025, 22:43
A
B
C
D
E
YARN. Ele assegura que os containers
sejam gerenciados com base na
capacidade da máquina, otimizando a
alocação de tarefas.
6
Selecione a opção correta a respeito do nível do
Data Lake responsável por fornecer dados para
a análise de negócios.
Nível de governança
Nível de Metadados
Nível de admissão
Nível de gerenciamento
Nível de consumo
Opa! A alternativa correta é a letra
E. Confira o gabarito comentado!
O Data Lake é estruturado em três níveis
principais: admissão, gerenciamento e
consumo. O nível de admissão é
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/683f94f9ba09c64b17...
8 of 14 08/06/2025, 22:43
A
B
responsável pelos serviços de aquisição de
dados. O nível de gerenciamento cuida da
identificação e localização dos dados. Por
fim, o nível de consumo é o que fornece
dados para serem utilizados por aplicações
que auxiliam na tomada de decisões de
negócios. Portanto, a alternativa correta é o
"Nível de consumo", pois é este nível que
disponibiliza os dados para análise de
negócios.
7
Durante a execução de aplicações com
Hadoop, a fase de redução desempenha papel
fundamental no processamento final dos dados.
Essa etapa é precedida por um processo que
organiza e redistribui os pares chave-valor
gerados pelas tarefas de mapeamento,
otimizando a carga de trabalho entre os nós.
Qual é o nome desse processo e qual é sua
principal contribuição?
Combinação – reduz a quantidade de
tarefas no redutor ao eliminar
duplicatas
Classificação – organiza os dados em
ordem alfabética antes da gravação
final
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/683f94f9ba09c64b17...
9 of 14 08/06/2025, 22:43
C
D
E
Embaralhamento – redistribui os dados
intermediários para os redutores
corretos
Particionamento – divide os dados em
grupos com base em similaridade
semântica
Agendamento – determina quais
tarefas devem ser executadas com
prioridade
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
O embaralhamento (ou shuffle) é o
processo em que os pares chave-valor
intermediários, gerados pelos mapeadores,
são redistribuídos entre os redutores
conforme a chave. Essa etapa garante que
todos os valores de uma mesma chave
sejam processados juntos, permitindo uma
redução eficaz e consistente dos dados.
8
O Hadoop é um framework de código aberto
voltado para aplicações de Big Data. Neste
sentido, selecione a alternativa correta que
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/683f94f9ba09c64b17...
10 of 14 08/06/2025, 22:43
A
B
C
D
E
apresenta um grande desafio no processo
de configuração e gerenciamento do
Hadoop.
Processos de extração, transformação
e carregamento dos dados.
Mecanismo para melhorar o
processamento dos dados.
Aplicar políticas de segurança.
Gerenciamento do armazenamento de
dados.
Tratar dados não-estruturados.
Opa! Aalternativa correta é a letra
C. Confira o gabarito comentado!
O desafio de aplicar políticas de segurança
no Hadoop é significativo, pois envolve a
configuração de um sistema que lida com
problemas complexos de Big Data. A
segurança da informação é um aspecto
crítico em qualquer sistema de dados, e no
caso do Hadoop, isso se torna ainda mais
desafiador devido à sua natureza de lidar
com grandes volumes de dados, muitas
vezes não estruturados. Portanto, o
profissional responsável por essa etapa
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/683f94f9ba09c64b17...
11 of 14 08/06/2025, 22:43
A
B
C
D
E
precisa ter um alto nível de conhecimento e
habilidade para garantir a segurança
adequada dos dados.
9
O Hadoop é uma tecnologia especializada
em atender as demandas de Big Data.
Selecione a opção correta que contenha a
linguagem de programação utilizada para o
desenvolvimento e implementação do
Hadoop.
Python
Java
Lua
JavaScript
Perl
Opa! A alternativa correta é a letra
B. Confira o gabarito comentado!
O Hadoop foi originalmente desenvolvido
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/683f94f9ba09c64b17...
12 of 14 08/06/2025, 22:43
A
B
C
D
E
utilizando a linguagem de programação
Java, pela Apache Foundation. Com o
passar do tempo, diferentes versões do
framework foram implementadas em várias
linguagens, incluindo Python. No entanto, a
linguagem de programação principal e mais
utilizada para o desenvolvimento e
implementação do Hadoop continua sendo
Java, tornando a alternativa B a resposta
correta para esta questão.
10
Reconhecer os conceitos de Data Lake é
fundamental para o profissional de Tecnologia
da Informação. Selecione a opção correta a
respeito do Data Lake.
Possui alta latência para acesso dos
dados.
Aplica processos de tratamento nos
dados.
Armazena os dados de modo eficiente.
Demanda por equipamentos especiais.
São exclusivos da distribuição Hadoop
Apache.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/683f94f9ba09c64b17...
13 of 14 08/06/2025, 22:43
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
O conceito de Data Lake se refere a um
sistema de armazenamento que é capaz de
guardar uma grande quantidade de dados
brutos, em seu formato original. A
alternativa correta é a letra C, que afirma
que o Data Lake armazena os dados de
modo eficiente. Isso ocorre porque o Data
Lake é projetado para armazenar grandes
volumes de dados de maneira eficaz,
permitindo que os usuários acessem e
analisem esses dados rapidamente. Além
disso, é importante ressaltar que o Data
Lake não demanda por equipamentos
especiais e não é de uso exclusivo da
distribuição Hadoop Apache, contrariando
as afirmações das alternativas D e E,
respectivamente.
Firefox https://estacio.saladeavaliacoes.com.br/exercicio/683f94f9ba09c64b17...
14 of 14 08/06/2025, 22:43

BIG DATA PYTHON - TEMA 03 ex01

ESTÁCIO

Ferramentas de estudo

Em relação às fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela geração de pares intermediários de valor e chave.A) EmbaralhamentoB) CombinaçãoC) AgrupamentoD) Redução

Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. A Apenas não estruturado B Estruturado, não estruturado e semiestruturado C Estruturado e semiestruturado D Apenas estruturado E Apenas tabelas relacionais

A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados.A YARNB NameNodeC Bloco de dadosD ReplicaçãoE DataNode

Qual componente da arquitetura Hadoop é responsável por gerenciar os recursos computacionais disponíveis e monitorar o uso de CPU, memória e disco em cada máquina do cluster?A) NameNodeB) NodeManagerC) DataNodeD) TaskTrackerE) Mapper

Selecione a opção correta a respeito do nível do Data Lake responsável por fornecer dados para a análise de negócios. a) Nível de gerenciamento b) Nível de governança c) Nível de Metadados d) Nível de consumo e) Nível de admissão

O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop.A) PythonB) JavaC) LuaD) JavaScriptE) Perl

Conteúdos escolhidos para você

Tópicos de bigData com python - EX 2

BIG DATA PYTHON - TEMA 03 ex04

Tecnologias Avançadas Tema 3 Hadoop e armazenamento de dados

3 Hadoop e Armazenamento de Dados

Tema 03 Hadoop e armazenamento de dados

Perguntas dessa disciplina

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

ETAPA 1 - Apresentação do Desafio Profissional. Você foi contratado recentemente como Analista de Banco de Dados pela "MedLife Clínicas", uma rede ...

Texto 01: Fonte: AWS Amazon. Bancos de dados SQL (relacional) vs. NoSQL (não relacional). Disponível em: https://aws.amazon.com/pt/nosql/#:~:text=Em%2

ENADE – BANCO DE DADOS II 5 Considere um banco de dados relacional formado por três tabelas, conforme é apresentado na figura a seguir. As chaves prim

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Em relação às fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela geração de pares intermediários de valor e chave.A) EmbaralhamentoB) CombinaçãoC) AgrupamentoD) Redução

Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. A Apenas não estruturado B Estruturado, não estruturado e semiestruturado C Estruturado e semiestruturado D Apenas estruturado E Apenas tabelas relacionais

A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados.A YARNB NameNodeC Bloco de dadosD ReplicaçãoE DataNode

Qual componente da arquitetura Hadoop é responsável por gerenciar os recursos computacionais disponíveis e monitorar o uso de CPU, memória e disco em cada máquina do cluster?A) NameNodeB) NodeManagerC) DataNodeD) TaskTrackerE) Mapper

Selecione a opção correta a respeito do nível do Data Lake responsável por fornecer dados para a análise de negócios. a) Nível de gerenciamento b) Nível de governança c) Nível de Metadados d) Nível de consumo e) Nível de admissão

O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop.A) PythonB) JavaC) LuaD) JavaScriptE) Perl

Conteúdos escolhidos para você

Tópicos de bigData com python - EX 2

BIG DATA PYTHON - TEMA 03 ex04

Tecnologias Avançadas Tema 3 Hadoop e armazenamento de dados

3 Hadoop e Armazenamento de Dados

Tema 03 Hadoop e armazenamento de dados

Perguntas dessa disciplina

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

ETAPA 1 - Apresentação do Desafio Profissional. Você foi contratado recentemente como Analista de Banco de Dados pela "MedLife Clínicas", uma rede ...

Texto 01: Fonte: AWS Amazon. Bancos de dados SQL (relacional) vs. NoSQL (não relacional). Disponível em: https://aws.amazon.com/pt/nosql/#:~:text=Em%2

ENADE – BANCO DE DADOS II 5 Considere um banco de dados relacional formado por três tabelas, conforme é apresentado na figura a seguir. As chaves prim

Mais conteúdos dessa disciplina

Em relação às fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela geração de pares intermediários de valor e chave.
A) Embaralhamento
B) Combinação
C) Agrupamento
D) Redução

A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados.
A YARN
B NameNode
C Bloco de dados
D Replicação
E DataNode

Qual componente da arquitetura Hadoop é responsável por gerenciar os recursos computacionais disponíveis e monitorar o uso de CPU, memória e disco em cada máquina do cluster?
A) NameNode
B) NodeManager
C) DataNode
D) TaskTracker
E) Mapper

O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop.
A) Python
B) Java
C) Lua
D) JavaScript
E) Perl

Em relação às fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela geração de pares intermediários de valor e chave.
A) Embaralhamento
B) Combinação
C) Agrupamento
D) Redução

A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados.
A YARN
B NameNode
C Bloco de dados
D Replicação
E DataNode

Qual componente da arquitetura Hadoop é responsável por gerenciar os recursos computacionais disponíveis e monitorar o uso de CPU, memória e disco em cada máquina do cluster?
A) NameNode
B) NodeManager
C) DataNode
D) TaskTracker
E) Mapper

O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop.
A) Python
B) Java
C) Lua
D) JavaScript
E) Perl