Logo Passei Direto
Buscar
Observe o trecho de código abaixo

```
import numpy as np
from pyspark import SparkContext
spark_contexto = SparkContext()
# = np.array([1, 2, 3, 4, 5, 6, 7, 8])
teste = spark_contexto.parallelize(a)
```
Selecione a opção correta a respeito dele.
A A utilização do SparkContext é opcional.
B A linha "spark_contexto.parallelize(a)" aplica a técnica MapReduce para processar o vetor "a".
C A variável "teste" corresponde a um RDD.
D A execução do trecho de código vai gerar um erro.
E O objetivo do trecho de código é contar a quantidade de ocorrências dos valores do vetor "a".
User badge image
Desenvolvendo com Questões

há 10 meses

Respostas

User badge image

Ed Verified user icon

há 10 meses

Vamos analisar cada uma das alternativas em relação ao trecho de código apresentado: A) A utilização do SparkContext é opcional. - Incorreto. O SparkContext é essencial para criar um contexto de execução no Apache Spark. B) A linha "spark_contexto.parallelize(a)" aplica a técnica MapReduce para processar o vetor "a". - Incorreto. A função `parallelize` cria um RDD a partir de uma coleção, mas não aplica diretamente a técnica MapReduce. MapReduce é um conceito mais amplo que envolve operações de mapeamento e redução. C) A variável "teste" corresponde a um RDD. - Correto. A linha `teste = spark_contexto.parallelize(a)` cria um RDD a partir do vetor "a". D) A execução do trecho de código vai gerar um erro. - Incorreto. O código não deve gerar um erro, desde que "a" seja definido corretamente como um vetor. E) O objetivo do trecho de código é contar a quantidade de ocorrências dos valores do vetor "a". - Incorreto. O trecho de código apenas cria um RDD a partir do vetor "a", não conta ocorrências. Portanto, a alternativa correta é: C) A variável "teste" corresponde a um RDD.

Essa resposta te ajudou?

0
Dislike0
details

Libere essa resposta sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

Mais perguntas desse material

Em relação ao protocolo de transporte para transmissão de aplicações de streaming, selecione a opção correta. A CoAP B UDP C TCP D HTTP E MQTT

Selecione a opção correta que contém a principal plataforma de tecnologia de nuvem que é usada como referência para as outras plataformas. A Google Cloud B IBM Cloud C Oracle Cloud D Amazon AWS E Microsoft Azure

Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. A Apenas não estruturado B Estruturado, não estruturado e semiestruturado C Estruturado e semiestruturado D Apenas estruturado E Apenas tabelas relacionais

Mais conteúdos dessa disciplina