Prévia do material em texto
Questão 01 Associe as tecnologias subjacentes à infraestrutura de Big Data com suas respectivas descrições. 1. Hadoop 2. NoSQL Databases 3. Data Warehousing 4. Stream Processing 5. Ferramentas de Análise e Machine Learning Descrições: A) Sistemas de armazenamento de dados que consolidam informações de diferentes fontes em um repositório central, facilitando a análise e a tomada de decisões empresariais. B) Framework de código aberto que utiliza o modelo de programação MapReduce para processar grandes conjuntos de dados de forma distribuída. C) Bancos de dados projetados para armazenar e recuperar dados de maneira eficiente, especialmente quando se trata de dados não estruturados ou semiestruturados. D) Abordagem para o processamento de dados em tempo real, em que os dados são continuamente ingeridos e analisados à medida que são gerados. E) Ferramentas e bibliotecas que permitem a análise avançada de dados e a construção de modelos preditivos, incluindo machine learning e inteligência artificial. A 1-C, 2-D, 3-E, 4-A, 5-B. B 1-B, 2-C, 3-A, 4-D, 5-E. C 1-A, 2-B, 3-C, 4-E, 5-D. D 1-D, 2-E, 3-B, 4-C, 5-A. E 1-E, 2-A, 3-D, 4-B, 5-C. Resolução comentada Para resolver esta questão, é necessário associar corretamente cada tecnologia subjacente à infraestrutura de Big Data com sua respectiva descrição, conforme descrito no texto-base. 1. Hadoop Descrição correta: Framework de código aberto que utiliza o modelo de programação MapReduce para processar grandes conjuntos de dados de forma distribuída. 2. NoSQL Databases Descrição correta: Bancos de dados projetados para armazenar e recuperar dados de maneira eficiente, especialmente quando se trata de dados não estruturados ou semiestruturados. 3. Data Warehousing Descrição correta: Sistemas de armazenamento de dados que consolidam informações de diferentes fontes em um repositório central, facilitando a análise e a tomada de decisões empresariais. 4. Stream Processing Descrição correta: Abordagem para o processamento de dados em tempo real, onde os dados são continuamente ingeridos e analisados à medida que são gerados. 5. Ferramentas de Análise e Machine Learning Descrição correta: Ferramentas e bibliotecas que permitem a análise avançada de dados e a construção de modelos preditivos, incluindo machine learning e inteligência artificial. Código da questão: 87079 Questão 02 Com base nas características do Big Data, qual das alternativas a seguir melhor descreve a característica de "Variedade"? A A rapidez com que os dados são gerados e processados, muitas vezes em tempo real, exigindo análises imediatas. B A qualidade e confiabilidade dos dados, fundamentais para evitar insights enganosos. C A enorme quantidade de dados gerados a cada segundo por diversas fontes, como redes sociais e sensores IoT. D A capacidade de transformar grandes volumes de dados em informações valiosas que levam a melhores decisões de negócios. E A diversidade de formatos de dados, que podem ser estruturados, semiestruturados ou não estruturados, como textos, imagens e vídeos. Resolução comentada A alternativa que descreve corretamente a característica de "Variedade" se refere à diversidade de formatos de dados. Os dados podem ser estruturados (como tabelas em bancos de dados), semiestruturados (como arquivos XML ou JSON) ou não estruturados (como textos, imagens e vídeos). A variedade de formatos aumenta a complexidade do gerenciamento e análise dos dados, mas também permite uma compreensão mais completa dos fenômenos estudados. Código da questão: 87076 Questão 03 Associe cada técnica de coleta de dados em larga escala com a descrição correta: 1. Coleta de Dados em Tempo Real (Streaming) 2. Coleta de Dados em Lotes (Batch) 3. Extração (ETL) 4. Transformação (ETL) 5. Carga (ETL) Descrições: a) Envolve a captura de informações de várias fontes e a integração dessas informações de forma que sejam acessíveis e utilizáveis para análise. b) Os dados são coletados em lotes e processados periodicamente, frequentemente em processos de análise retrospectiva. c) Durante esta etapa, os dados são limpos, normalizados e agregados conforme necessário para a análise. d) Permite que as organizações capturem e processem dados conforme são gerados, possibilitando análises quase instantâneas e respostas rápidas a eventos. e) Finalmente, os dados transformados são carregados em um data warehouse ou outro sistema de armazenamento no qual serão acessíveis para análise. A 1-d, 2-b, 3-a, 4-c, 5-e. B 1-a, 2-d, 3-e, 4-b, 5-c. C 1-b, 2-d, 3-c, 4-e, 5-a. D 1-c, 2-d, 3-e, 4-b, 5-a. E 1-d, 2-a, 3-b, 4-e, 5-c Resolução comentada 1. Coleta de Dados em Tempo Real (Streaming) – d) Permite que as organizações capturem e processem dados conforme são gerados. 2. Coleta de Dados em Lotes (Batch) – b) Os dados são coletados em lotes e processados periodicamente, frequentemente em processos de análise retrospectiva. 3. Extração (ETL) – a) Envolve a captura de informações de várias fontes e a integração dessas informações. 4. Transformação (ETL) – c) Durante esta etapa, os dados são limpos, normalizados e agregados. 5. Carga (ETL) – e) Finalmente, os dados transformados são carregados em um data warehouse ou outro sistema de armazenamento. Código da questão: 87084 Questão 04 Qual das seguintes ferramentas é mais adequada para o processamento em tempo real de grandes volumes de dados, permitindo a captura e análise quase instantânea? A MongoDB. B Hadoop HDFS. C Apache Kafka. D Apache Spark E Cassandra. Resolução comentada O Apache Kafka é uma ferramenta de mensagens distribuídas que permite a transmissão de dados entre produtores e consumidores com alta taxa de transferência e baixa latência, sendo ideal para o processamento em tempo real de grandes volumes de dados. Código da questão: 87081 Questão 05 Considere as seguintes asserções que tratam das aplicações práticas de Big Data e Cloud Computing em diferentes setores. Quais delas são corretas? 1. No setor de saúde, Big Data e Cloud Computing são utilizados para monitoramento remoto de pacientes por meio de dispositivos vestíveis e sensores IoT. 2. No setor financeiro, algoritmos de machine learning são usados para detectar fraudes em transações financeiras em tempo real. 3. No comércio eletrônico, Big Data é utilizado para prever a demanda de produtos, otimizando os níveis de estoque. 4. No setor de transporte e logística, Cloud Computing é utilizado exclusivamente para a gestão de frotas de veículos. 5. Na educação, Big Data e Cloud Computing facilitam a personalização do aprendizado e a análise de desempenho dos alunos. A Apenas 1, 2 e 5 estão corretas. B Apenas 1, 2 e 3 estão corretas. C Apenas 1, 2, 3 e 5 estão corretas. D Apenas 2, 4 e 5 estão corretas. E Apenas 1, 3 e 4 estão corretas. Resolução comentada Para resolver esta questão, é necessário aplicar o conhecimento sobre as aplicações práticas de Big Data e Cloud Computing em diferentes setores, conforme descrito no texto-base. Asserção 1: No setor de saúde, Big Data e Cloud Computing são utilizados para monitoramento remoto de pacientes por meio de dispositivos vestíveis e sensores IoT. Correta. O texto-base menciona que dispositivos vestíveis e sensores IoT coletam dados de saúde em tempo real, que são armazenados e analisados na nuvem para monitoramento contínuo. Asserção 2: No setor financeiro, algoritmos de machine learning são usados para detectar fraudes em transações financeiras em tempo real. Correta. O texto-base afirma que algoritmos de machine learning analisam transações financeiras em tempo real para identificar atividades suspeitas e prevenir fraudes. Asserção 3: No comércio eletrônico, Big Data é utilizado para prever a demanda de produtos, otimizando os níveis de estoque. Correta. O texto-base menciona que Big Data ajuda a prever a demanda de produtos, otimizando os níveis de estoque e reduzindo custos. Asserção 4: No setor de transporte e logística, Cloud Computing é utilizado exclusivamente para a gestão de frotas de veículos. Incorreta. EmboraCloud Computing seja utilizado para a gestão de frotas, o texto-base também menciona outras aplicações, como a otimização de rotas e a previsão de demanda. Asserção 5: Na educação, Big Data e Cloud Computing facilitam a personalização do aprendizado e a análise de desempenho dos alunos. Correta. O texto-base afirma que plataformas educacionais baseadas na nuvem utilizam dados de desempenho dos alunos para personalizar o conteúdo e os métodos de ensino, além de analisar dados acadêmicos para identificar áreas de melhoria. Código da questão: 87080 Questão 06 Complete as lacunas na frase a seguir, avaliando o impacto da ciência de dados em diferentes áreas empresariais: A aplicação da ciência de dados nas empresas é vasta, abrangendo diversas áreas funcionais que se beneficiam de insights baseados em dados. Por exemplo, no setor de _________, a ciência de dados é usada para análise de risco, detecção de fraudes, previsão de fluxo de caixa e otimização de investimentos. Em _________, a ciência de dados permite a personalização de campanhas de marketing, segmentação de clientes, análise de comportamento de consumidores e previsão de tendências de mercado. Já nas operações, a ciência de dados é aplicada na otimização da _________, gestão de inventário e manutenção preditiva. A finanças; marketing; cadeia de suprimentos. B marketing; operações; previsão de fluxo de caixa. C finanças; operações; análise de risco. D operações; marketing; análise de risco. E marketing; finanças; cadeia de suprimentos. Resolução comentada No setor de finanças, a ciência de dados é usada para análise de risco, detecção de fraudes, previsão de fluxo de caixa e otimização de investimentos. Em marketing, ela permite a personalização de campanhas de marketing, segmentação de clientes, análise de comportamento de consumidores e previsão de tendências de mercado. Nas operações, a ciência de dados é aplicada na otimização da cadeia de suprimentos, gestão de inventário e manutenção preditiva. Código da questão: 87087 Questão 07 Qual das seguintes opções melhor descreve o papel da ciência de dados no processo decisório das empresas? A A ciência de dados permite que as empresas tomem decisões baseadas em intuições e suposições, sem a necessidade de análises profundas. B A ciência de dados é utilizada exclusivamente para a visualização de dados, sem influenciar diretamente a tomada de decisões. C A ciência de dados é uma ferramenta que só pode ser aplicada em áreas de marketing e finanças, sem impacto em outras áreas empresariais. D A ciência de dados fornece uma base objetiva para decisões estratégicas e operacionais, permitindo identificar oportunidades, prever resultados e otimizar processos. E A ciência de dados é utilizada apenas para a coleta de dados e não influencia diretamente as decisões empresariais. Resolução comentada Esta alternativa captura a essência do papel da ciência de dados no processo decisório das empresas. A ciência de dados fornece uma base objetiva para decisões estratégicas e operacionais, permitindo identificar oportunidades, prever resultados e otimizar processos, conforme descrito no texto-base. Código da questão: 87086 Questão 08 Analise as seguintes afirmações que tratam das ferramentas para armazenamento e análise de Big Data e determine se são verdadeiras (V) ou falsas (F): 1. O Hadoop HDFS é projetado para fornecer um sistema de armazenamento distribuído que permite que grandes conjuntos de dados sejam divididos em blocos e distribuídos por um cluster de servidores. 2. O Apache Spark mantém dados intermediários em disco após cada etapa de processamento, o que o torna mais lento para tarefas que precisam repetir várias operações nos mesmos dados. 3. MongoDB é um banco de dados orientado a documentos que armazena dados no formato JSON, permitindo que os documentos tenham estruturas variáveis. 4. Cassandra é um banco de dados NoSQL orientado a colunas que oferece alta disponibilidade e escalabilidade horizontal. 5. HBase é um banco de dados NoSQL que roda em cima do HDFS e é especialmente útil para armazenar grandes volumes de dados esparsos. A V, F, V, V, V. B F, V, F, F, V. C V, V, F, V, F. D F, F, V, V, F. E V, F, V, F, V. Resolução comentada 1. Verdadeiro: O Hadoop HDFS é projetado para fornecer um sistema de armazenamento distribuído. 2. Falso: O Apache Spark mantém dados intermediários na memória, não em disco, tornando-o mais rápido. 3. Verdadeiro: MongoDB armazena dados no formato JSON com estruturas variáveis. 4. Verdadeiro: Cassandra oferece alta disponibilidade e escalabilidade horizontal. 5. Verdadeiro: HBase roda em cima do HDFS e é útil para armazenar grandes volumes de dados esparsos. Código da questão: 87083 Questão 09 Leia o trecho abaixo, considerando os conceitos fundamentais da arquitetura em nuvem: A arquitetura em nuvem baseia-se em três pilares essenciais que garantem sua flexibilidade e confiabilidade: __________, __________ e __________. A __________ assegura que os recursos possam ser ajustados conforme a demanda, a __________ permite que os recursos cresçam e diminuam automaticamente, e a __________ é responsável por manter os serviços acessíveis de forma ininterrupta. Assinale a alternativa que consiga preencher corretamente as duas sequências de lacunas: A Segurança; controle; flexibilidade. B Automação; eficiência; redundância. C Privacidade; acessibilidade; manutenção. D Escalabilidade; elasticidade; disponibilidade. E Desempenho; custo-benefício; confiabilidade. Resolução comentada A arquitetura em nuvem é sustentada por três pilares principais: · Escalabilidade: Permite que os recursos aumentem ou diminuam conforme a demanda, essencial para gerenciar picos e quedas no uso dos serviços. · Elasticidade: Refere-se à capacidade de ajustar os recursos automaticamente, facilitando o uso eficiente e econômico da infraestrutura. · Disponibilidade: Garante que os serviços estejam acessíveis de forma contínua, assegurando que falhas isoladas não interrompam o funcionamento. Esses pilares juntos formam a base de uma arquitetura em nuvem robusta, mantendo os serviços estáveis, acessíveis e ajustáveis conforme necessário. Código da questão: 87094 Questão 10 Analise as seguintes asserções que tratam dos modelos de serviço em nuvem (IaaS, PaaS, SaaS) e determine se são verdadeiras (V) ou falsas (F): 1. IaaS oferece recursos básicos de TI, como servidores, armazenamento e redes, permitindo que as empresas configurem e gerenciem suas próprias infraestruturas. 2. PaaS fornece uma plataforma completa para desenvolvimento de aplicações, sem que o usuário precise gerenciar a infraestrutura subjacente. 3. SaaS oferece software como um serviço acessível via navegador da web, sem a necessidade de instalação ou manutenção por parte do usuário. 4. No modelo IaaS, o usuário tem controle apenas sobre as aplicações e os dados, enquanto o provedor gerencia a infraestrutura. 5. No modelo SaaS, o usuário tem controle sobre o sistema operacional e o middleware, mas não sobre o hardware subjacente. Escolha a alternativa que apresenta a sequência correta de verdadeiro (V) ou falso (F) para as asserções apresentadas: A V, F, V, V, F. B F, F, V, V, F. C F, V, F, V, V. D V, V, F, F, V. E V, V, V, F, F. Resolução comentada 1. IaaS oferece recursos básicos de TI, como servidores, armazenamento e redes, permitindo que as empresas configurem e gerenciem suas próprias infraestruturas. Verdadeiro. O modelo IaaS (Infrastructure as a Service) oferece exatamente esses recursos, permitindo que as empresas configurem e gerenciem suas próprias infraestruturas. 2. PaaS fornece uma plataforma completa para desenvolvimento de aplicações, sem que o usuário precise gerenciar a infraestrutura subjacente. Verdadeiro. O modelo PaaS (Platform as a Service) oferece uma plataforma completa para desenvolvimento de aplicações, sem a necessidade de gerenciar a infraestrutura subjacente. 3. SaaS oferece software como um serviço acessível via navegador da web, sem a necessidade de instalação ou manutençãopor parte do usuário. Verdadeiro. O modelo SaaS (Software as a Service) oferece software acessível via navegador da web, sem a necessidade de instalação ou manutenção. 4. No modelo IaaS, o usuário tem controle apenas sobre as aplicações e os dados, enquanto o provedor gerencia a infraestrutura. Falso. No modelo IaaS, o usuário tem controle sobre o sistema operacional, middleware, e as aplicações, não apenas sobre as aplicações e os dados. 5. No modelo SaaS, o usuário tem controle sobre o sistema operacional e o middleware, mas não sobre o hardware subjacente. Falso. No modelo SaaS, o usuário não tem controle sobre o sistema operacional ou o middleware; o provedor gerencia toda a infraestrutura e o software. Código da questão: 87096