Prévia do material em texto
Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) Autor: André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó 01 de Março de 2026 07931781937 - Amanda Finck Drehmer André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) Índice ..............................................................................................................................................................................................1) Modelagem Multidimensional - Teoria 3 ..............................................................................................................................................................................................2) Modelagem Multidimensional - Questões Comentadas - FGV 33 ..............................................................................................................................................................................................3) Modelagem Multidimensional - Lista de Questões - FGV 50 TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 2 59 Sumário Guia de Estudos da Aula ........................................................................................................................................3 Modelagem Dimensional .......................................................................................................................................4 Conceitos Básicos ................................................................................................................................................4 Tabelas Fato e Dimensão ...................................................................................................................................7 Esquema Estrela e Flocos de Neve ................................................................................................................ 10 Esquema Estrela (Star Schema) .................................................................................................................. 10 Esquema Flocos de Neve (Snowflake Schema) ........................................................................................ 12 Esquema Constelação de Fatos (Fact Constellation Schema) ................................................................ 14 Tipos de Medidas ............................................................................................................................................. 16 Medidas/Fatos Aditivas ............................................................................................................................... 16 Medidas/Fatos Não-Aditivas ....................................................................................................................... 17 Medidas/Fatos Semi-Aditivas ...................................................................................................................... 17 Online Analytical Processing (OLAP) ............................................................................................................. 18 Classificação .................................................................................................................................................. 20 Operações OLAP .......................................................................................................................................... 24 André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 3 59 APRESENTAÇÃO DO TÓPICO Fala, galera! O assunto do nosso tópico é Modelagem Dimensional! Sim, existe a modelagem relacional para bases de dados transacionais e a modelagem dimensional para bases de dados dimensionais. Pessoal, não vou mentir para vocês! Esse é o assunto mais complexo de todas as últimas aulas. Ele exigirá um alto nível de atenção porque são assuntos extremamente abstratos. Hora de fazer um copão de Café + Guaraná + Red Bull, fazer cem polichinelos e tacalhepau na aula... PROFESSOR DIEGO CARVALHO - WWW.INSTAGRAM.COM/PROFESSORDIEGOCARVALHO Galera, todos os tópicos da aula possuem Faixas de Incidência, que indicam se o assunto cai muito ou pouco em prova. Diego, se cai pouco para que colocar em aula? Cair pouco não significa que não cairá justamente na sua prova! A ideia aqui é: se você está com pouco tempo e precisa ver somente aquilo que cai mais, você pode filtrar pelas incidências média, alta e altíssima; se você tem tempo sobrando e quer ver tudo, vejam também as incidências baixas e baixíssimas. Fechado? INCIDÊNCIA EM PROVA: BAIXÍSSIMA INCIDÊNCIA EM PROVA: BAIXA INCIDÊNCIA EM PROVA: MÉDIA INCIDÊNCIA EM PROVA: ALTA INCIDÊNCIA EM PROVA: ALTÍSSIMA Além disso, essas faixas não são por banca – é baseado tanto na quantidade de vezes que caiu em prova independentemente da banca e também em minhas avaliações sobre cada assunto... André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 4 59 GUIA DE ESTUDOS DA AULA O conteúdo de Modelagem Dimensional é complexo e abstrato, exigindo um alto nível de atenção. Eu fiz uma análise de mais de 300 questões de concurso sobre o tema e cheguei à seguinte conclusão: quatro tópicos da aula representam 72% das questões de prova, portanto são considerados o núcleo do que deve ser dominado pelo aluno. São eles: TÓPICOS ORIENTAÇÃO TABELAS FATO E DIMENSÃO Este é o tópico mais cobrado. As questões focam na função desses elementos: a tabela fato armazena medidas quantitativas ou métricas, enquanto a tabela dimensão fornece o contexto descritivo (atributos descritivos). É recorrente a cobrança sobre o relacionamento de um para muitos (1:N) da dimensão para a fato. OPERAÇÕES OLAP O foco principal é diferenciar as operações de navegação dentro do cubo: Drill-Down (descer na hierarquia para aumentar o detalhe); Roll-Up (subir na hierarquia para agregar ou resumir os dados; Slice (seleciona uma fatia única – uma dimensão é fixada); Dice (extrai um subcubo ao selecionar duas ou mais dimensões); Pivot (mudar a perspectiva da visualização). ESQUEMA ESTRELA E FLOCOS DE NEVE A distinção entre os modelos de modelagem é central: Esquema Estrela (Star Schema), em que temos a Tabela Fato central, Dimensões desnormalizadas (menos joins, melhor desempenho em consultas); e o Esquema Floco de Neve (Snowflake Schema), em que as Dimensões são normalizadas (mais joins, economia de armazenamento e hierarquia explícita). CONCEITOS BÁSICOS DE OLAP O foco é o papel do OLAP e sua diferença em relação ao OLTP. O OLAP é utilizado para análise, suporte à decisão. O Cubo de Dados é a estrutura multidimensional que permite a análise sob múltiplos enfoques. OLAP opera sobre dados históricos e é otimizado para leitura/consulta, enquanto OLTP foca em transações atômicas e dados atuais. Use este guia para concentrar seus esforços onde a chance de cobrança em provas é maior. A imagem seguinte sozinha é capaz de responder dezenas de questões de prova: André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalhoo Drill Across descrevendo-o como a operação que permite ao usuário saltar um nível intermediário dentro de uma mesma dimensão. Exemplo: sendo a dimensão Localização composta por Bairro, Cidade, Estado e País, o usuário poderia saltar de bairro direto para país; ou em uma dimensão Período composto com Dia, Semana, Mês, Trimestre e Ano, o usuário poderia pular de Mês direto para Ano. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 30 59 Drill-Through Ainda não acabou: aqui temos também uma polêmica! Na definição clássica, essa operação permite sair da visão agregada do cubo OLAP e acessar os dados detalhados no nível transacional, normalmente armazenados no banco relacional subjacente. Em outras palavras, o usuário parte de um total ou resumo e “atravessa” o cubo para ver as linhas atômicas que compõem aquele valor — por exemplo, sair do total de vendas mensais e visualizar as vendas individuais (notas, pedidos, transações) que geraram aquele agregado. Nesse contexto, o Drill Through não navega hierarquias do cubo; ele romperia a fronteira do cubo e vai ao detalhe relacional. Por outro lado, as questões de concurso cobram uma definição dessa operação como aquela que permite saltar não de uma hierarquia para outra (como no Drill Across) e, sim, de uma dimensão para outra. Em outras palavras, imaginem duas dimensões: Tempo e Localização. De acordo com essa definição, seria possível atravessar, por exemplo, de Mês para Cidade. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 31 59 Pivot (Rotação) Essa operação consiste em reorientar a visualização dos dados, alterando a disposição das dimensões nos eixos da análise, sem modificar o nível de granularidade nem aplicar agregações adicionais. Diferentemente de operações como Roll-Up ou Drill-Down, o Pivot não resume nem detalha os dados; ele apenas troca a perspectiva analítica, permitindo que o usuário observe o mesmo conjunto de informações sob outro ângulo. É uma operação puramente visual e analítica, muito usada para facilitar comparações e melhorar a interpretação dos dados. SÍNTESE DO TÓPICO André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 32 59 QUESTÕES COMENTADAS 1. (FGV / MPE-RJ - 2025) Durante o processo de modelagem multidimensional, alguns analistas criam dimensões normalizadas separadas para cada nível de uma hierarquia, como por exemplo, uma dimensão de data, dimensão de mês, dimensão de trimestre e dimensão do ano e, em seguida, inclui todas essas chaves estrangeiras em uma tabela de fatos. Isso resulta em uma tabela de fatos com dezenas de dimensões hierarquicamente relacionadas. Esse tipo de abordagem deve ser evitada pois cria tabelas de fatos denominadas de a) Octópus. b) Snowflake. c) Centopeia. d) Geográfica. e) Constelação. Comentários: (a) Errado. O termo "Octópus" não é reconhecido na modelagem multidimensional e não se refere a uma estrutura de tabelas de fatos com múltiplas dimensões hierárquicas. (b) Errado. "Snowflake" refere-se a um esquema de banco de dados onde as dimensões são normalizadas, mas não descreve especificamente a complexidade de uma tabela de fatos com muitas dimensões. (c) Correto. O termo "Centopeia" é utilizado para descrever tabelas de fatos que possuem muitas dimensões hierarquicamente relacionadas, resultando em uma estrutura complexa e difícil de gerenciar. (d) Errado. "Geográfica" não é um termo utilizado para descrever tabelas de fatos em modelagem multidimensional, mas sim um tipo de dimensão que pode ser utilizada em análises espaciais. (e) Errado. "Constelação" refere-se a um esquema de modelagem onde múltiplas tabelas de fatos compartilham dimensões, mas não se relaciona diretamente com a complexidade de uma tabela de fatos com muitas dimensões hierárquicas. Gabarito: Letra C 2. (FGV / MPE-RJ - 2025) Segundo Kimball, considerado um dos pais do Datawarehouse, uma tabela de fatos é um elemento essencial na modelagem multidimensional de dados. Acerca das tabelas de fatos, avalie as afirmativas a seguir. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 33 59 I. São as tabelas dominantes em um esquema de modelagem multidimensional. Elas armazenam grande quantidade de dados históricos, em função do tempo que pode ser dos tipos string ou numéricos. II. Os tipos de medidas presentes na tabela de fatos são apenas aditivas, semi-aditivas e não aditivas. III. O uso de medidas com valores nulos é possível nas tabelas de fatos mas não são computáveis por funções agregadas (SUM, COUNT, MIN, MAX e AVG) porque esses nulos causam uma violação de integridade referencial. Está correto o que se afirma em a) I, apenas. b) II, apenas. c) III, apenas. d) I e III, apenas. e) II e III, apenas. Comentários: (I) Correto. As tabelas de fatos são, de fato, dominantes em esquemas de modelagem multidimensional, armazenando dados históricos, mas os tipos de dados são geralmente numéricos, não string. (II) Errado. As tabelas de fatos podem conter medidas aditivas, semi-aditivas e não aditivas, mas também podem incluir medidas que não se encaixam nessas categorias. (III) Errado. Embora valores nulos possam estar presentes, eles não causam violação de integridade referencial, mas sim podem afetar os resultados das funções agregadas. Gabarito: Letra B 3. (FGV / MPU - 2025) A analista de Business Intelligence Lúcia está elaborando o modelo multidimensional do Data Mart Processos Judiciais (DMProcJ). Durante sua análise, ela observou que o número do processo judicial (num_processo) não é uma métrica, mas sim um atributo importante, pois representa o menor grão do DMProcJ e pode ser usado para navegar até o sistema transacional de origem para analisar outras informações de um processo específico. Para modelar o atributo num_processo, Lúcia deve implementar um(a): a) fato não aditivo; b) dimensão ponte; c) operação drill across; André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 34 59 d) dimensão degenerada; e) data mart dependente. Comentários: (a) Errado. Fatos não aditivos são medidas que não podem ser somadas, como contagens, mas o atributo num_processo é uma chave de navegação, não uma métrica. (b) Errado. Dimensões ponte são usadas para resolver muitos-para-muitos entre dimensões, o que não se aplica ao caso do num_processo, que é um atributo singular. (c) Errado. A operação drill across permite comparar dados de diferentes fontes, mas não se relaciona diretamente coma modelagem do atributo num_processo. (d) Correto. A dimensão degenerada é utilizada para armazenar atributos que não são medidas, como o num_processo, permitindo sua utilização como chave em análises. (e) Errado. Um data mart dependente é um subconjunto de um data warehouse, não se aplica à modelagem de atributos como o num_processo. Gabarito: Letra D 4. (FGV / MPU - 2025) O analista Flávio precisa analisar diversos dados contábeis do MPU sob diferentes perspectivas ao longo do tempo para fundamentar suas perícias. Para isso, ele recorreu ao ambiente analítico do MPU, a fim de utilizar uma ferramenta que permita realizar operações de roll-up, drilldown, slice, dice e pivot. Para apoiar suas perícias, Flávio deve usar uma ferramenta: a) ETL; b) OLAP; c) SciPy; d) Postgres; e) Data Lake. Comentários: (a) Errado. ETL (Extract, Transform, Load) é um processo de integração de dados, mas não é uma ferramenta analítica que permite operações como roll-up e drilldown. (b) Correto. OLAP (Online Analytical Processing) é uma tecnologia que permite a análise multidimensional de dados, possibilitando operações como roll-up, drilldown, slice, dice e pivot, essenciais para análises contábeis. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 35 59 (c) Errado. SciPy é uma biblioteca de Python voltada para computação científica e matemática, não sendo uma ferramenta específica para análise de dados contábeis ou operações OLAP. (d) Errado. Postgres é um sistema de gerenciamento de banco de dados relacional, que pode armazenar dados, mas não é uma ferramenta analítica que suporte operações OLAP diretamente. (e) Errado. Data Lake é uma arquitetura de armazenamento de dados que permite armazenar grandes volumes de dados em seu formato bruto, mas não é uma ferramenta analítica para operações como roll-up e drilldown. Gabarito: Letra B 5. (FGV / TCE-RR - 2025) Você, como analista de dados do TCE-RR, pode ser incumbido de utilizar um cubo OLAP para avaliar as auditorias do tribunal pelas dimensões cidade, tempo e custo. Considere que a análise possua a seguinte cadeia de ações: filtro para apenas considerar o último ano, detalhamento de ano para mês e agregação de mês para trimestre. A sequência de ações OLAP será: a) Slice, Drill Down e Roll Up. b) Slice Down, Roll Across e Drill Up. c) Slice, Dice e Roll Up. d) Dice, Drill Down e Roll Up. e) Dice, Drill Through e Drill Across. Comentários: (a) Correto. A sequência de ações OLAP descrita está correta: "Slice" para filtrar dados, "Drill Down" para detalhar de ano para mês e "Roll Up" para agregar de mês para trimestre. (b) Errado. "Slice Down" e "Roll Across" não são terminologias padrão em OLAP; o correto seria "Drill Down" e "Roll Up". (c) Errado. Embora "Slice" e "Roll Up" estejam corretos, "Dice" não se aplica na sequência apresentada, pois não é mencionado o recorte de dados em múltiplas dimensões. (d) Errado. "Dice" não é a ação correta para a sequência, e "Drill Down" e "Roll Up" estão fora de ordem na descrição da análise. (e) Errado. "Drill Through" e "Drill Across" não são ações que se aplicam na sequência apresentada, que requer "Drill Down" e "Roll Up". Gabarito: Letra A André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 36 59 ==2f4e8== 6. (FGV / DATAPREV - 2024) Uma empresa de varejo deseja analisar suas vendas de forma mais estratégica, buscando identificar tendências, sazonalidades e oportunidades de melhoria. Para isso, decidiram implementar um sistema de OLAP (Online Analytical Processing) que permita a análise multidimensional de seus dados de vendas, armazenados em um Data Warehouse. Considere as seguintes afirmativas sobre OLAP (Online Analytical Processing) nesse contexto: I. OLAP permite a análise multidimensional de grandes volumes de dados, possibilitando a exploração de informações sob diferentes perspectivas, como tempo, produto e região. II. As operações de OLAP incluem slice (fatiar), dice (cortar em cubos), drill-down (detalhar) e roll- up (agregar), que permitem navegar pelos dados em diferentes níveis de granularidade. III. OLAP é utilizado principalmente para processar transações em tempo real, como vendas e pagamentos, garantindo a consistência dos dados. IV. O Data Warehouse é um componente essencial para o OLAP, pois armazena os dados históricos de forma integrada e estruturada, facilitando a análise multidimensional. Está correto o que se afirma em a) I, apenas. b) II, apenas. c) I e II, apenas. d) I, II e IV, apenas. e) I, II, III e IV. Comentários: (I) Correto. OLAP realmente permite a análise multidimensional, possibilitando a exploração de dados sob diversas perspectivas, como tempo, produto e região, essencial para a tomada de decisões estratégicas. (II) Correto. As operações de OLAP, como slice, dice, drill-down e roll-up, são fundamentais para a navegação e análise dos dados em diferentes níveis de granularidade, permitindo insights mais profundos. (III) Errado. OLAP não é voltado para o processamento de transações em tempo real, mas sim para análise de dados históricos, enquanto sistemas OLTP (Online Transaction Processing) são utilizados para transações em tempo real. (IV) Correto. O Data Warehouse é crucial para o OLAP, pois armazena dados históricos de forma integrada e estruturada, facilitando a análise multidimensional e a geração de relatórios. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 37 59 Gabarito: Letra D 7. (FGV / TRF - 1ª REGIÃO - 2024) Em um ambiente de Business Intelligence, Júlio implementou uma ferramenta OLAP para apoiar a análise de dados do Data Mart do TRF1. Uma das consultas mais realizadas é o total de processos por tipo e por data. A operação OLAP que permite a geração de um subcubo é a: a) slice b) dice c) drill up d) rotate e) pivot Comentários: (a) Errado. A operação "slice" refere-se à seleção de uma única dimensão de um cubo, resultando em uma nova tabela, mas não gera um subcubo. (b) Correto. A operação "dice" permite a seleção de múltiplas dimensões de um cubo, resultando em um subcubo que contém um conjunto específico de dados, ideal para análises detalhadas. (c) Errado. "Drill up" é uma operação que reduz a granularidade dos dados, agregando informações, mas não cria um subcubo. (d) Errado. "Rotate" não é uma operação padrão em OLAP; geralmente refere-se à reorientação de dados, mas não gera subcubos. (e) Errado. "Pivot" refere-se à reorganização dos dados em uma tabela, mas não resulta na criação de um subcubo. Gabarito: Letra B 8. (FGV / EPE - 2024) A produção e a disseminação de dados corporativos cresceram muito rapidamente, o que requer tecnologias de função analítica adequadas ao volume de dados envolvidos, visando extrair informações úteis e viabilizar a criação de relatórios analíticos. As tecnologias descritas recebem, na literatura, o nome de a) Big Data. b) Data Warehouse. c) Map Reduce. d) OnlineAnalytical Processing (OLAP). e) Online Transaction Processing (OLTP). André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 38 59 Comentários: (a) Errado. Big Data refere-se ao conjunto de tecnologias e práticas para lidar com grandes volumes de dados, mas não se concentra especificamente em análises e relatórios. (b) Errado. Data Warehouse é um repositório de dados estruturados para análise, mas não é uma tecnologia analítica em si, e sim um sistema que armazena dados para análises posteriores. (c) Errado. Map Reduce é um modelo de programação para processamento de grandes volumes de dados, mas não é uma tecnologia analítica voltada para relatórios. (d) Correto. Online Analytical Processing (OLAP) é uma tecnologia analítica que permite a análise multidimensional de dados, facilitando a criação de relatórios e extração de informações úteis. (e) Errado. Online Transaction Processing (OLTP) é um sistema de processamento de transações em tempo real, focado em operações do dia a dia, não em análises e relatórios. Gabarito: Letra D 9. (FGV / AL-TO - 2024) A implementação de sistemas OLAP (On Line Analytical Processing) pode utilizar alguma opção tecnológica tal como ROLAP, MOLAP, entre outras. Assinale a opção que descreve corretamente uma característica do ROLAP (Relational OLAP). a) armazena os dados em arquivos de texto simples, com manipulação ágil e eficiente dos dados. b) armazena os dados em cubos multidimensionais pré-calculados para consultas rápidas. c) armazena os dados em um banco de dados relacional, aproveitando o poder das consultas SQL para análises. d) otimiza consultas em tempo real, armazenando os dados em cubos multidimensionais pré- calculados. e) requer a criação de uma estrutura de dados hierárquica multinível para armazenar os dados. Comentários: (a) Errado. ROLAP não utiliza arquivos de texto simples, mas sim bancos de dados relacionais, que permitem consultas complexas e eficientes. (b) Errado. Essa descrição se aplica ao MOLAP, que utiliza cubos multidimensionais para otimizar consultas, enquanto ROLAP utiliza bancos de dados relacionais. (c) Correto. ROLAP armazena dados em bancos de dados relacionais, permitindo o uso de SQL para realizar análises complexas e dinâmicas, aproveitando a estrutura relacional. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 39 59 (d) Errado. Essa característica é típica do MOLAP, que utiliza cubos multidimensionais pré-calculados para otimizar consultas em tempo real, enquanto ROLAP não faz isso. (e) Errado. ROLAP não requer uma estrutura hierárquica multinível específica; ele usa a estrutura relacional existente para armazenar e consultar dados. Gabarito: Letra C 10. (FGV / AL-PR - 2024) Os sistemas OLAP, com vistas a auxiliar o processo de tomada de decisão, geralmente oferecem um conjunto de operações pré-programadas. A operação que consiste em níveis cada vez maiores de detalhamento na análise de uma determinada dimensão é conhecida como a) drill-down. b) pivoting. c) rolap. d) slice e dice. e) SMP. Comentários: (a) Correto. A operação "drill-down" permite que o usuário explore dados em níveis de detalhamento cada vez maiores, facilitando uma análise mais profunda das informações em uma dimensão específica; (b) Errado. "Pivoting" refere-se à reorganização dos dados em uma tabela dinâmica, permitindo visualizar diferentes perspectivas, mas não envolve detalhamento progressivo; (c) Errado. ROLAP (Relational OLAP) é uma abordagem que utiliza bancos de dados relacionais para armazenar dados multidimensionais, mas não é uma operação de análise; (d) Errado. "Slice e dice" são operações que permitem segmentar e reorganizar dados, mas não se referem ao aumento de detalhamento em uma dimensão específica; (e) Errado. SMP (Symmetric Multiprocessing) é uma arquitetura de processamento paralelo e não está relacionada a operações de análise em sistemas OLAP. Gabarito: Letra A 11. (FGV / CVM - 2024) O ambiente analítico da CVM armazena dados no formato multidimensional, implementa um cubo de dados e disponibiliza uma ferramenta OLAP para apoiar os analistas no André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 40 59 desempenho de suas funções. Diante da grande quantidade de dados disponíveis, eles precisam reduzir o seu domínio de análise. Para isso, a operação OLAP, que extrai um subcubo da seleção de duas ou mais dimensões de um cubo de dados, é a: a) Slice; b) Dice; c) Pivot; d) Roll up; e) Drill down. Comentários: (a) Errado. A operação "Slice" refere-se à seleção de uma única dimensão de um cubo de dados, resultando em uma fatia do cubo, e não na extração de um subcubo com múltiplas dimensões. (b) Correto. A operação "Dice" permite a seleção de um subcubo ao extrair dados de duas ou mais dimensões, filtrando as informações de interesse, o que se alinha perfeitamente à descrição dada. (c) Errado. "Pivot" é uma operação que reorganiza a visualização dos dados, permitindo a troca de dimensões, mas não extrai um subcubo de múltiplas dimensões. (d) Errado. "Roll up" refere-se à agregação de dados, onde se reduz a granulação dos dados, mas não envolve a extração de um subcubo. (e) Errado. "Drill down" é o oposto do "Roll up", permitindo a visualização de dados em um nível mais detalhado, mas não se relaciona com a extração de um subcubo. Gabarito: Letra B 12. (FGV / DATAPREV - 2024) Uma empresa de varejo online deseja analisar suas vendas para identificar tendências e oportunidades de melhoria. Para isso, eles implementaram um modelo dimensional de dados, onde as vendas são registradas em uma tabela de fatos, e informações sobre produtos, clientes, tempo e localização são armazenadas em tabelas de dimensão. Considerando o cenário de uma empresa de varejo online que utiliza um modelo dimensional de dados para analisar suas vendas, assinale a opção correta. a) As tabelas de fatos armazenam informações descritivas sobre produtos, clientes e tempo. b) As dimensões são utilizadas para consolidar dados de diferentes tabelas de fatos. c) A modelagem dimensional é aplicável exclusivamente a dados estruturados e numéricos. d) As tabelas de dimensão fornecem contexto para as métricas de vendas armazenadas nas tabelas de fatos. e) A modelagem dimensional ignora completamente os princípios da normalização de bancos de dados. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 41 59 Comentários: (a) Errado. Tabelas de fatos armazenam dados quantitativos, como vendas, enquanto as dimensões contêm informações descritivas sobre produtos, clientes e tempo. (b) Errado. Dimensões não consolidam dados de diferentes tabelas de fatos; elas fornecem contexto e detalhamentopara as métricas nas tabelas de fatos. (c) Errado. A modelagem dimensional pode ser aplicada a dados estruturados e não estruturados, não se limitando apenas a dados numéricos. (d) Correto. Tabelas de dimensão oferecem contexto às métricas de vendas nas tabelas de fatos, permitindo análises mais ricas e informativas. (e) Errado. A modelagem dimensional considera a normalização, embora utilize desnormalização para otimizar consultas e desempenho em análises. Gabarito: Letra D 13. (FGV / TRF - 1ª REGIÃO - 2024) No sistema transacional da organização PrevData, há o registro dos pedidos de licença médica de todos os seus funcionários. Para apoiar as campanhas de prevenção, foi levantado o seguinte requisito analítico: quantidade de atestados de crise respiratória durante as estações do ano, ao longo dos últimos 10 anos. Para atender a esse requisito analítico, deve ser elaborado o Modelo Multidimensional de Dados com a estrutura: a) FATO_ATESTADOS (Quantidade, Descrição) DIMENSÃO_TEMPO (Ano, Estação) b) FATO_ATESTADOS (Estação, ANO_ATESTADO >= SYSDATE - INTERVAL '10' YEAR) DIMENSÃO_TIPO_ATESTADO (Descrição) c) DIMENSÃO_ATESTADOS (Quantidade, Estação) DIMENSÃO_TIPO_ATESTADO (Descrição) d) FATO_ATESTADOS (Quantidade) DIMENSÃO_TEMPO (Ano, Estação) DIMENSÃO_TIPO_ATESTADO (Descrição) e) FATO_ATESTADOS (Quantidade, Tipo_Atestado) DIMENSÃO_TEMPO (DATEDIFF(ANO_ATESTADO,-10) Comentários: André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 42 59 (a) Errado. A estrutura proposta não inclui uma dimensão adequada para categorizar os tipos de atestados, o que é essencial para uma análise completa dos dados. (b) Errado. A condição de filtro "ANO_ATESTADO >= SYSDATE - INTERVAL '10' YEAR" não é uma estrutura de modelo multidimensional, mas sim uma cláusula de consulta, inadequada para a definição do modelo. (c) Errado. A proposta apresenta uma dimensão de atestados, mas não inclui uma tabela de fatos que permita a análise quantitativa dos dados, essencial para o modelo multidimensional. (d) Correto. A estrutura apresentada permite registrar a quantidade de atestados como fato, enquanto as dimensões de tempo (Ano, Estação) e tipo de atestado (Descrição) possibilitam análises detalhadas e segmentadas. (e) Errado. A expressão "DATEDIFF(ANO_ATESTADO,-10)" não é uma forma válida de definir uma dimensão no modelo, além de não atender ao requisito de análise dos últimos 10 anos de forma clara. Gabarito: Letra D 14. (FGV / CVM - 2024) Para apoiar análises sobre os fundadores de empresas ao longo do tempo, elaborou-se, inicialmente, o seguinte modelo multidimensional de dados, no qual a tabela FATO FUNDAÇÃO EMPRESAS se relaciona com múltiplos valores da tabela DIMENSÃO FUNDADOR. No caso apresentado, a implementação de uma dimensão multivalorada deve ser realizada por meio da aplicação da técnica de modelagem multidimensional: a) Tabela Ponte (Bridge Tables); b) Tabela Fato sem Fatos (Factless Fact Tables); c) Dimensão Degenerada (Degenerate Dimensions); d) Dimensão Floco de Neve (Snowflaked Dimensions); e) Dimensão que Desempenha Múltiplos Papéis (Role-Playing Dimensions). Comentários: André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 43 59 (a) Correto. A Tabela Ponte é utilizada para gerenciar relações multivaloradas entre dimensões e fatos, permitindo que múltiplos valores de uma dimensão se relacionem com um único fato, como no caso dos fundadores de empresas. (b) Errado. Tabelas Fato sem Fatos são usadas para registrar eventos que não possuem medidas, não se aplicando ao contexto de múltiplos valores de uma dimensão. (c) Errado. Dimensões Degeneradas são aquelas que não têm atributos próprios e são representadas apenas por chaves, não servindo para modelar relações multivaloradas. (d) Errado. Dimensões Floco de Neve são uma forma de normalização de dimensões, mas não são adequadas para lidar com múltiplos valores de uma dimensão em relação a um fato. (e) Errado. Dimensões que Desempenham Múltiplos Papéis referem-se a uma dimensão que pode ser utilizada em diferentes contextos, mas não abordam a questão de multivaloração de forma direta. Gabarito: Letra A 15. (FGV / AL-PR - 2024) Seja o modelo multidimensional representado a seguir, refletindo uma dinâmica de vendas de produtos por vendedores e por região. Considere que I. os campos indicados como são os identificadores de suas respectivas tabelas; II. na tabela “Vendas”, o atributo “cod_vendedor” referencia o identificador cod_vendedor da tabela “Vendedor”. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 44 59 III. na tabela “Vendas”, o atributo “cod_regiao” referencia o identificador cod_regiao da tabela “Região”. IV. na tabela “Vendas”, o atributo “cod_produto” referencia o identificador cod_produto da tabela “Produto”. V. na tabela “Região”, o atributo “cod_cidade” referencia o identificador cod_cidade da tabela “Cidade”. Ao analisar a semântica do modelo, é correto inferir que a) a dimensão tempo está representada como tabela oculta. b) a menor granularidade de tempo é data da venda. c) existem quatro tabelas fato e uma tabela dimensão. d) implementa o esquema multidimensional estrela. e) um registro específico de venda pode se relacionar a várias cidades. Comentários: (a) Errado. Não há indicação de que exista uma tabela oculta representando a dimensão tempo. A data da venda aparece como atributo na tabela de fatos, e não como dimensão separada; (b) Correto. O atributo data_venda na tabela Vendas indica que a menor granularidade temporal disponível para análise é a data individual de cada venda, e não mês ou ano; (c) Errado. A tabela Vendas é a única tabela fato, e as demais são dimensões (Produto, Vendedor, Região, Cidade); (d) Errado. O modelo não segue exatamente o esquema estrela, pois há uma ligação entre dimensões (Região → Cidade), o que caracteriza um esquema floco de neve (snowflake); (e) Errado. A relação entre Cidade e Região é de 1 para muitos (uma cidade pode estar em várias regiões), mas cada venda está ligada a uma única região, e essa a uma única cidade — logo, uma venda não se relaciona a várias cidades. Gabarito: Letra B 16. (FGV / CGE-PB - 2024) Maria está implementando o Audit-DataMart para apoiar análises sobre a quantidade de auditorias realizadas por cidade e por período. Para isso, Maria elaborou o modelo multidimensional de dados no qual a dimensão tempo se relaciona com a tabela fato duas vezes, uma representando a data de início da auditoria e a outra representando a data do fim da André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 45 59 auditoria, conforme ilustrado a seguir. A técnica de modelagem multidimensionalde dados utilizada por Maria para referenciar múltiplas vezes uma única dimensão física na tabela fato é: a) Non-Additive Fact; b) Degenerate Dimension; c) Role Playing Dimension; d) Dimension Surrogate Key; e) Calendar Date Dimensions. Comentários: (a) Errado. Non-Additive Fact refere-se a fatos que não podem ser somados em todas as dimensões, o que não se aplica ao caso de múltiplas referências a uma dimensão. (b) Errado. Degenerate Dimension é uma dimensão que não possui atributos descritivos e é representada apenas por uma chave, não se relacionando com múltiplas instâncias da mesma dimensão. (c) Correto. Role Playing Dimension é a técnica que permite que uma única dimensão, como a dimensão tempo, seja utilizada em diferentes contextos dentro da tabela fato, como início e fim da auditoria. (d) Errado. Dimension Surrogate Key refere-se a uma chave substituta usada para identificar uma dimensão, mas não aborda a questão de múltiplas referências à mesma dimensão na tabela fato. (e) Errado. Calendar Date Dimensions não é uma técnica de modelagem, mas sim uma descrição de dimensões que representam datas, não se referindo ao uso múltiplo da mesma dimensão em um modelo. Gabarito: Letra C 17. (FGV / CGM de Belo Horizonte - MG - 2024) O modelo multidimensional é composto por diversos elementos, por exemplo, dimensões, chaves, medidas e tabelas de fatos. As tabelas de fatos podem ser do tipo a) star e snowflake. b) mutivalorate dataset e surrogate. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 46 59 c) uncommited dataset, snapshot e dynamic dataset. d) transaction, periodic snapshot e accumulating snapshot. Comentários: (a) Errado. As tabelas de fatos não são classificadas como "star" e "snowflake", que se referem a modelos de esquema de banco de dados, não a tipos de tabelas de fatos. (b) Errado. "Mutivalorate dataset" e "surrogate" não são tipos de tabelas de fatos, mas sim conceitos relacionados a dados e chaves em modelagem de dados. (c) Errado. "Uncommited dataset", "snapshot" e "dynamic dataset" não são categorias reconhecidas de tabelas de fatos em um modelo multidimensional. (d) Correto. As tabelas de fatos podem ser classificadas como "transaction", "periodic snapshot" e "accumulating snapshot", que são tipos que refletem diferentes formas de armazenar dados em um modelo multidimensional. Gabarito: Letra D 18. (FGV / CGE-SC - 2023) Sobre a proposta geral do modelo dimensional em um Data Warehouse, não é correto afirmar que o modelo dimensional a) cobre tanto dados detalhados quanto dados sumarizados. b) cobre toda a empresa, e não apenas departamentos. c) é escalável, podendo entregar relatórios com trilhões de registros. d) é arquitetado apenas para um uso previsível, geralmente cobrindo os 10 relatórios mais acessados. e) pode integrar diversas fontes de dados operacionais da empresa, inclusive fontes externas. Comentários: (a) Errado. O modelo dimensional realmente cobre dados detalhados e sumarizados, permitindo análises em diferentes níveis de granularidade. (b) Errado. O modelo dimensional é projetado para abranger toda a empresa, facilitando a análise integrada de dados de diferentes departamentos. (c) Errado. O modelo dimensional é escalável e pode lidar com grandes volumes de dados, incluindo relatórios com trilhões de registros. (d) Correto. O modelo dimensional não é limitado a um uso previsível e pode ser adaptado para atender a uma variedade de necessidades analíticas, não se restringindo apenas aos 10 relatórios mais acessados. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 47 59 (e) Errado. O modelo dimensional é capaz de integrar diversas fontes de dados, tanto operacionais quanto externas, proporcionando uma visão abrangente da informação. Gabarito: Letra D 19. (FGV / DPE-RS - 2023) Observe a seguinte arquitetura básica de uma solução de Business Intelligence implementada na empresa CleverBI. O elemento arquitetural da solução de BI da CleverBI implementado por meio de operações OLAP, como slice, rotate, drill-down e drill-up, é o: a) ETL; b) Stage Area; c) Banco de Dados Multidimensionais; d) Análises Multidimensionais; e) Busca de Padrões. Comentários: (a) Errado. ETL (Extract, Transform, Load) refere-se ao processo de extração, transformação e carregamento de dados, não às operações OLAP mencionadas. (b) Errado. Stage Area é uma área de armazenamento temporário para dados antes de serem carregados em um data warehouse, não está diretamente relacionada às operações OLAP. (c) Errado. Banco de Dados Multidimensionais é uma estrutura que suporta OLAP, mas as operações específicas como slice e drill-down são mais diretamente relacionadas a análises multidimensionais. (d) Correto. Análises Multidimensionais referem-se ao uso de operações OLAP, como slice, rotate, drill- down e drill-up, para explorar e analisar dados de forma interativa. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 48 59 (e) Errado. Busca de Padrões refere-se a técnicas de mineração de dados, que não se relacionam diretamente com as operações OLAP descritas na questão. Gabarito: Letra D 20. (FGV / SMPOG de Belo Horizonte - MG - 2023) Assinale a opção que indica a operação OLAP que permite analisar os dados de um Data Warehouse em níveis de agregação progressivamente mais detalhados, ou de menor granularidade. a) Slide. b) Pivot. c) Roll-up. d) Drill-down. Comentários: (a) Errado. A operação "Slide" não é uma terminologia padrão em OLAP e não se refere a uma análise de dados em níveis de agregação. (b) Errado. "Pivot" é uma operação que permite reorganizar dados, mas não se relaciona diretamente com a análise em níveis de agregação ou granularidade. (c) Errado. "Roll-up" é a operação que agrega dados em níveis superiores, mas a questão pede a operação que analisa dados em níveis mais detalhados, que é o "Drill-down". (d) Correto. "Drill-down" é a operação OLAP que permite a análise de dados em níveis de agregação mais detalhados, aumentando a granularidade da informação. Gabarito: Letra D André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 49 59 LISTA DE QUESTÕES 1. (FGV / MPE-RJ - 2025) Durante o processo de modelagem multidimensional, alguns analistas criam dimensões normalizadas separadas para cada nível de uma hierarquia, como por exemplo, uma dimensão de data, dimensão de mês, dimensão de trimestre e dimensão do ano e, em seguida, inclui todas essas chaves estrangeiras em uma tabela de fatos. Isso resulta em uma tabela de fatos com dezenas de dimensões hierarquicamente relacionadas. Esse tipo de abordagem deve ser evitada pois cria tabelas de fatos denominadasde a) Octópus. b) Snowflake. c) Centopeia. d) Geográfica. e) Constelação. 2. (FGV / MPE-RJ - 2025) Segundo Kimball, considerado um dos pais do Datawarehouse, uma tabela de fatos é um elemento essencial na modelagem multidimensional de dados. Acerca das tabelas de fatos, avalie as afirmativas a seguir. I. São as tabelas dominantes em um esquema de modelagem multidimensional. Elas armazenam grande quantidade de dados históricos, em função do tempo que pode ser dos tipos string ou numéricos. II. Os tipos de medidas presentes na tabela de fatos são apenas aditivas, semi-aditivas e não aditivas. III. O uso de medidas com valores nulos é possível nas tabelas de fatos mas não são computáveis por funções agregadas (SUM, COUNT, MIN, MAX e AVG) porque esses nulos causam uma violação de integridade referencial. Está correto o que se afirma em a) I, apenas. b) II, apenas. c) III, apenas. d) I e III, apenas. e) II e III, apenas. 3. (FGV / MPU - 2025) A analista de Business Intelligence Lúcia está elaborando o modelo multidimensional do Data Mart Processos Judiciais (DMProcJ). Durante sua análise, ela observou André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 50 59 que o número do processo judicial (num_processo) não é uma métrica, mas sim um atributo importante, pois representa o menor grão do DMProcJ e pode ser usado para navegar até o sistema transacional de origem para analisar outras informações de um processo específico. Para modelar o atributo num_processo, Lúcia deve implementar um(a): a) fato não aditivo; b) dimensão ponte; c) operação drill across; d) dimensão degenerada; e) data mart dependente. 4. (FGV / MPU - 2025) O analista Flávio precisa analisar diversos dados contábeis do MPU sob diferentes perspectivas ao longo do tempo para fundamentar suas perícias. Para isso, ele recorreu ao ambiente analítico do MPU, a fim de utilizar uma ferramenta que permita realizar operações de roll-up, drilldown, slice, dice e pivot. Para apoiar suas perícias, Flávio deve usar uma ferramenta: a) ETL; b) OLAP; c) SciPy; d) Postgres; e) Data Lake. 5. (FGV / TCE-RR - 2025) Você, como analista de dados do TCE-RR, pode ser incumbido de utilizar um cubo OLAP para avaliar as auditorias do tribunal pelas dimensões cidade, tempo e custo. Considere que a análise possua a seguinte cadeia de ações: filtro para apenas considerar o último ano, detalhamento de ano para mês e agregação de mês para trimestre. A sequência de ações OLAP será: a) Slice, Drill Down e Roll Up. b) Slice Down, Roll Across e Drill Up. c) Slice, Dice e Roll Up. d) Dice, Drill Down e Roll Up. e) Dice, Drill Through e Drill Across. 6. (FGV / DATAPREV - 2024) Uma empresa de varejo deseja analisar suas vendas de forma mais estratégica, buscando identificar tendências, sazonalidades e oportunidades de melhoria. Para isso, decidiram implementar um sistema de OLAP (Online Analytical Processing) que permita a análise multidimensional de seus dados de vendas, armazenados em um Data Warehouse. Considere as seguintes afirmativas sobre OLAP (Online Analytical Processing) nesse contexto: I. OLAP permite a análise multidimensional de grandes volumes de dados, possibilitando a exploração de informações sob diferentes perspectivas, como tempo, produto e região. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 51 59 II. As operações de OLAP incluem slice (fatiar), dice (cortar em cubos), drill-down (detalhar) e roll- up (agregar), que permitem navegar pelos dados em diferentes níveis de granularidade. III. OLAP é utilizado principalmente para processar transações em tempo real, como vendas e pagamentos, garantindo a consistência dos dados. IV. O Data Warehouse é um componente essencial para o OLAP, pois armazena os dados históricos de forma integrada e estruturada, facilitando a análise multidimensional. Está correto o que se afirma em a) I, apenas. b) II, apenas. c) I e II, apenas. d) I, II e IV, apenas. e) I, II, III e IV. 7. (FGV / TRF - 1ª REGIÃO - 2024) Em um ambiente de Business Intelligence, Júlio implementou uma ferramenta OLAP para apoiar a análise de dados do Data Mart do TRF1. Uma das consultas mais realizadas é o total de processos por tipo e por data. A operação OLAP que permite a geração de um subcubo é a: a) slice b) dice c) drill up d) rotate e) pivot 8. (FGV / EPE - 2024) A produção e a disseminação de dados corporativos cresceram muito rapidamente, o que requer tecnologias de função analítica adequadas ao volume de dados envolvidos, visando extrair informações úteis e viabilizar a criação de relatórios analíticos. As tecnologias descritas recebem, na literatura, o nome de a) Big Data. b) Data Warehouse. c) Map Reduce. d) Online Analytical Processing (OLAP). e) Online Transaction Processing (OLTP). André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 52 59 9. (FGV / AL-TO - 2024) A implementação de sistemas OLAP (On Line Analytical Processing) pode utilizar alguma opção tecnológica tal como ROLAP, MOLAP, entre outras. Assinale a opção que descreve corretamente uma característica do ROLAP (Relational OLAP). a) armazena os dados em arquivos de texto simples, com manipulação ágil e eficiente dos dados. b) armazena os dados em cubos multidimensionais pré-calculados para consultas rápidas. c) armazena os dados em um banco de dados relacional, aproveitando o poder das consultas SQL para análises. d) otimiza consultas em tempo real, armazenando os dados em cubos multidimensionais pré- calculados. e) requer a criação de uma estrutura de dados hierárquica multinível para armazenar os dados. 10. (FGV / AL-PR - 2024) Os sistemas OLAP, com vistas a auxiliar o processo de tomada de decisão, geralmente oferecem um conjunto de operações pré-programadas. A operação que consiste em níveis cada vez maiores de detalhamento na análise de uma determinada dimensão é conhecida como a) drill-down. b) pivoting. c) rolap. d) slice e dice. e) SMP. 11. (FGV / CVM - 2024) O ambiente analítico da CVM armazena dados no formato multidimensional, implementa um cubo de dados e disponibiliza uma ferramenta OLAP para apoiar os analistas no desempenho de suas funções. Diante da grande quantidade de dados disponíveis, eles precisam reduzir o seu domínio de análise. Para isso, a operação OLAP, que extrai um subcubo da seleção de duas ou mais dimensões de um cubo de dados, é a: a) Slice; b) Dice; c) Pivot; d) Roll up; e) Drill down. 12. (FGV / DATAPREV - 2024) Uma empresa de varejo online deseja analisar suas vendas para identificar tendências e oportunidades de melhoria. Para isso, eles implementaram um modelo dimensional de dados, onde as vendas são registradas em uma tabela de fatos, e informações sobre produtos, clientes, tempo e localização são armazenadas em tabelas de dimensão. Considerando o cenário de uma empresa de varejo online que utiliza um modelo dimensional de dados para analisar suas vendas, assinale a opção correta.André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 53 59 ==2f4e8== a) As tabelas de fatos armazenam informações descritivas sobre produtos, clientes e tempo. b) As dimensões são utilizadas para consolidar dados de diferentes tabelas de fatos. c) A modelagem dimensional é aplicável exclusivamente a dados estruturados e numéricos. d) As tabelas de dimensão fornecem contexto para as métricas de vendas armazenadas nas tabelas de fatos. e) A modelagem dimensional ignora completamente os princípios da normalização de bancos de dados. 13. (FGV / TRF - 1ª REGIÃO - 2024) No sistema transacional da organização PrevData, há o registro dos pedidos de licença médica de todos os seus funcionários. Para apoiar as campanhas de prevenção, foi levantado o seguinte requisito analítico: quantidade de atestados de crise respiratória durante as estações do ano, ao longo dos últimos 10 anos. Para atender a esse requisito analítico, deve ser elaborado o Modelo Multidimensional de Dados com a estrutura: a) FATO_ATESTADOS (Quantidade, Descrição) DIMENSÃO_TEMPO (Ano, Estação) b) FATO_ATESTADOS (Estação, ANO_ATESTADO >= SYSDATE - INTERVAL '10' YEAR) DIMENSÃO_TIPO_ATESTADO (Descrição) c) DIMENSÃO_ATESTADOS (Quantidade, Estação) DIMENSÃO_TIPO_ATESTADO (Descrição) d) FATO_ATESTADOS (Quantidade) DIMENSÃO_TEMPO (Ano, Estação) DIMENSÃO_TIPO_ATESTADO (Descrição) e) FATO_ATESTADOS (Quantidade, Tipo_Atestado) DIMENSÃO_TEMPO (DATEDIFF(ANO_ATESTADO,-10) 14. (FGV / CVM - 2024) Para apoiar análises sobre os fundadores de empresas ao longo do tempo, elaborou-se, inicialmente, o seguinte modelo multidimensional de dados, no qual a tabela FATO FUNDAÇÃO EMPRESAS se relaciona com múltiplos valores da tabela DIMENSÃO FUNDADOR. No caso apresentado, a implementação de uma dimensão multivalorada deve ser realizada por meio da aplicação da técnica de modelagem multidimensional: André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 54 59 a) Tabela Ponte (Bridge Tables); b) Tabela Fato sem Fatos (Factless Fact Tables); c) Dimensão Degenerada (Degenerate Dimensions); d) Dimensão Floco de Neve (Snowflaked Dimensions); e) Dimensão que Desempenha Múltiplos Papéis (Role-Playing Dimensions). 15. (FGV / AL-PR - 2024) Seja o modelo multidimensional representado a seguir, refletindo uma dinâmica de vendas de produtos por vendedores e por região. Considere que I. os campos indicados como são os identificadores de suas respectivas tabelas; II. na tabela “Vendas”, o atributo “cod_vendedor” referencia o identificador cod_vendedor da tabela “Vendedor”. III. na tabela “Vendas”, o atributo “cod_regiao” referencia o identificador cod_regiao da tabela “Região”. IV. na tabela “Vendas”, o atributo “cod_produto” referencia o identificador cod_produto da tabela “Produto”. V. na tabela “Região”, o atributo “cod_cidade” referencia o identificador cod_cidade da tabela “Cidade”. Ao analisar a semântica do modelo, é correto inferir que André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 55 59 a) a dimensão tempo está representada como tabela oculta. b) a menor granularidade de tempo é data da venda. c) existem quatro tabelas fato e uma tabela dimensão. d) implementa o esquema multidimensional estrela. e) um registro específico de venda pode se relacionar a várias cidades. 16. (FGV / CGE-PB - 2024) Maria está implementando o Audit-DataMart para apoiar análises sobre a quantidade de auditorias realizadas por cidade e por período. Para isso, Maria elaborou o modelo multidimensional de dados no qual a dimensão tempo se relaciona com a tabela fato duas vezes, uma representando a data de início da auditoria e a outra representando a data do fim da auditoria, conforme ilustrado a seguir. A técnica de modelagem multidimensional de dados utilizada por Maria para referenciar múltiplas vezes uma única dimensão física na tabela fato é: a) Non-Additive Fact; b) Degenerate Dimension; c) Role Playing Dimension; d) Dimension Surrogate Key; e) Calendar Date Dimensions. 17. (FGV / CGM de Belo Horizonte - MG - 2024) O modelo multidimensional é composto por diversos elementos, por exemplo, dimensões, chaves, medidas e tabelas de fatos. As tabelas de fatos podem ser do tipo a) star e snowflake. b) mutivalorate dataset e surrogate. c) uncommited dataset, snapshot e dynamic dataset. d) transaction, periodic snapshot e accumulating snapshot. 18. (FGV / CGE-SC - 2023) Sobre a proposta geral do modelo dimensional em um Data Warehouse, não é correto afirmar que o modelo dimensional a) cobre tanto dados detalhados quanto dados sumarizados. b) cobre toda a empresa, e não apenas departamentos. c) é escalável, podendo entregar relatórios com trilhões de registros. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 56 59 d) é arquitetado apenas para um uso previsível, geralmente cobrindo os 10 relatórios mais acessados. e) pode integrar diversas fontes de dados operacionais da empresa, inclusive fontes externas. 19. (FGV / DPE-RS - 2023) Observe a seguinte arquitetura básica de uma solução de Business Intelligence implementada na empresa CleverBI. O elemento arquitetural da solução de BI da CleverBI implementado por meio de operações OLAP, como slice, rotate, drill-down e drill-up, é o: a) ETL; b) Stage Area; c) Banco de Dados Multidimensionais; d) Análises Multidimensionais; e) Busca de Padrões. 20. (FGV / SMPOG de Belo Horizonte - MG - 2023) Assinale a opção que indica a operação OLAP que permite analisar os dados de um Data Warehouse em níveis de agregação progressivamente mais detalhados, ou de menor granularidade. a) Slide. b) Pivot. c) Roll-up. d) Drill-down. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 57 59 GABARITO 1. LETRA C 2. LETRA B 3. LETRA D 4. LETRA B 5. LETRA A 6. LETRA D 7. LETRA B 8. LETRA D 9. LETRA C 10. LETRA A 11. LETRA B 12. LETRA D 13. LETRA D 14. LETRA A 15. LETRA B 16. LETRA C 17. LETRA D 18. LETRA D 19. LETRA D 20. LETRA D André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 58 59e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 5 59 MODELAGEM DIMENSIONAL Conceitos Básicos INCIDÊNCIA EM PROVA: ALTÍSSIMA MODELAGEM DIMENSIONAL Abordagem de organização de dados voltada para análise, usada em Data Warehouses, que estrutura as informações em torno de um fato — um evento mensurável do negócio — descrito por dimensões, que fornecem contexto (como tempo, produto, cliente ou região). Seu objetivo é facilitar consultas rápidas, intuitivas e de alto desempenho, apoiando decisões gerenciais. Essa técnica privilegia simplicidade, consistência e facilidade de navegação, utilizando esquemas como estrela, floco de neve e constelação de fatos, que tornam os dados mais acessíveis para análises OLAP e criação de relatórios. Existem dois tipos principais de bancos de dados: transacionais e analíticos. Os bancos de dados transacionais são adequados para sistemas que processam grande volume de transações, como inserções, atualizações e exclusões de dados. Esses dados alimentam os bancos de dados analíticos, que, por sua vez, são otimizados para a geração de relatórios consolidados, auxiliando na tomada de decisões estratégicas. Um exemplo comum de banco analítico é o Data Warehouse (DW). Os bancos transacionais, também chamados de operacionais, geralmente utilizam modelagem relacional, enquanto os bancos analíticos empregam modelagem dimensional ou multidimensional. Modelos multidimensionais exploram os relacionamentos entre os dados para organizá-los em estruturas chamadas cubos de dados ou hipercubos, quando envolvem mais de três dimensões. Esses cubos permitem análises a partir de múltiplas perspectivas. Por exemplo, uma matriz bidimensional pode exibir a quantidade de frangos vendidos por região. Com a adição de uma terceira dimensão, como o tempo (trimestres), essa matriz torna-se um cubo, possibilitando análises mais complexas. Portanto, a modelagem multidimensional viabiliza a organização e análise de dados a partir de diversas dimensões simultâneas. A imagem apresenta representações de uma matriz bidimensional e de um cubo de três dimensões. Uma matriz tridimensional é denominada Cubo de Dados, enquanto uma matriz com mais de três dimensões é chamada de Hipercubo. A representação gráfica de estruturas com quatro ou mais dimensões é complexa e, geralmente, inviável visualmente. Além disso, os cubos podem ser classificados de acordo com a densidade dos dados: um Cubo Esparso contém a maioria de suas combinações de dimensões sem dados (vazias), enquanto um Cubo Denso apresenta dados preenchendo a maior parte das intersecções entre as dimensões. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 6 59 Agora, vale destacar um ponto: representar graficamente estruturas com quatro ou mais dimensões não é nada simples. Na prática, isso se torna bastante complicado e, muitas vezes, inviável do ponto de vista visual. Por isso, mesmo que os sistemas trabalhem com hipercubos, as análises costumam ser feitas com recortes ou visualizações parciais das dimensões envolvidas. Na imagem seguinte, à esquerda temos um hipercubo com quatro dimensões; e a direita temos um hipercubo com cinco dimensões. Hipercubos podem ser classificados quanto à quantidade de combinações possíveis de dimensões que realmente possuem dados armazenados dentro de um cubo OLAP. CLASSIFICAÇÃO DE HIPERCUBOS DESCRIÇÃO DENSO Trata-se daquele em que a maioria das células contém valores — ou seja, quase todas as combinações entre dimensões têm fatos registrados. Isso costuma ocorrer em cenários com alto volume de transações e cobertura completa das combinações dimensionais (Ex: vendas diárias de milhares de produtos em centenas de lojas) ESPARSO Apresenta grande quantidade de células vazias, situação comum quando há muitas dimensões, muitos níveis hierárquicos ou quando os eventos são raros ou distribuídos de forma desigual (Ex: análise de falhas específicas em equipamentos ao longo do tempo). A distinção é essencial porque afeta performance, armazenamento e técnicas de agregação: cubos densos favorecem compressão simples e processamento direto, enquanto cubos esparsos exigem estruturas otimizadas (como índices bitmap, compressão de esparsidade ou armazenamento orientado a colunas) para evitar desperdício e melhorar o desempenho de consultas. A modelagem dimensional possibilita diversas formas de consulta em um Data Warehouse, proporcionando alta eficiência na geração de relatórios. Sua principal vantagem é a flexibilidade na análise dos dados, permitindo visualizações sob múltiplas perspectivas, muitas vezes não previstas previamente. Os dados podem ser acessados a partir de qualquer combinação de dimensões, eliminando a necessidade de consultas complexas, comuns em bancos de dados transacionais. Dessa forma, o desempenho das consultas em estruturas multidimensionais supera significativamente o das consultas em modelos relacionais. Além disso, a modelagem multidimensional permite a reorganização das hierarquias e orientações do cubo de dados por meio da técnica conhecida como giro ou rotação. Essa funcionalidade viabiliza a análise dos dados sob diferentes eixos, como, por exemplo, visualizar a quantidade de produtos vendidos por região e por trimestre, alternando facilmente a disposição entre linhas, colunas e profundidade. CARACTE- RÍSTICAS MODELO DIMENSIONAL MODELO RELACIONAL André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 7 59 OBJETIVO Projetado para consultas analíticas e relatórios rápidos em DW. Projetado para armazenamento de dados transacionais e operações de inserção, atualização e exclusão. ESTRUTURA Desnormalizado para otimizar as consultas. Utiliza tabelas fato e tabelas dimensão. Normalizado, com múltiplas tabelas relacionadas por chaves primárias e chaves estrangeiras. TABELA PRINCIPAL Tabela Fato, que contém métricas e dados numéricos (como vendas, lucros, etc). Tabelas que armazenam dados transacionais em forma de registros. TABELAS DE SUPORTE Tabelas Dimensão, que armazenam informações descritivas sobre as métricas (como produtos, clientes, tempo). Tabelas com dados organizados de maneira relacional, com normalização de 3ª ou 4ª forma normal. REDUNDÂNCIA Alta redundância de dados nas tabelas de dimensão (desnormalização). Baixa redundância devido à normalização das tabelas. CONSULTAS Otimizado para leitura e consulta rápida, com menor complexidade de joins. Otimizado para operações de CRUD (Create, Read, Update, Delete), com consultas mais complexas. PERFORMANCE Melhor para consultas agregadas e análises complexas, pois os dados são acessados sem a necessidade de múltiplos joins. Melhor para operações transacionais e integridade dos dados, mas os joins podem ocasionar consultas complexas mais lentas. EXEMPLOS DE USO Data Warehousing, Business Intelligence (BI), e relatórios de tendências e análise histórica. Sistemas de gestão de banco de dados transacional, como sistemas de ERP ou CRM. ATUALIZAÇÕES Menos eficiente para atualizações frequentes, pois a desnormalização pode gerar duplicidade de dados. Eficiente para atualizações frequentes, pois os dados estão normalizados e não há redundância. MANUTENI- BILIDADE Menosflexível para alterações de dados em tempo real, pois mudanças podem precisar ser feitas em várias partes. Mais fácil de manter dados consistentes e realizar atualizações incrementais. A principal distinção entre a estrutura relacional e a estrutura multidimensional reside no grau de normalização, na redundância de dados e na frequência de atualizações. A estrutura relacional é caracterizada por alta normalização, baixa redundância e suporte a atualizações frequentes. Em contrapartida, a estrutura multidimensional apresenta desnormalização, alta redundância e menor frequência de atualização. A normalização é um conjunto de regras que visa reduzir a redundância de dados, isto é, evitar a repetição das mesmas informações em diferentes tabelas. Em bancos de dados transacionais, a normalização é essencial para garantir desempenho e consistência, já que esse tipo de banco processa um grande volume de transações. Por outro lado, em bancos de dados dimensionais, a desnormalização — e, consequentemente, a replicação de dados — é desejável, pois facilita a geração de relatórios, que não ocorrem com a mesma frequência das transações em sistemas operacionais. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 8 59 A desnormalização confere maior flexibilidade aos bancos de dados multidimensionais, permitindo a organização dos dados conforme os requisitos e preferências dos usuários. A abordagem multidimensional é estruturada por assuntos, que representam a tradução das necessidades informacionais dos diversos usuários. Assim, a desnormalização facilita a visualização dos dados segundo os temas de maior interesse, otimizando a análise e a geração de relatórios. SÍNTESE DO TÓPICO Tabelas Fato e Dimensão INCIDÊNCIA EM PROVA: BAIXA A modelagem multidimensional baseia-se em dois elementos fundamentais e complementares: Tabela Fato e Tabela Dimensão. A Tabela Fato armazena informações quantitativas utilizadas na análise de dados, sendo composta por medidas, métricas ou fatos relacionados a um processo de negócio. No exemplo citado, ela poderia conter informações como o valor arrecadado com vendas na loja do Rio de Janeiro em janeiro, em São Paulo no primeiro trimestre ou em Brasília durante o Carnaval. Esses dados representam fatos mensuráveis vinculados ao processo de vendas. Essas informações quantitativas dependem de dados descritivos que não estão na Tabela Fato, mas sim nas Tabelas Dimensão, as quais armazenam atributos descritivos relacionados aos fatos. Por exemplo: ▪ A dimensão loja pode conter o código da loja, cidade, tamanho e número de funcionários. ▪ A dimensão tempo pode conter o código temporal, dia, mês, trimestre, semestre, ano, entre outros. ▪ A dimensão região pode conter o código da região, nome, localização e número de estados. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 9 59 Assim, a Tabela Fato contém chaves estrangeiras que fazem referência às chaves primárias (ou candidatas) das Tabelas Dimensão. Esse relacionamento permite a análise dos fatos sob diferentes perspectivas, organizando os dados de forma eficiente para fins analíticos. TABELA FATO Estrutura central da modelagem dimensional, responsável por registrar os eventos mensuráveis de um processo de negócio, armazenando medidas quantitativas como quantidade, valor, custo ou lucro. Ela possui alto volume de registros, cresce principalmente em número de linhas e mantém chaves estrangeiras que se relacionam às tabelas dimensão, permitindo a análise dos dados sob diferentes perspectivas (tempo, produto, cliente, local, entre outras). Seu objetivo principal é suportar consultas analíticas e agregações, servindo como base para relatórios, indicadores de desempenho e análises OLAP em ambientes de Data Warehouse. CARACTERÍSTICAS DESCRIÇÃO FINALIDADE Armazenam ocorrências, eventos ou fatos mensuráveis de um processo de negócio. PERGUNTA QUE RESPONDEM “O que está sendo medido nesse processo de negócio?” CONTEÚDO PRINCIPAL Medidas quantitativas: quantidade, valor, lucro, margem, perdas, indicadores operacionais, etc. VOLUME DE DADOS Normalmente possuem altíssimo número de registros e crescem verticalmente (mais linhas). ESTRUTURA Simples e direta; não possuem hierarquias internas (hierarquias pertencem às dimensões). RELAÇÃO COM DIMENSÕES Contêm chaves estrangeiras que apontam para tabelas dimensão; relacionamentos 1:N. DIMENSÃO TEMPO Geralmente presente, mas não obrigatória por regra formal. CHAVE PRIMÁRIA Frequentemente composta pelas FKs das dimensões; pode ser substituída por surrogate key em alguns projetos. NORMALIZAÇÃO Não é correto classificá-las como desnormalizadas; quem é desnormalizada é a tabela dimensão. ORDEM DE CRIAÇÃO São criadas após as dimensões, pois dependem das chaves dessas tabelas. UTILIZAÇÃO Servem como base para cálculos estatísticos, análises OLAP e indicadores de desempenho. EXEMPLOS DE MÉTRICAS Quantidade, valor, custo, lucro, desconto, tempo de atendimento, volume produzido, etc. TABELA DIMENSÃO Estrutura da modelagem dimensional que armazena atributos descritivos usados para contextualizar e interpretar as medidas registradas na tabela fato. Ela contém informações qualitativas — como nomes, categorias, datas, locais ou pessoas — e permite que os dados sejam analisados sob diferentes perspectivas, respondendo a perguntas como quem, o quê, quando e onde. Em geral, é desnormalizada, possui menos registros que a tabela fato, utiliza uma chave primária própria (frequentemente uma surrogate key) e tem como objetivo facilitar consultas, filtros, agrupamentos e navegação analítica em ambientes de Data Warehouse e OLAP. CARACTERÍSTICAS DESCRIÇÃO FINALIDADE Armazenam atributos descritivos que fornecem contexto às medidas registradas na Tabela Fato. PERGUNTAS QUE RESPONDEM “Quem?”, “O quê?”, “Onde?”, “Quando?” e “Como?”. CONTEÚDO PRINCIPAL Atributos qualitativos e descritivos, geralmente textuais ou categóricos. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 10 59 ==2f4e8== VOLUME DE DADOS Normalmente possuem menos registros que tabelas fato, mas podem crescer continuamente com novos membros. CRESCIMENTO Crescem principalmente verticalmente (novos registros); crescimento horizontal (novos atributos) é possível, mas menos frequente. ESTRUTURA Geralmente desnormalizadas, com muitos atributos em uma única tabela para facilitar consultas. HIERARQUIAS Podem conter hierarquias internas (ex.: dia → mês → ano; produto → categoria → departamento). NORMALIZAÇÃO A desnormalização é a prática recomendada; a normalização ocorre apenas em esquemas floco de neve, como exceção. CHAVE PRIMÁRIA Possuem chave primária própria, geralmente uma surrogate key, que identifica unicamente cada registro. RELAÇÃO COM A TABELA FATO A chave primária da dimensão é referenciada como chave estrangeira na Tabela Fato. QUALIDADE DOS ATRIBUTOS Devem ser verbosos, claros, descritivos, completos, discretos e semanticamente corretos. UTILIZAÇÃO Permitem analisar os fatos sob diferentes perspectivas e níveisde agregação. EXEMPLOS DE DIMENSÕES Cliente, Produto, Tempo, Localização, Vendedor, Organização, Canal de Venda. Em suma, a modelagem dimensional é uma técnica de estruturação de dados que visa a simplicidade e a facilidade de consulta. Ela se opõe à modelagem relacional tradicional (utilizada em Sistemas OLTP), que prioriza a normalização para evitar redundâncias e garantir a integridade dos dados transacionais. Vejamos uma tabela que resume tudo que vimos: CARACTERÍSTICAS TABELA FATO TABELA DIMENSÃO CONTEÚDO Armazena medidas quantitativas que representam eventos do negócio, como vendas ou atendimentos, passíveis de cálculo e agregação. Armazena atributos descritivos que contextualizam os fatos, como nomes, datas, categorias, locais e demais informações qualitativas. FUNÇÃO Registrar o que foi medido no processo de negócio, concentrando dados numéricos usados em análises, relatórios e indicadores. Fornecer o contexto dos fatos, permitindo análises por quem, quando, onde, o quê e outras perspectivas relevantes. CHAVE PRIMÁRIA Geralmente composta pelas chaves estrangeiras das dimensões, podendo em alguns casos ser uma chave substituta da transação. Possui chave primária própria, normalmente uma surrogate key, que identifica unicamente cada registro da dimensão. RELACIONAMENTO Contém chaves estrangeiras que referenciam as chaves primárias das tabelas dimensão no esquema multidimensional. Relaciona-se com a tabela fato por meio de sua chave primária, sendo referenciada como chave estrangeira na fato. CARDINALIDADE Relaciona-se no formato muitos-para-um (N:1), pois muitos fatos podem estar associados a um mesmo registro de dimensão. Relaciona-se no formato um-para-muitos (1:N), já que um registro de dimensão pode descrever vários fatos. NORMALIZAÇÃO Não é foco de normalização, pois armazena medidas numéricas e não atributos sujeitos a redundância descritiva. Geralmente desnormalizada no esquema estrela e parcialmente normalizada apenas no esquema floco de neve. TAMANHO Normalmente é a maior tabela do Data Warehouse, devido ao grande volume de registros gerados pelos eventos. Menor que a tabela fato em número de linhas, mas pode possuir muitas colunas descritivas para análise. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 11 59 SÍNTESE DO TÓPICO Esquema Estrela e Flocos de Neve Os esquemas Estrela (Star Schema) e Floco de Neve (Snowflake Schema) são formas de organizar fisicamente um modelo dimensional em um Data Warehouse. Ambos partem do mesmo princípio — uma tabela fato no centro e tabelas dimensão ao redor —, mas diferem no nível de normalização das dimensões e, consequentemente, em simplicidade, desempenho e manutenção. Esquema Estrela (Star Schema) INCIDÊNCIA EM PROVA: ALTA André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 12 59 O Esquema Estrela (Star Schema) é a forma mais clássica e recomendada de organização física de um modelo dimensional em Data Warehouses. Ele recebe esse nome porque, visualmente, apresenta uma tabela fato central, conectada diretamente a várias tabelas dimensão desnormalizadas, formando o desenho de uma estrela. A ideia central do esquema estrela é simplificar consultas analíticas. Em vez de muitas tabelas normalizadas e múltiplos joins (como em modelos OLTP), o esquema estrela prioriza menos joins, maior legibilidade e melhor desempenho, especialmente para operações de agregação (SUM, COUNT, AVG). Todo esquema estrela possuirá: ▪ Uma tabela fato, que representa um processo de negócio; contém métricas numéricas; possui chaves estrangeiras para as dimensões; e tem granularidade bem definida. ▪ Várias tabelas dimensão, que armazenam atributos descritivos; são desnormalizadas; possuem chaves primárias próprias; e respondem às perguntas: quem, o quê, quando, onde, como. Atenção: a tabela fato nunca se relaciona diretamente com outra tabela fato e as dimensões também não se relacionam entre si. O esquema estrela é amplamente adotado porque reduz a complexidade das consultas SQL; melhora o desempenho em ambientes analíticos; facilita o entendimento por usuários de negócio; funciona muito bem com ferramentas OLAP e BI; e segue as boas práticas de Kimball. Em Data Warehousing, desnormalização é uma virtude, não um problema. O pequeno aumento de redundância nas dimensões é compensado por simplicidade, performance e clareza semântica. É importante destacar também que, no esquema estrela, dimensões são planas (flat), hierarquias ficam na mesma tabela e há menos joins. Além disso, a tabela fato não contém atributos textuais; dimensões podem conter hierarquias; cada linha da tabela fato deve representar um único nível de granularidade; métricas devem ser coerentes com essa granularidade; e a dimensão tempo é quase sempre obrigatória. Dito isso, vamos analisar o Esquema Estela apresentado na página anterior. O diagrama apresenta uma tabela fato no centro (FATO_VENDAS) e várias tabelas dimensão ao redor (DIM_DATA, DIM_PRODUTO, DIM_LOJA). A tabela fato guarda medidas (números) do processo de negócio venda; as dimensões guardam descrições que contextualizam essas medidas (quando, o quê, onde). Pense assim: a tabela FATO_VENDAS responde “quanto foi vendido, com que desconto, custo, etc”; já as dimensões respondem “em que dia, qual produto, em qual loja”. Agora o que uma linha da tabela FATO_VENDAS representa? Pelo modelo apresentado, a leitura mais natural é: uma linha representa as vendas de um produto, em uma loja, em uma data. Isso é ótimo didaticamente porque temos uma granularidade clara e estável. A partir daí, dá para somar e agrupar em qualquer nível (dia → mês → ano; cidade → estado; categoria a→ subcategoria, etc). Ainda sobre essa tabela, ela possui três chaves estrangeiras: ID_DATA ((referência para DIM_DATA); ID_PRODUTO (referência para DIM_PRODUTO); e ID_LOJA (referência para DIM_LOJA); e possui quatro métricas: VALOR_VENDA; QUANTIDADE; DESCONTO; e CUSTO. Essas quatro métricas são típicas de fatos transacionais e geralmente são aditivas: ▪ VALOR_VENDA: soma por tempo, loja, produto, etc. ▪ QUANTIDADE: soma por tempo, loja, produto, etc. ▪ DESCONTO: soma por tempo, loja, produto, etc. ▪ CUSTO: soma por tempo, loja, produto, etc. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 13 59 Com isso, você consegue derivar indicadores em consulta, por exemplo: ▪ A receita líquida será igual a: VALOR_VENDA – DESCONTO; ▪ O lucro será (VALOR_VENDA - DESCONTO) – CUSTO; ▪ A margem (em percentual) será Lucro / (VALOR_VENDA - DESCONTO). Já a dimensão DIM_DATA é uma dimensão clássica e muito comum em DW – uma linha por dia (ID_DATA), com vários atributos que permitem agregação e filtros: DATA_COMPLETA, DIA, MES, NOME_MES, TRIMESTRE, SEMESTRE, ANO, DIA_DA_SEMANA, IND_FERIADO e PERIODO_FISCAL. E por que isso é tão bom? Porque você consegue agregar de dia → mês → trimestre → ano sem mudar a FATO_VENDAS; filtrar por “feriado”, “período fiscal”, “dia da semana”; e fazer análises temporais sem ficar inventando funções de data no SQL. Já a dimensão DIM_PRODUTOdescreve o que foi vendido. Ela é desnormalizada, trazendo atributos úteis para agrupamento e segmentação: NOME_PRODUTO, DESCRICAO, CATEGORIA, SUBCATEGORIA, FABRICANTE, TIPO_FABRICANTE. O que isso permite? Permite analisar vendas por categoria/subcategoria; comparação por fabricante; análise de mix de produtos; e relatórios legíveis (“Nome do Produto”) sem inflar a fato com texto. Por fim, a dimensão DIM_LOJA responde onde foi vendido: NOME_LOJA, CIDADE, ESTADO, PAIS, REGIAO, TIPO_LOJA. Isso suporta análises como: vendas por cidade/estado/região, comparação de performance por tipo de loja e expansão territorial (mapas, clusters, etc). E como esse esquema pode ser utilizado na prática? É possível consultar receitas por mês e categoria ou, por exemplo, os dez produtos por lucro em uma região. O bacana do esquema estrela é que essas consultas ficam curtas e previsíveis: geralmente uma tabela fato e diversas tabelas dimensões. Esquema Flocos de Neve (Snowflake Schema) INCIDÊNCIA EM PROVA: MÉDIA André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 14 59 O esquema floco de neve é uma variação do esquema estrela, mas com dimensões normalizadas. Em outras palavras, enquanto no esquema estrela as dimensões são desnormalizadas (ou seja, todos os atributos de uma dimensão ficam em uma única tabela), no esquema floco de neve as dimensões podem ser divididas em tabelas menores. Isso reduz redundância de dados, mas aumenta o número de joins necessários para consultas. A Tabela Fato (FATO_VENDAS) contém as métricas (neste caso, QUANTIDADE de vendas) e as chaves estrangeiras que apontam para as dimensões: PRODUTO, PERÍODO e LOCALIZAÇÃO. A Dimensão Produto (DIM_PRODUTO) contém informações do produto (nome, descrição, categoria) e uma FK para DIM_FABRICANTE. A Dimensão Fabricante (DIM_FABRICANTE) é uma tabela separada que detalha o fabricante (nome, CNPJ, tipo). Isso é um exemplo de normalização: o atributo FABRICANTE, que poderia estar na DIM_PRODUTO, foi "desmembrado" em uma tabela própria. A Dimensão Localização (DIM_LOCALIZAÇÃO) contém atributos como país, estado, cidade, bairro e rua. Novamente, se quiséssemos, poderíamos normalizar ainda mais, criando tabelas para cada nível (Ex: uma tabela só para "Estado"), mas aqui está em um nível intermediário. A Dimensão Período (DIM_PERIODO) está um pouco diferente da DIM_DATA que vimos no esquema estrela. Aqui, ela está representada por níveis (diário, semanal, mensal, etc). Isso pode ser visto como uma normalização do conceito de tempo, embora em geral, a prática mais comum seja uma dimensão de data com um registro por dia (como no estrela). Dentre as vantagens do Modelo Floco de Neve, temos: reduz redundância de dados nas dimensões, economiza espaço e pode facilitar a manutenção de dados dimensionais. Se um fabricante muda de nome, por exemplo, você só precisa atualizar a DIM_FABRICANTE, e não todas as linhas da DIM_PRODUTO. Entre as desvantagens, temos: aumenta a complexidade das consultas, pois agora é preciso fazer mais joins entre tabelas. Enquanto o esquema estrela é mais simples para consultas ad-hoc, o floco de neve exige um pouco mais de conhecimento técnico. Em suma, esse esquema é o resultado da decomposição de uma ou mais tabelas de dimensões normalizadas até a 3ª Forma Normal (3FN). Em contraste com o esquema estrela, apresenta consultas mais complexas, mais lentas, mas com manutenção mais fácil. Como as tabelas são normalizadas, existe menos redundância de dados, portanto ocupa-se menos espaço. Além disso, como há tabelas de dimensão conectadas a outras tabelas de dimensão, existe uma hierarquia. ESQUEMA ESTRELA FLOCOS DE NEVE FATO Geralmente Desnormalizada Geralmente Desnormalizada DIMENSÃO Geralmente Desnormalizada Geralmente Normalizada CRITÉRIO ESQUEMA ESTRELA (STAR SCHEMA) ESQUEMA FLOCO DE NEVE (SNOWFLAKE SCHEMA) MODELO André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 15 59 ESTRUTURA GERAL Tabela fato central ligada diretamente a tabelas dimensão Tabela fato central ligada a dimensões ramificada em subdimensões NORMALIZAÇÃO DAS DIMENSÕES Baixa (dimensões desnormalizadas) Alta (dimensões normalizadas) QUANTIDADE DE TABELAS Menor Maior NÚMERO DE JOINS Menor número de joins Maior número de joins COMPLEXIDADE DAS CONSULTAS Baixa, consultas mais simples e legíveis Maior, consultas mais complexas DESEMPENHO EM CONSULTAS Melhor desempenho (menos joins) Desempenho inferior em geral REDUNDÂNCIA DE DADOS Maior redundância nas dimensões Menor redundância FACILIDADE DE ENTENDIMENTO Alta (modelo intuitivo para usuários de negócio) Menor (exige conhecimento técnico maior) MANUTENÇÃO DAS DIMENSÕES Mais simples conceitualmente Pode facilitar manutenção de atributos hierárquicos ADERÊNCIA ÀS BOAS PRÁTICAS KIMBALL Recomendado como padrão Usar apenas quando necessário USO EM FERRAMENTAS DE BI Muito adequado Adequado, porém menos amigável CENÁRIOS TÍPICOS DE USO Data Warehouses e Data Marts analíticos Dimensões muito grandes ou altamente hierárquicas MNEMÔNICO PARA NUNCA MAIS CONFUNDIR MODELO SNOWFLAKE E STAR ESQUEMA SNOWFLAKE DIMENSÕES NORMALIZADAS Esquema Constelação de Fatos (Fact Constellation Schema) Antes de seguir para o próximo tópico, é importante falar de um terceiro esquema chamado Constelação de Fatos. Ele cai beeeem menos em prova, mas é fundamental saber seus conceitos básicos: ele é basicamente constituído de duas ou mais tabelas fato que compartilham uma ou mais dimensões. Quando vários esquemas estrela são unidos por dimensões compatíveis1 – comuns entre eles – chamamos de Esquema Multiestrela. É importante que as dimensões guardem entre si uma compatibilidade e as tabelas fato estejam definidas em granularidade compatível com as dimensões interligadas. Ele pode ser criado dividindo um esquema estrela em dois ou mais esquemas estrela. Por que eu usaria um esquema desses, professor? Porque ele fornece uma flexibilidade maior ao esquema, por outro lado ele é um esquema bem mais complexo, logo é mais difícil de implementar ou manter. MODELO CARACTERÍSTICA PRINCIPAL ESQUEMA ESTRELA Uma tabela fato + várias dimensões ESQUEMA FLOCO DE NEVE Uma fato + dimensões normalizadas CONSTELAÇÃO DE FATOS Múltiplas fatos compartilhando dimensões 1 Essas dimensões comuns também são chamadas de Dimensão Conforme. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 16 59 MODELO Uma constelação é composta por múltiplas tabelas fato (Ex: vendas, estoque, devoluções, metas); por dimensões compartilhadas (conformes) entre essas tabelas fatos; e por dimensões exclusivas, quando necessário, para fatos específicas. Importante: as tabelas fato não se relacionam diretamente entre si, apenas por meio das dimensões. Vejamos suas principais características: CARACTERÍSTICA DESCRIÇÃO DEFINIÇÃO Modelo dimensional composto por duas ou mais tabelas fato que coexistem no mesmo ambiente e compartilham dimensões comuns. QUANTIDADE DE TABELAS FATO Múltiplas tabelas fato, cadauma representando um processo de negócio distinto. COMPARTILHAMENTO DE DIMENSÕES Utiliza dimensões conformes, permitindo análises integradas entre diferentes processos. RELACIONAMENTO ENTRE FATOS Não existe relacionamento direto entre tabelas fato; a integração ocorre exclusivamente via dimensões. GRANULARIDADE Cada tabela fato possui granularidade própria, definida de acordo com o processo de negócio. TIPOS DE MÉTRICAS Cada fato armazena métricas específicas do seu processo, podendo ser aditivas, semi- aditivas ou não-aditivas. COMPLEXIDADE DO MODELO Maior que o esquema estrela simples, devido à presença de múltiplas tabelas fato. FLEXIBILIDADE ANALÍTICA Alta, pois permite análises cruzadas entre processos distintos (ex.: vendas × estoque). USO TÍPICO Data Warehouses corporativos com múltiplos processos integrados. ADERÊNCIA A KIMBALL Totalmente compatível com a abordagem Kimball, desde que use dimensões conformes. EXEMPLOS COMUNS Vendas, Estoque, Devoluções, Metas, Atendimento ao Cliente. SÍNTESE DO TÓPICO André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 17 59 Tipos de Medidas INCIDÊNCIA EM PROVA: MÉDIA Essas métricas ou medidas que eu tanto falei são informações que se são armazenadas em Tabelas Fato e que permitem medir um processo de negócio. Existem três tipos: Medidas/Fatos Aditivas Medidas aditivas são aquelas que podem ser somadas livremente em todas as dimensões do modelo dimensional, sem perda de significado. Isso inclui somas por tempo, produto, loja, cliente, ou qualquer outra dimensão associada à tabela fato. Por essa razão, são as medidas mais simples, mais comuns e mais desejáveis em um Data Warehouse. Em geral, métricas financeiras e quantitativas se enquadram nessa categoria, como quantidade vendida, valor de venda, faturamento, impostos, custos e descontos. Elas se comportam bem em agregações e são ideais para relatórios, dashboards e indicadores consolidados, pois mantêm coerência independentemente do nível de análise. No exemplo seguinte, note que o valor total vendido pode ser somado por dia, por loja, por produto ou por mês, sem gerar distorções. As medidas aditivas são: VALOR_VENDA e QUANTIDADE. DATA_ID LOJA_ID PRODUTO_ID QUANTIDADE VALOR_VENDA 2024-01-10 10 101 2 10,00 2024-01-10 10 202 1 8,00 2024-01-11 12 303 1 12,00 André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 18 59 Medidas/Fatos Não-Aditivas Medidas não-aditivas são aquelas que não podem ser somadas em nenhuma dimensão, pois a soma não faz sentido do ponto de vista do negócio. Normalmente, são razões, proporções, médias, índices ou percentuais, cujo significado se perde quando agregados por soma. Essas medidas exigem tratamento especial nas consultas, sendo geralmente calculadas no momento da análise, a partir de outras métricas aditivas. Um erro clássico é tentar somar percentuais ou médias, o que leva a resultados incorretos e distorcidos — algo muito explorado em questões de concurso. No exemplo seguinte, note que a margem de lucro (%) não pode ser somada entre produtos ou dias. Percebam que somar 30% + 25% = 55% não faz sentido. Logo, MARGEM_% é uma medida não aditiva. DATA_ID PRODUTO_ID VALOR_VENDA CUSTO MARGEM_% 2024-01-10 101 10,00 7,00 30% 2024-01-10 202 8,00 6,00 25% Medidas/Fatos Semi-Aditivas Medidas semi-aditivas são aquelas que podem ser somadas em algumas dimensões, mas não em outras — quase sempre não aditivas ao longo do tempo. Elas aparecem com frequência em snapshots periódicos, onde o valor representa um estado, e não um fluxo de eventos. O caso mais clássico é o saldo (estoque, conta bancária, quantidade em caixa). Somar saldos de dias diferentes não faz sentido, mas somar saldos de produtos diferentes ou lojas diferentes em um mesmo instante pode ser perfeitamente válido. No exemplo seguinte, o estoque diário pode ser somado por produto ou loja, mas não por datas diferentes. DATA_ID LOJA_ID PRODUTO_ID ESTOQUE_QTD 2024-01-10 10 101 50 2024-01-11 10 101 47 2024-01-10 10 202 30 Percebam que somar 50 + 30 = 80 (estoque total no dia 10) faz sentido; já somar 50 + 47 = 97 (estoque em dias diferentes) não faz sentido. Logo, ESTOQUE_QTD é uma medida semi-aditiva. TIPO DE MEDIDA PODE SOMAR NO TEMPO? PODE SOMAR EM OUTRAS DIMENSÕES? EXEMPLO CLÁSSICO ADITIVA Sim Sim Valor de venda NÃO-ADITIVA Não Não Percentual, média SEMI-ADITIVA Não Sim Estoque, saldo Em suma, podemos concluir que medidas aditivas podem ser agregadas em todas as dimensões; medidas não-aditivas não podem ser somadas em nenhuma dimensão; e medidas semi-aditivas admitem agregação apenas em algumas dimensões, tipicamente exceto a dimensão tempo. SÍNTESE DO TÓPICO André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 19 59 Online Analytical Processing (OLAP) INCIDÊNCIA EM PROVA: ALTÍSSIMA O OLAP refere-se a um conjunto de tecnologias e ferramentas projetadas para análise analítica avançada de dados, com foco no apoio à tomada de decisões gerenciais e estratégicas. Diferentemente dos sistemas tradicionais de banco de dados, que são voltados ao registro e à manutenção das operações do dia a dia, o OLAP tem como propósito explorar, resumir, comparar e compreender grandes volumes de dados históricos, permitindo que o usuário observe o negócio sob diversos ângulos simultaneamente. A base conceitual do OLAP está na análise multidimensional. Os dados são organizados de forma que possam ser analisados segundo múltiplas dimensões — como tempo, produto, local, cliente ou área organizacional — e suas hierarquias. Isso possibilita que o analista navegue entre diferentes níveis de detalhe, por exemplo, passando de uma visão anual para mensal ou diária, ou de uma visão nacional para regional e local. Essa navegação ocorre de maneira interativa, sem necessidade de reestruturar dados ou reescrever consultas complexas. Uma das características mais relevantes do OLAP é o suporte a consultas ad-hoc, isto é, consultas formuladas no momento da análise, sem que tenham sido previamente definidas pelo time de TI. O usuário pode testar hipóteses, cruzar informações inesperadas e explorar padrões emergentes conforme novas perguntas surgem. Esse dinamismo torna o OLAP especialmente valioso em ambientes nos quais as decisões dependem de exploração contínua dos dados, e não apenas de relatórios fixos. Outro aspecto fundamental é a abstração da complexidade técnica. Embora os dados por trás do OLAP sejam armazenados em estruturas sofisticadas — como Data Warehouses, Data Marts ou cubos multidimensionais —, o usuário final interage com interfaces visuais, painéis e operações intuitivas. Dessa forma, profissionais de áreas como gestão, planejamento, controle ou auditoria conseguem analisar informações sem dominar SQL, modelagem de dados ou conceitos avançados de bancos de dados. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital)www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 20 59 Em ambientes corporativos, o OLAP é amplamente utilizado para análise de desempenho, monitoramento de indicadores, comparação entre períodos, avaliação de tendências e identificação de desvios. Por exemplo, uma organização pode comparar o desempenho de vendas entre regiões, identificar variações sazonais, avaliar o impacto de campanhas ou analisar a evolução de custos ao longo do tempo. No setor público, essas mesmas capacidades são aplicadas à análise orçamentária, acompanhamento de políticas públicas, controle de gastos e avaliação de resultados institucionais. Do ponto de vista conceitual, o OLAP representa a camada analítica final de uma arquitetura de dados mais ampla. Antes dele, os dados são coletados em sistemas transacionais (OLTP), integrados e historizados em um Data Warehouse por meio de processos de ETL, e organizados segundo modelos dimensionais. O OLAP se apoia nessa base estruturada para oferecer uma experiência de análise rápida, flexível e orientada ao negócio. Assim, o OLAP se distingue por transformar grandes volumes de dados históricos em informação explorável, permitindo que decisões estratégicas sejam fundamentadas em análises consistentes, comparativas e multidimensionais. Ele não substitui os sistemas operacionais nem os bancos transacionais, mas os complementa, cumprindo um papel essencial na governança de dados e na inteligência organizacional. OLTP (ONLINE TRANSACTION PROCESSING) OLAP (ONLINE ANALYTICAL PROCESSING) Sistema voltado ao processamento de transações em banco de dados. Sistema voltado à consulta e análise de dados. Foco no nível operacional, apoiando a execução diária do negócio. Foco no nível estratégico, apoiando análise e tomada de decisão. Tabelas em linhas e colunas, geralmente normalizadas. Estruturas com fatos, dimensões e medidas, geralmente desnormalizadas. Utiliza bancos de dados transacionais em modelo relacional. Utiliza Data Warehouse/Data Marts em modelo dimensional. Tempo de resposta curto, de milissegundos a segundos. Tempo de resposta maior, geralmente de segundos a minutos. Trabalha com dados detalhados (alta granularidade). Trabalha com dados resumidos ou agregados (baixa granularidade), podendo manter detalhe. Atualizações frequentes, ocorrendo a cada transação. Atualizações periódicas via processos de carga (ETL/ELT). Não otimizado para análises históricas complexas. Otimizado para análise de grandes volumes de dados históricos. Dados voláteis, sujeitos a inserção, alteração e exclusão. Dados históricos e não voláteis, raramente alterados. Consultas pré-definidas e estruturadas. Consultas ad-hoc e multidimensionais. Poucos registros por transação e muitos usuários simultâneos. Muitos registros analisados e poucos usuários simultâneos. SÍNTESE DO TÓPICO André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 21 59 Classificação INCIDÊNCIA EM PROVA: MÉDIA A classificação do OLAP quanto ao tipo de armazenamento refere-se a onde e como os dados analíticos são fisicamente armazenados e processados. Vejamos essa classificação: ROLAP (Relational OLAP) O ROLAP (sigla para Relational OLAP) é uma das abordagens do processamento analítico online que se apoia diretamente nos bancos de dados relacionais para realizar análises multidimensionais. Em vez de armazenar os dados em cubos ou estruturas pré-agregadas, o ROLAP mantém tudo no formato tradicional de tabelas com linhas e colunas. Por outro lado, apesar dessa estrutura relacional, o usuário final interage com o sistema como se estivesse navegando por um cubo multidimensional. Essa “mágica” acontece graças a uma camada intermediária que faz o mapeamento entre o modelo relacional e a visão multidimensional. Quando o usuário executa operações como slice, dice ou drill-down, essa camada traduz essas ações em consultas SQL que o banco consegue entender. A maior vantagem do ROLAP é a escalabilidade. Como ele aproveita a capacidade dos SGBDs relacionais — que já são otimizados para lidar com grandes volumes de dados —, não há um limite fixo imposto pela CRIAÇÃO DINÂMICA DE CUBOS DADOS SQL COMPLEXO REQUISIÇÃO BANCO RELACIONAL ROLAP USUÁRIO André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 22 59 própria tecnologia de OLAP. Isso faz do ROLAP uma escolha interessante para ambientes com bases muito extensas e dados constantemente atualizados. Por outro lado, o desempenho costuma ser o calcanhar de Aquiles dessa abordagem. Cada interação do usuário pode gerar uma ou várias consultas SQL, o que consome tempo e recursos — especialmente se o banco não estiver bem indexado ou otimizado. Além disso, como o ROLAP depende exclusivamente da linguagem SQL, ele acaba ficando limitado na hora de executar cálculos analíticos mais complexos, que exigiriam funções além das disponíveis no SQL padrão. Em suma, no ROLAP, o usuário faz uma solicitação analítica, que é convertida em SQL, executada no banco relacional e, depois, o resultado é apresentado em um formato multidimensional. É uma solução que valoriza a flexibilidade e a integração com infraestruturas relacionais já existentes, mesmo que isso traga um custo em termos de performance e sofisticação analítica. Imagine uma loja que vende uma variedade de produtos em diferentes regiões e deseja analisar as vendas por produto, por região e por mês. O gerente da loja quer ser capaz de: ver as vendas totais por mês e analisar as vendas detalhadas por produto e cliente. Nesse contexto, o gerente solicita uma consulta ad-hoc para saber as vendas totais por produto e por mês. No ROLAP, o sistema não tem um cubo pré-calculado. Em vez disso, o ROLAP pega a tabela de vendas transacionais, que armazena cada venda detalhadamente, e usa SQL dinâmico para calcular os totais para cada produto e mês no momento da consulta. Quando o gerente faz a consulta, o sistema vai até o banco de dados relacional (onde as vendas são registradas linha a linha) e executa um SQL complexo com junções (JOINs) para agrupar os dados por produto e mês, calculando a soma das vendas. Como resultado, o sistema faz o cálculo na hora, o que pode demorar mais, especialmente se os dados forem volumosos. Por outro lado, o gerente pode consultar qualquer detalhe sem limitações, pois os dados estão sempre atualizados. MOLAP (Multidimensional OLAP) Trata-se da ferramenta tradicional de OLAP que recupera dados de um banco de dados multidimensional. Falou em multidimensional, vocês se lembram do quê? Vetores/Arrays Dimensionais (Cubos)! Em outras palavras, essa ferramenta apresenta os dados para o usuário em uma visão multidimensional e eles são efetivamente armazenados em bancos de dados multidimensional otimizados chamados Multidimensional Database (MDDB). Esses bancos de dados multidimensionais são proprietários, isto é, pertencem a alguma empresa específica. Além disso, cubos de dados deste banco transportam dados pré-calculados e pré-fabricados. Por quem, professor? Pelas ferramentas MOLAP, que recebem dados de algum Data Warehouse. O MOLAP fornecerá a visualização multidimensional dos dados dos MDDBs para o usuário. Vocês conseguem ver a sacada desse modelo? DW CUBOS DE DADOS DADOS PROPRIETÁRIOS CRIA E ARMAZENA REQUISIÇÃO MOLAP MDDB USUÁRIO André Castro, Diego Carvalho,Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 23 59 Um usuário que deseje realizar consultas multidimensionais fará uma requisição diretamente a um banco de dados multidimensional sem necessidade de qualquer tradução. Além disso, ele consultará dados pré-calculados e pré-fabricados, melhorando o desempenho da consulta. Dessa forma, quando houver uma solicitação do usuário para os dados, nenhum tempo será desperdiçado no cálculo dos dados e as respostas do sistema serão rápidas. Uma vantagem, portanto, desse modelo é seu alto desempenho, visto que os cubos de dados são construídos para uma rápida recuperação de dados e o usuário é capaz de manipular dados diretamente no servidor. Além disso, todos os cálculos são pré-gerados quando o cubo é criado e podem ser facilmente aplicados no momento da pesquisa de dados. No entanto, exige altos investimentos, uma vez que necessita de tecnologias proprietárias. Sem esquecer de sua baixa escalabilidade: sua vantagem de conseguir alto desempenho com a pré- geração de todos os cálculos no momento da criação dos cubos faz com que o MOLAP seja limitado a uma pouca quantidade de dado2s. Essas vantagens e desvantagens auxiliam o usuário a escolher com melhor acusaria a ferramenta que mais lhe atende. Ainda no contexto da loja visto anteriormente, temos que: no MOLAP, a loja tem um cubo de vendas já pré-calculado, onde os dados foram agregados por produto, por região e por mês. Quando o gerente solicita as vendas totais por produto e por mês, o sistema simplesmente consulta o cubo para buscar as informações pré-calculadas. O cubo MOLAP já possui todas as agregações (como total de vendas por produto e mês) e o gerente pode consultar esses dados com muito mais rapidez. O cubo foi construído previamente a partir dos dados detalhados e armazenado de forma multidimensional. Como resultado, as consultas são extremamente rápidas, pois os cálculos já estão prontos no cubo. No entanto, o cubo MOLAP não tem dados detalhados. Se o gerente quiser ver uma venda individual, o sistema não poderá fornecer essas informações. HOLAP (Hybryd OLAP) Trata-se de combinar as vantagens de MOLAP e ROLAP, extraindo o que há de melhor de cada uma, ou seja, a alta performance do MOLAP com a melhor escalabilidade do ROLAP. Para informações mais sintéticas, HOLAP utiliza cubos dimensionais para um desempenho mais rápido. Quando for necessário mais detalhe, ele pode ir além do cubo multidimensional para o banco relacional utilizado no armazenamento de detalhes. Uma vantagem é o alto desempenho: os cubos dimensionais apenas armazenam uma síntese das informações; e alta escalabilidade: os detalhes das informações são armazenados em um banco de dados relacional. Como desvantagem, podemos dizer que arquitetura possui um custo maior, uma vez que necessita de um alto investimento de aquisição. Bacana? Vamos ver alguns exercícios para treinar... Ainda no contexto da loja dos exemplos anteriores, essa loja pode adotar o HOLAP para equilibrar o desempenho e a flexibilidade. O cubo de vendas contém os totais agregados de vendas por produto, região e mês (como no MOLAP), mas também mantém os dados detalhados das vendas no banco relacional. Quando o gerente solicita as vendas totais por produto e por mês, o sistema consulta 2 Embora o ROLAP seja mais escalável para grandes volumes, o MOLAP é imbatível em performance (velocidade) especificamente em volumes de dados menores ou controlados (Data Marts), devido à sua arquitetura de pré-cálculo e acesso direto ao cubo André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 24 59 rapidamente o cubo MOLAP para os totais agregados. Porém, se o gerente quiser consultar uma venda individual, o sistema acessa o banco relacional para puxar os dados detalhados dessa venda específica. Como resultado, as consultas rápidas (como totais de vendas) são feitas diretamente no cubo, enquanto a consulta detalhada é feita diretamente no banco de dados relacional. Isso proporciona um bom equilíbrio entre performance e flexibilidade. O gerente pode obter informações detalhadas quando necessário, sem comprometer a velocidade nas análises agregadas. ARQUITETURA DESEMPENHO ESCALABILIDADE CUSTO MOLAP ↑ ↓ ↑ ROLAP ↓ ↑ ↓ HOLAP ↑ ↑ ↑ TIPO EXEMPLO COMO FUNCIONA VANTAGENS DESVANTAGENS ROLAP [Relational OLAP] Análise ad-hoc de vendas totais por produto e mês. Utiliza SQL dinâmico, buscando dados diretamente no banco relacional. Flexível e acessa dados detalhados. Mais lento devido à necessidade de cálculos dinâmicos e joins. MOLAP [Multidimensional OLAP] Análise de vendas totais já agregadas por produto e mês. Usa cubos pré-calculados para consultas rápidas em bancos dimensionais. Desempenho muito rápido nas consultas. Não fornece dados detalhados, apenas agregados. HOLAP [Hybrid OLAP] Consulta de vendas totais e detalhes de vendas específicas. Combina cubos (agregações rápidas) e dados detalhados armazenados no banco relacional. Equilibra desempenho e flexibilidade. Requer mais espaço de armazenamento e mais complexidade na implementação. Por fim, é importante salientar que ROLAP é mais indicado para Data Warehouses pelo grande volume de dados, pela necessidade de um maior número de funções e pelas diversas regras de negócio a serem aplicadas. Já o MOLAP é mais indicado para Data Marts, em que os dados são mais específicos e o aplicativo será direcionado na análise com dimensionalidade limitada e pouco detalhamento das informações. Existe também uma classificação quanto à origem ou ao local de execução do processamento, que trata de onde o OLAP é acessado e onde ocorre o processamento analítico. Ela se divide em DOLAP (Desktop OLAP), WOLAP (Web OLAP) e SOLAP (Server OLAP). No entanto, até hoje não vi ser cobrado em provas de concurso, portanto não vamos detalhá-la. SÍNTESE DO TÓPICO André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 25 59 Operações OLAP INCIDÊNCIA EM PROVA: ALTÍSSIMA OPERAÇÕES OLAP Conjunto de ações que permitem explorar e analisar dados multidimensionais de forma interativa, possibilitando ao usuário navegar entre diferentes níveis de detalhe e diferentes perspectivas de análise. Por meio dessas operações — como drill-down, roll-up, slice, dice e pivot — o analista pode aprofundar ou resumir informações, filtrar subconjuntos de dados, reorganizar dimensões e comparar resultados, sempre com o objetivo de identificar padrões, tendências e exceções que apoiem a tomada de decisões estratégicas. É possível executar diversas operações diferentes em um cubo de dados facilitando a navegação pelas dimensões. Antes de conhecê-las, precisamos entender o conceito de granularidade (grão). E aqui já temos uma polêmica enorme: ao resolver diversas questões de concurso, vocês verão que existe uma divergência sobre esse conceito. O problema não está exatamente na teoria, mas na forma como o termo “granularidade” e “níveis de granularidade” são utilizados em contextos diferentes em prova. Vamos lá... O que é granularidade? Granularidade refere-se ao nível de detalhamento, ou seja, o quão pequenae específica é a divisão de uma entidade ou conjunto de dados. Nesse contexto, detalhamento é antônimo de agregação. Dessa forma, o que tem maior granularidade: areia ou cascalho? Areia tem maior granularidade porque é menor (mais atômica) que cascalho. Nesse sentido, quando eu aumento a granularidade, eu estou aumentando o detalhamento (ou reduzindo a agregação dos dados). De forma análoga, quando eu reduzo a granularidade, eu estou reduzindo o detalhamento (ou aumentando a agregação). Até aqui nenhum problema –a confusão começa quando as provas utilizam o termo “nível de granularidade”. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 26 59 O raciocínio mais comum dos alunos é pensar da seguinte forma: se a “granularidade” se refere ao nível de detalhamento, então o “nível de granularidade” também se refere ao nível de detalhamento. Seguindo esse raciocínio, quanto maior o nível de granularidade, maior o detalhamento. Se você pensou assim, pronto... errou a questão! Quando as questões de concurso falam em “nível de granularidade”, você tem que trocar imediatamente em sua cabeça por “nível de hierarquia”, isto é, a altura dos níveis na hierarquia. Agora, sim, seguindo esse raciocínio, podemos concluir que, quanto maior o nível de granularidade, ou seja, quanto mais alto na hierarquia, menor o detalhamento. Se você pensou assim, pronto... acertou a questão! Para entender isso melhor, considerem a hierarquia a seguir. Agora respondam: quem tem hierarquia maior está em cima ou embaixo na imagem? Acredito que todos vão responder que está em cima! Logo, se eu subo na hierarquia, eu posso concluir que estou aumentando a granularidade (altura dos níveis); de forma análoga, se eu desço na hierarquia, eu estou reduzindo a granularidade (altura dos níveis). Ainda nesse sentido, eu posso concluir que o nível de granularidade do Nível C é menor que o nível de granularidade do Nível A, dado que está em uma altura mais baixa na hierarquia; de forma análoga, eu também posso afirmar que o nível de granularidade do nível A é mais alto que o nível de granularidade do Nível C, dado que está em uma altura mais alta na hierarquia. Para ficar mais fácil de entender, imagine que o Nível A representa Generais do Exército e o Nível C representa Soldados do Exército. Quem tem o nível hierárquico maior? O general, logo o nível de granularidade (nível de hierarquia) dele é mais alto; já o soltado representa um nível de granularidade (nível de hierarquia) mais baixo. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 27 59 Slice A operação Slice (em português, “fatiar”) consiste em fixar um único valor de uma dimensão e, a partir disso, reduzir o cubo multidimensional para uma subestrutura de menor dimensionalidade. Em termos práticos, é como “cortar” o cubo em uma direção específica, mantendo apenas os dados que atendem àquele critério. O resultado normalmente é um subcubo ou até mesmo uma matriz bidimensional, dependendo da quantidade de dimensões restantes. O objetivo do slice é simplificar a análise, permitindo foco total em um recorte específico dos dados. Dice A operação Dice (em português, “cortar”) consiste em selecionar subconjuntos de valores em duas ou mais dimensões simultaneamente, criando um subcubo a partir do cubo original. Diferentemente do slice, que fixa apenas um valor em uma única dimensão, o Dice aplica filtros múltiplos, restringindo intervalos ou conjuntos específicos de valores em várias dimensões ao mesmo tempo. Essa operação é usada quando o analista deseja uma visão mais refinada dos dados, combinando critérios e reduzindo significativamente o espaço de análise, sem perder a natureza multidimensional. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 28 59 Slice and Dice Quando realizamos um Slice, fixamos um valor em uma dimensão e reduzimos a dimensionalidade do cubo. Quando realizamos um Dice, selecionamos subconjuntos de valores em duas ou mais dimensões, mantendo o cubo, porém menor. Ao aplicar Slice and Dice em conjunto, estamos extraindo partes específicas do cubo original, criando subcubos ou visões parciais dos dados. Nesse sentido, é perfeitamente válido dizer que o cubo está sendo fragmentado, pois apenas uma fração do espaço multidimensional original está sendo analisada. Do ponto de vista teórico, o termo mais preciso é subcubo ou recorte do cubo multidimensional, mas a ideia de “fragmentação” ajuda muito na compreensão intuitiva: o cubo completo é progressivamente “quebrado” em pedaços menores, cada um representando um contexto analítico específico. Em provas, é importante lembrar que slice, dice e slice-and-dice não destroem o cubo, apenas criam visões derivadas dele. Assim, “fragmentação” pode aparecer como explicação conceitual, mas não como o nome oficial de uma operação OLAP. Em suma: a aplicação conjunta das operações slice e dice resulta na criação de subcubos, representando recortes ou fragmentações conceituais do cubo multidimensional, sem alterar o cubo original. Drill Down Essa operação consiste em aumentar o nível de detalhe da análise, navegando de um nível mais agregado para níveis mais detalhados dentro de uma hierarquia de uma dimensão. Em termos conceituais, é o movimento do geral para o específico, permitindo que o analista investigue a origem de um resultado agregado. O drill down não altera o cubo em si, mas muda o nível hierárquico exibido, aprofundando a análise e revelando informações que estavam resumidas em um nível superior. André Castro, Diego Carvalho, Emannuelle Gouveia Rolim, Equipe Exatas Estratégia Concursos, Renato da Costa, Rodrigo Rennó Aula 16 (Profs. Diego Carvalho e Emannuelle Gouveia) TCE-SC (Exceto cargo de TI) Informática e Análise de Dados - 2026 (Pós-Edital) www.estrategiaconcursos.com.br 07931781937 - Amanda Finck Drehmer 29 59 Roll Up Essa operação consiste em subir o nível de agregação dos dados, navegando de um nível mais detalhado para um nível mais resumido dentro de uma hierarquia dimensional. Ela pode ocorrer de duas formas principais: (1) agregando valores ao longo de uma hierarquia explícita (Ex: mês → trimestre → ano na dimensão tempo) ou (2) reduzindo dimensões, quando se elimina um nível de detalhe para obter uma visão mais consolidada. O objetivo do Roll-Up é permitir análises mais macro, respondendo perguntas do tipo “qual o total por período maior?”, sacrificando detalhe em troca de visão estratégica. Drill-Across Aqui infelizmente também temos uma polêmica grande, dados que o termo Drill Across é usado de formas diferentes na literatura técnica e nas questões de concurso, o que gera interpretações conflitantes. Do ponto de vista clássico da modelagem dimensional (Kimball), Drill Across não é uma navegação dentro de um único cubo, como ocorre no Drill Down ou Drill Up. Ele ocorre quando o analista compara ou combina medidas de tabelas fato diferentes, desde que essas tabelas compartilhem dimensões conformadas (mesmo significado, mesma granularidade e mesmas chaves). Por outro lado, em questões de prova, algumas bancas tratam