Prévia do material em texto
Definição do Sistema de Armazenamento Descrever técnicas de Armazenamento de Dados para Composição da Solução Multimídia Introdução Dificilmente o negócio consegue sobreviver no mercado sem coletar e gerenciar informações. Na era da informática, da comunicação digital, em que dados podem ser compartilhados de um extremo a outro do planeta em segundos, a posse da informação tornou-se o ativo mais importante das empresas. Em alguns casos é mais valioso do que o patrimônio físico, como imóveis e veículos. Informações meramente técnicas, dados de rede, dados de acesso, dados de usuários, podem se transformar em informações de negócios, indicadores de vendas, de marketing e de planejamento, bastante para isso, uma correta interpretação e análise. Dificilmente uma empresa consegue sobreviver no mercado competitivo e globalizado sem coletar e gerenciar as informações relativas aos seus clientes, fornecedores, concorrentes, indicadores econômicos e sociais, produtos e serviços, exportações e outras que impactam direta ou indiretamente em seu negócio. Para auxiliar no processo de gestão destes dados, foram desenvolvidos os sistemas de informação. A opção por uma estratégia de adoção do tipo de sistema de armazenamento de dados devem levar em conta as necessidades do negócios, mas também: volume de dados, investimento, segurança. Durante este tópico, serão apresentadas algumas soluões de armazenamento de dados. Manter os dados gerados pela solução Multimidia, auxiliará o projeto em processos de: backup/restore, segurança, auditoria (interna e/ou externa), atualizacao de software, atualizacao de configuracao. Conceitos de Backup DAS, NAS e RAID DAS Quando você precisa de mais espaço de armazenamento no seu micro de trabalho, a opção mais comum é simplesmente comprar outro HD. Quando falamos em redes, entretanto, três siglas vêm à tona: NAS, DAS e SAN, acompanhadas geralmente por longas discussões sobre qual das três é mais adequada a determinada situação. Pode parecer estranho que uma grande empresa pague 50.000 dólares para implementar uma SAN, que oferece apenas alguns terabytes de espaço de armazenamento, quando seria possível obter o mesmo espaço usando um punhado de HDs comuns instalados em um servidor de arquivos, mas, como de praxe, existem fatores que justificam o investimento em muitas situações. Vamos então a uma explicação sobre as três tecnologias, começando com a mais simples: DAS. A sigla DAS é abreviação de "Direct Attached Storage". Ela se refere a dispositivos de armazenamento externo ligados diretamente ao servidor (ou a qualquer outro micro da rede), como no caso das gavetas de HD ligadas a portas eSATA (o eSATA é uma versão externa das portas SATA, que mantém a mesma velocidade de 150 ou 300 MB/s, mas permite o uso de um cabo externo) ou a portas USB, por exemplo. Além de gavetas e suportes baratos para ligar HDs externos, a lista inclui dispositivos mais caros. Nas fotos a seguir temos dois exemplos. O primeiro é uma gaveta de HD simples, ligada em uma porta USB e o segundo é uma unidade eSATA da Micronet, que utiliza 5 HDs, com RAID via hardware e outras funções. Apesar da diferença de complexidade, temos em ambos os casos unidade externa ligada à uma porta USB ou eSATA, que não tem nada a ver com redes: Direct-Attached Storage (DAS) NAS Um NAS (Network Attached Storage), por sua vez, roda um sistema operacional completo e funciona como um servidor de arquivos, ligado diretamente na rede. Muitas vezes, eles são chamados de "network storage", ou simplesmente de "storage", termos que são mais descritivos para o público não técnico do que "NAS". Entre o público técnico, eles são também chamado de "filers" (arquivadores). O termo "storage" é na verdade um termo técnico genérico para soluções de armazenamento, que é usado também em outras situações, como no caso das SANs. Existem muitas opões de NAS, que vão desde sistemas baratos, que custam pouco mais que uma gaveta USB, até equipamentos caros, que utilizam um grande número de HDs. Os modelos mais baratos comportam apenas um ou dois HDs e oferecem apenas funções básicas. Alguns modelos incluem também um transmissor wireless ou disponibilizam uma porta USB, o que permite que sejam ligados ao PC diretamente e seja usados como um DAS. Modelos intermediários suportam em sua maioria 4 drives e modelos high-end ou racks para uso em datacenters suportam muitas vezes 8 drives ou mais. Os modelos com apenas um HD são genericamente chamados de single-drive e os que utilizam dois ou mais são chamados de multi-drive. Alguns modelos são vendidos sem os drives, que forma que você pode instalar os HDs que quiser (eles são chamados de "diskless") e são geralmente bem mais baratos, enquanto muitos fabricantes optam por vender os aparelhos com drives pré-instalados (chamados genericamente de "diskfull"), de forma a tentar agregar valor e trabalhar com margens de lucro um pouco maiores. Ao ver o anúncio de um "diskless NAS" no catálgo de alguma loja do exterior, por exemplo, você pode presumir que se trata de um modelo sem os HDs. NAS I/O Operation Via de regra, um NAS não faz nada que um PC tradicional não possa ser configurado para fazer. Um número surpreendente deles utilizam processadores x86, rodam Linux e compartilham os arquivos com a rede utilizando o Samba. Ou seja, nada mais são do que PCs compactos, otimizados para a tarefa. A principal vantagem é que eles são soluções prontas, que podem ser instaladas rapidamente, sem exigir muitos conhecimentos técnicos, o que os torna ideais para uso em escritórios e redes domésticas, por exemplo. Os modelos mais simples são bem mais baratos que um PC, além de serem menos compactos e consumirem menos energia, enquanto os modelos mais caros oferecem mais espaço de armazenamento, recursos de redundância e de gerenciamento que permitem o uso em redes que demandam um maior nível de confiabilidade. Existem ainda distribuições Linux ou BSD que permitem transformar um PC comum em um NAS de forma prática. Um bom exemplo é o FreeNAS (baseado no FreeBSD), que pode ser instalado de forma simples, ocupando apenas 32 MB, e é inteiramente administrado através de uma interface de gerenciamento via web, sem precisar de monitor. Ele suporta o uso de RAID, compartilhamentos via CIFS (Samba), FTP, NFS e SFTP, além de oferecer um grande volume de recursos de gerenciamento. Você pode baixá-lo no http://www.freenas.org. Outro projeto similar é o OpenFiler, disponível no http://www.openfiler.com. Solicitação FreeNas - Solucao Open Source O uso de um NAS, ou de um servidor de arquivos com vários HDs atende bem à maioria das redes de pequeno e médio porte. Entretanto, muitas empresas precisam de muito mais espaço de armazenamento, sobretudo quando falamos em grandes bancos de dados e aplicações web. Usar vários pequenos servidores seria uma solução barata, mas em compensação complexa e mais propensa a falhas. Surge então a opção de usar uma SAN (Storage Area Network). SAN Toda SAN tem como bloco de montagem HDs tradicionais, que são ligados a uma unidade controladora (que se encarrega do acesso aos dados, RAID e outras funções) e é ligada a um servidor através de uma interface dedicada, que pode ser tanto uma interface Fibre Channel quanto uma interface de rede Gigabit Ethernet ou 10 Gigabit Ethernet (usando o iSCSI). O servidor se encarrega então de distribuir os dados para os clientes da rede ou fornecê-los para aplicativos específicos, como no caso de um cluster de servidores web, que utilizam a SAN para armazenar um grande banco de dados usado para atender às requisições dos clientes. Além da maior capacidade de armazenamento e de recursos de redundância, a principal diferença de uma SAN e um NAS ou um servidor de arquivos tradicional é que o SAN se comporta como se fosse uma única unidade de armazenamento, que o servidor pode acessar diretamente, de forma transparente. Ou seja, é como se você conectasse um único HD de 100 TB (por exemplo) no servidor, diferente de um NAS, que se comportacomo um servidor de arquivos e pode ser acessado simultaneamente por vários clientes. Apesar disso, na grande maioria dos casos, o objetivo de usar uma SAN não é simplesmente obter um grande espaço de armazenamento, mas sim obter ganhos de desempenho e de confiabilidade para aplicações críticas. Imagine o caso de um cluster de servidores responsáveis pelo site de um grande portal. As páginas são montadas a partir de um enorme banco de dados, armazenado na SAN, que é acessado de forma conjunta por todos os servidores do cluster. As unidades de armazenamento combinam um grande número de HDs em RAID, o que as torna capazes de atender a um grande volume de requisições por segundo, o que permite atender aos muitos visitantes simultâneos. Além do desempenho e do armazenamento centralizado, temos também a questão da redundância, que garante que o sistema funcione de forma contínua, sobrevivendo a falhas em componentes diversos. http://www.freenas.org/ http://www.openfiler.com/ Rede SAN Os componentes básicos de uma SAN são um ou storage racks (as unidades de armazenamento, com os arrays de discos), um switch Fibre Channel, os cabos e o servidor ao qual a SAN é conectada. Apesar disso, é comum o uso de dois switchs e dois servidores, de forma a oferecer um sistema redundante (o segundo servidor fica a postos para assumir o lugar o primeiro em caso de falha). Os componentes são ligados como na figura abaixo, de forma a garantir que o sistema continue funcionando caso qualquer um dos componentes falhe. Topologias iSCSI: iSCSI nativo A principal vantagem do uso de uma SAN é que o sistema pode ser expandido conforme necessário, incluindo mais storage racks e mais switchs. Os diferentes arrays podem então ser acessados por diferentes servidores e, dependendo da configuração, até mesmo serem configurados para se comportarem como uma única unidade, com as capacidades somadas. Se dinheiro não for problema, é possível atingir facilmente a marca de 100 terabytes de espaço de armazenamento, com direito a um sistema de redundância completo. O grande problema é mesmo a questão do custo, já que um SAN completa pode facilmente superar a marca dos US$ 50.000, em preços do exterior. Isso faz com que elas fiquem restritas a ambientes onde as vantagens compensam o maior custo. Para pequenas redes, servidores com diversos HDs (configurados como um array RAID) acabam sendo a melhor opção, já que podem oferecer um espaço de armazenamento similar ao de uma pequena SAN (embora com um desempenho e confiabilidade inferiores) a uma fração do custo. Storage Rack Continuando, é possível também que um único array seja dividido em várias unidades lógicas, cada uma com um identificador próprio (chamado de LUN, ou "Logical Unit Number"), permitindo que cada unidade possa ser acessada por um servidor diferente. Isso permite centralizar o armazenamento de dados da rede, armazenando todos os dados importantes na SAN, ao invés de utilizar HDs separados em cada servidor. As unidades podem ser inclusive redimensionadas durante o uso, realocando o espaço entre os servidores conforme necessário. O Fibre Channel é um padrão de redes desenvolvido especialmente para uso de unidades remotas de armazenamento. Existem diversos padrões de Fibre Channel, que incluem o 1GFC (1.06 gigabits), 2GFC (2.12 gigabits), 4 GFC (4.25 gigabits), 8GFC (8.5 gigabits) e o 10GFC (10.5 gigabits), sendo que atualmente (início de 2008) os padrões mais usados ainda são o 2GFC e o 4GFC. Existem três topologias de Fibre Channel: Ponto-a-ponto (dois dispositivos ligados diretamente), Arbitrated loop (onde os dispositivos são ligados uns aos outros, formando um anel) e Switched fabric (onde os dispositivos são ligados a um switch central, de forma similar ao que temos em uma rede de par trançado). Como pode imaginar a topologia Switched fabric é de longe a mais utilizada atualmente. Embora exista um padrão de Fibre Channel que utiliza fios de cobre, os cabos de fibra óptica são de longe os mais comuns. É possível utilizar cabos de fibra óptica de até 50 km, utilizando cabos monomodo, mas o mais comum é que sejam usados cabos multimodo (mais baratos e suficientes para a maioria das situações), que oferecem um alcance de até 300 metros. Tipicamente, os cabos são curtos, com de 2 a 10 metros, de forma que a questão do alcance raramente é um problema. As controladoras Fibre Channel são chamadas de FC HBA (Fibre Channel Host Bus Adapter). Exemplo de Implantacao com Fibre Channel Outra tecnologia, mais recente é o iSCSI (pronuncia-se "ai-iscâzi") que permite que o cliente (chamado de initiator) envie comandos SCSI para um array de armazenamento (chamado de target) via TCP/IP, utilizando uma rede Ethernet tradicional. Isso permite que eles sejam sejam acessados como se fossem unidades de armazenamento local através de cabos de rede. Você pode pensar no iSCSI como um protocolo para encapsular comandos de acesso a disco, juntamente com os dados resultantes, transformando-os em pacotes TCP/IP. A função é basicamente a mesma do Fibre Channel, ou seja, interligar os servidores aos arrays de discos que formam a SAN, mas nesse caso a um custo mais baixo, já que dispensa o uso dos caros switchs, controladores e cabos Fibre Channel, substituídos por cabos de rede e switchs Ethernet. As funções da controladora SCSI podem ser também executadas via software (o software cliente é chamado de iSCSI initiator), o que permite utilizar uma placa de rede Ethernet regular no lugar da controladora iSCSI. O desempenho é naturalmente mais baixo, mas a redução no custo faz com que esta seja a opção mais usada em pequenas instalações. Com relação ao cabeamento, o ideal é que seja utilizado um segmento dedicado entre o servidor e os arrays de discos, mas o tráfego do iSCSI pode conviver com o tráfego Ethernet da rede, de forma que (embora não seja a solução ideal do ponto de vista do desempenho, nem da segurança) é possível simplesmente ligar os arrays em uma rede já existente, utilizando inclusive links de longa distância, o que permite a criação de sistemas de armazenamento remoto. Componentes de iSCSI Outra solução adotaba por muitas empresas e que vem ganhando força ao longo dos últimos anos, é a adoção de sistemas de armazenamento distribuidos em nuvem (Cloud) Nuvem (Cloud) O armazenamento em nuvem é um serviço oferecido para usuários da internet. A ideia é muito similar ao conceito de rede dentro de uma empresa ou de sua própria casa: usando um computador como servidor você consegue acessar esses dados de qualquer outro computador, desde que tenha acesso à rede (intranet ou internet). Serviços de armazenamento na nuvem, como Google Drive, Dropbox, Box e iCloud permitem que os usuários armazenem e compartilhem grandes arquivos facilmente na internet. Enquanto “nuvem” é a palavra de ordem técnica do ano, muitos empresários ainda estão receosos sobre a eficiência e segurança da Computação em Nuvem. Serviços em Nuvem Conceito de Cloud O conceito de armazenamento é semelhante ao conceito cliente-servidor, no entanto, neste caso com o acréscimo da Internet (ou a propria WAN), Virtualização de Ambientes, DataCenters, etc. Nesse sentido, o cliente se conecta aos serviços "em nuvem" através da Internet. Não necessariamente sabemos onde estão alocados fisicamente os arquivos e, na maioria das vezes a plataforma utilizada é indiferente para o usuário. Ou seja, todo o processamento e logica de armazenamento fica a cargo do hospedeiro. Formas de Utilização SaaS - Software as a Service● Software como Serviço, como por exemplo: Google Drive, Dropbox, Office 365, etc.● PaaS - Platform as a Service● Plataforma como Serviço (comum para areas de desenvolvimento), como por exemplo: Heroku, Google● App Engine, etc. IaaS - Infrastructure as a Service● Infraestrutura como Serviço, como por exemplo: Amazon AWS, Windows Azure, etc.● Tudo isto pode ser mesclado, gerando soluções infinitas! Conceito de Nuvem pelo NIST (National Institute of Standards and Technology) “ummodelo para acesso a rede sob demanda, ubíquo e conveniente para um pool compartilhado de recursos computacionais configuráveis que podem ser rapidamente provisionados e lançados com mínimo esforço de gerenciamento ou interação com o provedor de serviços" Pontos de Atenção Segurança dos dados● Os seus dados não estão “debaixo da sua asa” (sob seu poder)● Necessidade de grande quantidade de banda● Altas velocidades de conexão com à Internet● Disponibilidade da conexão● Mudança de paradigma● Arquitetura Cloud Conclusão O tipo do método de escolha que deverá ser usado, deverá, claramente levar em consideração questões que envolvem: custos diretos e indiretos (operacionais), manutenção, controles e sobretudo o risco da operação. Todas os métodos aqui apresentados, poderiam ser utilizados no projeto. A diferença entre eles, estará relacionada à complexidade do sistema e de sua criticidade pro negócio. O aluno deve levar em consideração fatores supracitados e decidir sobre a melhor solução. As soluções DAS, NAS e SAM, também podem ser viabilizadas em soluções de hosting em provedores de serviço disponíveis no mercado. Quiz 1 Em relação às tecnologias de redes para o armazenamento e compartilhamento de dados, é correto afirmar que: o acesso aos dados armazenados em um dispositivo NAS é possível somente através do servidor conectado ao dispositIvo de armazenamento; a tecnologia SAN é indicada para sistemas transacionais desde que não sejam sistemas de missão crítica; na tecnologia DAS o dispositivo de armazenamento possui sistema operacional próprio para controlar todo o sistema de arquivos e quem acessa o dispositivo não tem controle nem conhecimento da estrutura de discos; a tecnologia SAN representa um armazenamento de dados de acesso restrito e isolado a um único computador; a tecnologia NAS permite o compartilhamento de arquivos entre servidores, mesmo com diferentes sistemas operacionais. 2 Em relação às tecnologias de redes para o armazenamento e compartilhamento de dados, analise as afirmativas a seguir: 1. Tecnologia adequada para compartilhar arquivos. As responsabilidades de formatar, particionar e distribuir informações nos discos do dispositivo de armazenamento são do próprio dispositivo de armazenamento. 2. Tecnologia indicada para sistemas transacionais ou de missão crítica. Bloco de dados é tipo de informação que trafega entre servidores e o dispositivo de armazenamento. 3. Tecnologia em que o armazenamento se dá em conexão direta ao servidor. A capacidade de crescimento de armazenamento é limitada à capacidade do servidor em termos do número de portas de conexão ou por limitação de espaço físico do servidor para acrescentar mais discos. Essas afirmativas são, respectivamente, características das seguintes tecnologias de armazenamento: NAS, DAS e SAN; SAN, DAS e NAS; DAS, SAN e NAS; NAS, SAN e DAS; SAN, NAS e DAS. Quiz 1 Dentre os sistemas de armazenamento de dados, conhecidos pelas siglas SAN, NAS e DAS, as grandes empresas costumam adotar o SAN, pois utiliza o esquema de armazenamento em blocos, o que lhe confere maior desempenho se comparado com o NAS permite o acesso múltiplo, ou seja, por vários usuários, uma vez que é implementado com um sistema operacional completo. utiliza o esquema de transferência de arquivo, o que lhe confere facilidade de operação com diversos sistemas operacionais. é conectado diretamente ao servidor, em racks com discos, o que lhe confere maior desempenho devido à proximidade com o servidor. incorpora o recurso de espelhamento de disco, implementado em seu sistema operacional, o que lhe confere maior confiabilidade. Referências KUROSE, J.; ROSS, W. K. Redes de Computadores e a Internet – uma abordagem topdown 3 ª Edição. Pearson. 2005. Guia do Hardware, Armazenamento de rede: DAS, NAS e SAN . Disponivel em: http://www.hardware.com.br/tutoriais/das-nas-san/. Acesso em 18/05/16 TANENBAUM, Andrew S. Organização estruturada de computadores. 4. ed. São Paulo: Prentice Hall, 2007. Perallis, A importância do armazenamento de dados para as micro e pequenas empresas. Disponivel em: http://www.perallis.com/news/a-importancia-do-armazenamento-de-dados-para-a- -micro-e-pequenas-empresas. Acesso em 18/05/16 CESAR, Eduardo,Armazenamento em nuvem você sabe o que é. Disponivel em: http://www.cdbinformaticatechnology.com/armazenamento-em-nuvem-voce-sabe-o-que-e/. Acesso em 05/04/16