Armazenamento em Nuvem com Ceph X Storage Tradicional

11 de abril de 2023

A internet está se transformando e as novas perspectivas de conectividade são uma realidade presente e inadiável. Digital First, Phygital e Web 3.0 são conceitos que você, que vem acompanhando nosso blog, já domina. Falamos de aplicações de inteligência artificial, internet das coisas, robótica, computação e armazenamento em nuvem, entre tantos usos dos mais modernos e inteligentes, que impactam a atuação dos provedores de serviço de TI.

Hiperescala é a palavra da vez para garantir aos clientes dos datacenters a inteligência e a interoperabilidade que geram valor competitivo. E no caso do armazenamento e tratamento de informações, falamos de uma necessidade premente e urgente, já que os volumes de dados que criamos e manipulamos cresce exponencialmente.

Uma realidade já percebida por quem vive o mercado de datacenter e telecomunicações, que segundo estudos e estatísticas, só tende a aumentar. O relatório setorial de TI divulgado pela Brasscom reúne dados abertos e de consultorias internacionais e projeta que, até 2025, as novas tecnologias registrem crescimento acima dos dois dígitos. Esse  impulso está relacionado à expansão das redes 5G que, como também já registramos por aqui, exige provedores de serviço prontos para o edge computing e o tratamento de um legítimo oceano de informações.

Esse artigo vai focar justamente nas diferenças entre um storage tradicional e o armazenamento em nuvem com SDS Ceph, quando se trata de eficiência em armazenamento de dados.

Os dados como fator central das novas estratégias

Mas antes de falarmos desse assunto em específico, vale a pena registrar outros dados presentes no relatório setorial da Brasscom, traçando bons indicativos quanto aos caminhos que vêm sendo percorridos no rumo da crescente transformação digital em curso. Dentre as projeções do levantamento, se destacam:

  • A computação em nuvem segue em destaque, devendo crescer 24% ao ano, com uma geração de receita de R$ 181,1 bilhões até 2025;
  • Big Data & Analytics são outra área para o qual estão voltados os olhos do mercado. A projeção é de crescimento de 27% ao ano e uma geração de receita de R$ 56,9 bilhões até 2025;

São estatísticas que apontam um crescimento de mercado e demanda a serem atendidas pelos provedores de serviço de TI, principalmente quanto ao tratamento de dados que, não sem motivo, vem sendo chamados de “novo petróleo”.

O volume de dados armazenados, distribuídos e processados pelas empresas cresce exponencialmente a cada ano. Os provedores MSP e CSP tem milhares, ou até mesmo dezenas de milhares de empresas consumindo seus serviços de edge e cloud computing. Para oferecer mais flexibilidade e controle, nesse cenário hiperescalável de armazenamento de dados, foi desenvolvida a tecnologia de armazenamento definido por software (software defined storage – SDS). O Ceph é se difere dos storages tradicionais por implantar a redundância e consistência dos dados armazenados através de software, e não hardware, como vamos entender melhor.

A noção de storage

Uma tradução simples de storage nos leva ao termo armazenar e permitir a manipulação dos dados de diferentes maneiras e formatos, como Block (para consumo de VMs), File (para consumo de sistemas de arquivos) ou Object (para consumo através de API e protocolo S3). O foco é uma infraestrutura eficiente não só de armazenamento, mas também do provisionamento de dados, a partir de dispositivos e softwares que capturam e “guardam” esse conjunto de informações gerados pela nossa rotina digital diária.

Lidamos, constantemente, com planilhas, vídeos, imagens, e-mails, formulários, dentre tantas outras operações que geram dados a ser armazenados e tratados. Os dispositivos que dão apoio a esse processo incluem memória, discos rígidos, ou sistemas de armazenamento usados para manter informações e aplicativos seguros e disponíveis o tempo todo. Essas estruturas de provisionamento de dados seguem duas principais lógicas.

  • Armazenamento tradicional: é baseado em dispositivos de armazenamento como discos rígidos (HDD) ou unidades de estado sólido (SSD), que são disponibilizados através de controladoras RAID, hardware que atua como um processador especializado no cálculo de paridade e redundância dos dados armazenados e manipulados. Esse tipo de armazenamento é configurado principalmente  para ser acessado diretamente pelo servidor através de redes privadas locais;
  • Armazenamento em nuvem: além dos recursos oferecidos pelo armazenamento tradicional, oferece suporte a protocolos de sistemas de arquivos de rede. além de suporte a operações cloud native, como o protocolo de armazenamento e API S3. Esse tipo de armazenamento, também conhecido como sloud storage é configurado principalmente  para ser acessado através de redes públicas como a Internet.

Storages tradicionais x Armazenamento em Nuvem SDS como o Ceph

Os storages tradicionais implementam uma solução baseada em hardware especialista. Isso significa que uma vez que você opta por um fornecedor, precisa sempre adquirir capacidade de armazenamento do mesmo fornecedor. Todo o sistema de armazenamento, desde o gabinete, passando pelas controladoras RAID (redundant array of inexpensive disk), e  até as unidades de disco e interfaces de rede são proprietárias daquele fornecedor. Isso leva a que muitos provedores tenham mais de um sistema de armazenamento, dentre outros motivos, para garantir que o custo por gigabyte seja sempre o menor possível, através da concorrência entre mais de um fornecedor.

Além da complexidade óbvia de operar múltiplos sistemas de armazenamento fornecidos por diferentes fabricantes, a arquitetura de armazenamento  tradicional não é o ideal nem para o provedor, nem para o cliente-final: Na perspectiva do provedor, você acaba lidando com “silos” de armazenamento: corre-se o risco que em determinado momento do tempo haja capacidade ociosa no fornecedor “A”, porém é necessária a adição de maior capacidade em fornecedor “B”. Sob o ponto de vista do cliente, esses silos de armazenamento podem impor limites de tipos de protocolos suportados para o ambiente: é prática comum nos provedores utilizar determinado fabricante para suporte a armazenamento de Block e outro fabricante para armazenamento tipo File, por exemplo.

Nesse sentido, entram em cena os sistemas de armazenamento definido por software, como o Ceph, que abstrai as funcionalidades de armazenamento e manipulação de dados do hardware para o software. O sistema de armazenamento em nuvem utiliza servidores padrão x86 e unidades JBOD (just a bunch of disk), integradas diretamente no servidor, o que no mercado se refere como “storage servers”. Isso garante que você possa combinar virtualmente qualquer fabricante para criar seus agrupamentos de armazenamento (storage clusters), a um preço que é uma fração se comparada a arquitetura RAID tradicional.

A combinação de JBOD com a flexibilidade de comprar armazenamento de qualquer fabricante garante um custo por gigabyte imbatível. Adicionalmente, o SDS Ceph permite leitura e escrita simultânea entre diversos storage cluster, significa que quanto maior o número de storage servers e clusters no ambiente, mais performático será o sistema de armazenamento: uma abordagem para suporte a hyper-escala.

Implantar um sistemas de armazenamento em nuvem com SDS Ceph no seu datacenter traz ganhos significativos para você e para seus clientes. Dentre os mais evidentes estão:

  • O custo por gigabyte é imbatível, se comparado a sistemas de armazenamento tradicional
  • Desempenho das plataformas SDS é superior, principalmente em ambientes com alta densidade
  • Suporte nativo e simultâneo à armazenamento tipo Block, File e Object

Conceitos do SDS Ceph

Em termos operacionais, o Ceph usa NoSQL e Object Store para armazenando de  cada pedaço de dados em um namespace plano e não hierárquico e relacionado a um “unique identifier”, com os metadados do arquivo sendo armazenados junto com o próprio dado.

O cluster de armazenamento em nuvem com Ceph é composto de object storage daemons/devices (OSDs). Torna-se possível, portanto, a um único cluster armazenar vários pools de armazenamento. É um sistema de armazenamento que torna o processo de guarda e manipulação do dado altamente escalável e muito mais acessível.

Sistemas Ceph possuem funções de autogerenciamento e recuperação para automatizar o gerenciamento dos dados, como distribuição, redistribuição e replicação dos dados, assim como detecção e recuperação de falhas. O sistema não possui um ponto único de falha, uma vez que os dados são distribuídos e gerenciados por agentes autônomos.

O Ceph possui interfaces que suportam três tipos de modos de dados (block, file e object), aqui é importante ressaltar que os gateways do Ceph emulam essas três formas de armazenamento, porém, internamente, o Ceph sempre armazena os dados no formato de objetos.

>>Saiba mais aqui: https://novo.scclouds.com.br/wiki/ceph-introducao/

Deseja saber mais sobre armazenamento em nuvem com SDS Ceph e sua vantagens em relação ao storage tradicional?

A SC Clouds conta com um time altamente capacitado para a implementação do SDS Ceph. Nosso time é especializado e experiente em auxiliar todo o seu processo de adoção do Ceph, em suas diferentes etapas, do planejamento à implantação completa, disponibilizando ainda customizações e total suporte para a resolução de problemas.

Além de figurarmos dentre os principais colaboradores das comunidades atuantes no desenvolvimento do software, somos donos de distribuição própria de todas as tecnologias que atuamos. Isso significa totais condições de assegurar um código-fonte estável, para suporte à missão crítica.

Quer utilizar o Ceph com total segurança e garantia de efetividade?  Converse com um dos nossos especialistas!

Continue lendo

Fale com um especialista

Especialistas em provedores de Edge e Cloud Computing