A Oracle anunciou hoje a disponibilidade geral do MySQL HeatWave Lakehouse, trazendo uma novidade para o setor ao permitir que os clientes consultem dados em armazenamento de objetos com a mesma rapidez de consultar dados dentro do banco de dados. Com o MySQL HeatWave Lakehouse, os clientes podem consultar dados no armazenamento em vários formatos de arquivo, como CSV, Parquet e arquivos de exportação de outros bancos de dados, e têm a opção de combiná-los no banco de dados MySQL. Além disso, arquivos no armazenamento são consultados diretamente pelo HeatWave sem copiar os dados no banco de dados MySQL. Como resultado, o MySQL HeatWave Lakehouse define novos padrões de escalabilidade e desempenho para processamento de consultas, velocidade de carregamento de dados, tempo de provisionamento de clusters e automação para consultar dados no armazenamento de objetos.

“Mais de 80% dos dados são armazenados em sistemas de arquivos e esse número está crescendo exponencialmente. Os clientes querem integrar e analisar esses dados externos variados com seus dados transacionais internos, mas geralmente são muito complexos ou muito caros de processar”, disse Edward Screven, arquiteto-chefe corporativo da Oracle. “Com o MySQL HeatWave Lakehouse, ficou mais fácil de os clientes obterem insights valiosos em tempo real combinando seus dados no armazenamento de objetos com dados do banco de dados e, ao mesmo tempo, o desempenho da consulta é significativamente maior e o carregamento dos dados é muito mais rápido a um custo menor.”

Consultar dados no armazenamento de objetos ficou tão rápido quanto consultar dados dentro do banco de dados

Conforme demonstrado por um benchmark TPC-H* de 10 TB, consultar dados no armazenamento de objetos em formatos de arquivo populares com o MySQL HeatWave Lakehouse é tão rápido quanto consultar dados no banco de dados MySQL. Isso é possível graças ao MySQL Autopilot, um recurso integrado do MySQL HeatWave que fornece automação baseada em machine learning, que aprende com a execução de consultas e melhora o plano de execução de consultas futuras. O MySQL Autopilot é uma inovação do MySQL HeatWave que não está disponível em nenhum outro lugar. O MySQL HeatWave na Oracle Cloud Infrastructure (OCI) tem a tecnologia dos processadores AMD EPYC™.

“As equipes de engenharia do AMD e MySQL HeatWave estão colaborando estreitamente para otimizar o MySQL HeatWave para processadores AMD EPYC a fim de aproveitar os novos recursos do processador”, disse Forrest Norrod, vice-presidente executivo e gerente geral do Data Center Solutions Business Group, AMD. “Graças a essa colaboração, os clientes do MySQL que executam o MySQL HeatWave em instâncias da OCI com tecnologia da CPU AMD EPYC se beneficiam de uma excelente vantagem de preço/desempenho para suas cargas de trabalho críticas para os negócios, incluindo análises em tempo real de grandes volumes de dados armazenados no armazenamento de objetos.”

Melhor desempenho para casos de uso do lakehouse

Conforme demonstrado por um TPC-H de 500 TB*, o desempenho da consulta do MySQL HeatWave Lakehouse é:

  • 9X mais rápido do que o Amazon Redshift
  • 17X mais rápido do que o Snowflake
  • 17X mais rápido do que o Databricks
  • 36x mais rápido do que o Google BigQuery

O desempenho para carregar dados do armazenamento de objetos com o MySQL HeatWave Lakehouse é:

  • 9X mais rápido do que o Amazon Redshift
  • 2X mais rápido do que o Snowflake
  • 6X mais rápido do que o Databricks
  • 8x mais rápido do que o Google BigQuery

O desempenho incomparável do MySQL HeatWave é resultado de sua arquitetura de expansão que permite o paralelismo massivo para provisionar o cluster, carregar dados e processar consultas com até 512 nós. Além disso, as melhorias do MySQL Autopilot automatizam a criação de metadados para arquivos de objetos e se adaptam dinamicamente ao desempenho do armazenamento de objetos subjacente para fornecer o melhor desempenho em qualquer região da OCI.

O MySQL HeatWave é o único serviço de nuvem que fornece processamento de transações, análise em tempo real, machine learning, consulta de data lake e automação baseada em machine learning em um único serviço de banco de dados MySQL. Parte essencial da estratégia de nuvem distribuída da Oracle, o MySQL HeatWave está disponível na OCI, nativamente na Amazon Web Services, como parte do Oracle Database Service for Azure e nos data centers dos clientes com a OCI Dedicated Region.

Opiniões de clientes, parceiros e analistas sobre o MySQL HeatWave Lakehouse

“Os dados estão crescendo exponencialmente, assim como a quantidade de dados que armazenamos em nosso data lake. A capacidade de usar a sintaxe padrão do MySQL para consultar dados em nosso banco de dados e no armazenamento de objetos para obter insights em tempo real é muito importante para a Natura”, disse Fabricio Rucci, arquiteto de soluções da Natura&Co. “Isso abre novas oportunidades de explorar e pode representar novas vantagens competitivas se pudermos analisar todos esses dados mais rápido do que nossa concorrência.”

“O HeatWave Lakehouse se expande muito bem para carregar dados do armazenamento de objetos e para executar consultas no armazenamento de objetos”, disse Henry Tullis, líder de Infraestrutura e Engenharia na Nuvem, Deloitte Consulting. “O tempo de carregamento e os tempos de consulta são quase constantes à medida que o tamanho dos dados aumenta, e o tamanho do cluster HeatWave aumenta de forma correspondente. Essa característica de expansão do HeatWave Lakehouse para gerenciamento de dados é fundamental para processar grandes volumes de dados com eficiência.”

“Desde que o Big Data existe, as consultas do Big Data/Lakehouse são consideravelmente mais lentas do que as consultas transacionais”, disse Holger Mueller, vice-presidente e analista principal da Constellation Research. “O MySQL HeatWave acaba com isso de uma vez por todas, demonstrando que o desempenho do Lakehouse pode ser idêntico ao desempenho da consulta de transação, algo inédito e até mesmo impensável. Com a paridade de desempenho das consultas do HeatWave, os CxOs não precisam mais se preocupar com o local dos dados e como consultá-los. O “molho secreto” é o Autopilot do HeatWave que otimiza as consultas. Mais uma vez, a equipe do HeatWave trouxe algo inédito para o setor.”