Home Notícias Databricks adquire Tabular para construir um padrão comum de data lakehouse

Databricks adquire Tabular para construir um padrão comum de data lakehouse

32
0

Databricks, gigante de análise e IA, adquiriu a empresa de gerenciamento de dados Tabular por um valor não revelado. (CNBC informa que Databricks pago mais de US$ 1 bilhão.)

De acordo com para o cofundador da Tabular, Ryan Blue, ele e os outros dois cofundadores da Tabular, Daniel Weeks e Jason Reid, ingressarão na Databricks de alguma forma. Lá, eles trabalharão para unificar as bases de clientes e comunidades da Tabular e Databrick.

“Juntar-se ao Databricks significa que haverá mais contribuições de nossos novos colegas”, escreve Blue em uma postagem no blog. “Ao fazer isso, garantimos que nossa abordagem para [our community] não está mudando.”

Tabular, que foi fundada por Blue, Weeks e Reid em 2021, oferece produtos de gerenciamento de dados construídos no Apache Iceberg, um projeto que Blue e Weeks desenvolveram enquanto estavam na Netflix e posteriormente doados à Apache Software Foundation. Iceberg é um formato de código aberto e de alto desempenho para bancos de dados que otimiza tabelas em bancos de dados para big data e, ao mesmo tempo, permite que mecanismos de dados trabalhem com as tabelas.

A Iceberg competiu com o Delta Lake da Databricks nas guerras de formato por data lakehouses – arquiteturas de dados construídas para armazenar grandes quantidades de dados brutos, ao mesmo tempo que forneciam estrutura e funções de gerenciamento. Embora o Iceberg e o Delta Lake usem o formato de armazenamento de dados Apache Parquet, eles são incompatíveis em aspectos importantes.

Em breve, porém, Delta Lake e Iceberg convergirão em um só. Databricks e Tabular prometem trabalhar em direção a um padrão comum à luz das notícias de aquisição.

“[We will be] trabalhando para melhorar o suporte do Iceberg em toda a plataforma Databricks”, disse Blue. “Nosso objetivo é melhorar a interoperabilidade para que você possa aproveitar o trabalho incrível de ambas as comunidades e não precise se preocupar com o formato subjacente.”

O mercado para data lakehouses é enorme – de acordo com de acordo com o MIT Tech Review, cerca de 74% das organizações têm um – e assim, da perspectiva da Databricks, trazer o Tabular para sua família corporativa foi provavelmente a escolha certa. Afinal, menos formatos concorrentes de data lakehouse – ou, alternativamente, plataformas com forte suporte para vários formatos – tornam a plataforma Databricks mais atraente para clientes corporativos, mesmo que esses formatos não sejam proprietários do fornecedor.

Em um postagem no blog em coautoria do CEO da Databricks, Ali Ghodsi, e do arquiteto-chefe Reynold Xin, a Databricks diz que pretende “trabalhar em estreita colaboração” com as comunidades Iceberg e Delta Lake para “trazer interoperabilidade aos próprios formatos”.

“Esta aquisição destaca nosso compromisso com formatos abertos e dados de código aberto na nuvem”, diz a postagem do blog. “Esta é uma longa jornada, que provavelmente levará vários anos para ser alcançada em [the data lakehouse] comunidades.”

Antes da aquisição, a Tabular, com sede em San Jose, levantou US$ 37 milhões em capital de risco de investidores como Andreessen Horowitz, Zetta Venture Partners e Altimeter Capital. A Databricks afirma que espera que a compra seja concluída em algum momento do segundo trimestre de 2024, sujeita às condições habituais de fechamento.

Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here