spark

Como acessar os dados do seu Lakehouse?

Bom, na semana passada tivemos mais uma Live dos Sparkanos, e dessa vez com um Hand-ons de 2 horas de Apache Spark. E uma das dúvidas que surgiram, foi entender como o cliente acessa esses dados, uma vez que processamos os dados com o Spark. Para facilitar o entendimento vou deixar um tutorial abaixo desde

Leia mais

O que é o Apache Spark?

Apache Spark é um framework open source para computação distribuída, capaz de processar grandes conjuntos de dados. E o que é computação distribuída? A computação distribuída é a forma encontrada de conectar diversos computadores e dividir o processamento entre as máquinas, ou seja, é possível dividir uma grande tarefa em pequenas etapas no seu conjunto

Leia mais

O que é o formato Delta e quais as vantagens de usar com o Spark

Imagem retirada do site: https://delta.io/ O formato Delta foi desenvolvido para possibilitar na construção de um Lakehouse através do Spark. Um Lakehouse também pode ser construído em outros formatos e abaixo podemos ver os principais: Delta Lake: Delta Lake é uma camada de armazenamento de dados open-source construída sobre o Apache Spark e permite que

Leia mais

O que é um Delta Lake / Lakehouse

A história do armazenamento Imagem oficial da Databricks Na história do armazenamento, houveram algumas mudanças até chegarmos no que hoje chamamos de Lakehouse que une o melhor do mundo do Data Warehouse com o Data Lake. O Data Warehouse é um sistema de armezamento aplamente conhecido no mundo do Business Intelligence que tem o

Leia mais

spark

Como acessar os dados do seu Lakehouse?

O que é o Apache Spark?

O que é o formato Delta e quais as vantagens de usar com o Spark

O que é um Delta Lake / Lakehouse

Pesquisar

Categorias

Artigos recentes

20 Milhões em 2 minutos, nossa primeira entrega de 2026.

O que são as Dynamic Tables no Snowflake?

Conhece SQL? Então você está a um passo da Engenharia de Dados