R-arruda – Página: 2 – Arruda

Replicando a Stack Data Speed na AWS

Bom como sabe no mês passado, tivemos a 1ª Turma do Data Speed, abordando como Implementar uma Stack Moderna de Dados, mas talvez mais importante que as ferramentas que utilizamos, que basicamente é um compilado dos últimos 3 anos de projetos, ela muda um paradigma, que a Cloud vai ser basicamente aonde os dados serão

Leia mais

DBT para documentação e validação dos dados.

No artigo anterior (https://arrudaconsulting.com.br/dbt-controle-codigos-sql/), falei um pouco sobre a utilização da ferramenta dbt (Data Build Tool) e sua capacidade de organização e versionamento de códigos SQL. Neste post, vou me aprofundar nas funcionalidades de documentação e testes, que tornam o dbt ainda mais poderoso no gerenciamento de projetos de dados. Na pasta models, podemos inserir

Leia mais

Carga incremental de dados com DBT

Neste artigo, vamos falar sobre a ferramenta dbt (Data Build Tool), focando especificamente na realização de cargas incrementais em nossos modelos. Ao criarmos um modelo e realizarmos a primeira carga de dados, pode não ser vantajoso executar uma carga completa (full load) a cada atualização, especialmente em projetos com grande volume de dados. É justamente

Leia mais

Como Usar o DBT para Organizar e Controlar seus Códigos SQL

Neste artigo, vamos falar sobre a ferramenta dbt (Data Build Tool) e por que ela vem se tornando cada vez mais requisitada em ecossistemas de dados modernos, como Snowflake, BigQuery, Redshift, entre outros. Ao utilizarmos uma infraestrutura de dados moderna, é comum realizarmos diversas transformações por meio de SQL, aproveitando a alta performance dos bancos

Leia mais

Envio de e-mail no Jenkins

No artigo passado, mostramos as vantagens de utilizar o Jenkins para automação de jobs. E embora ele mostre o histórico das execuções — incluindo quantas falharam e quantas foram bem-sucedidas — ainda é um trabalho chato ter que abrir o console todos os dias para verificar os jobs um por um. É aí que entra

Leia mais

Como tratar valores nulos no Apache Hop?

Olá, sempre que falamos de ETL, independente da ferramenta um dos tratamentos mais comuns são os valores nulos, normalmente temos duas abordagens nesse caso: Tratar os dados por coluna. Tratar os dados por tipo de dados. Quando tratamos os dados por coluna, no nosso ETL informamos o valor de cada coluna que iremos substituir, caso

Leia mais

Orquestração de ETL: Automatize o Apache Hop com Jenkins

No mundo da engenharia de dados e desenvolvimento de software, a automação é indispensável. Seja para executar pipelines, scripts ou rotinas de manutenção, agendar tarefas de forma confiável faz toda a diferença. Embora sistemas operacionais como Linux (com o cron) ou Windows (com o Agendador de Tarefas) ofereçam mecanismos nativos de agendamento, essas abordagens muitas

Leia mais

Evite Surpresas no DW: Use o Data Validator do Apache Hop

Olá, O Apache Hop é uma excelente solução para implementar um Data Warehouse ou um Data Lake, seja em um ambiente On-Prem ou na Cloud, e uma etapa importante nessa etapa é a validação dos dados. E é justamente esste tema que iremos abordar nesse artigo. Você já ouviu falar do Step: Data Validator? Próprio

Leia mais

Primeiros passos com o KNIME Analytics Platform

O KNIME Analytics Platform é uma ferramenta visuale intuitiva para análise de dados, automação de processos e ciência de dados. Ele permite que você crie fluxos de trabalho (workflows) sem precisar programar, o que o torna ideal para quem quer otimizar tarefas repetitivas de análise e transformação de dados de maneira simples e eficiente. Caso

Leia mais

Como instalar o KNIME Analytics Platform

O que é KNIME Analytics Platform? O KNIME Analytics Platform é uma poderosa ferramenta de ciência de dados e análise avançada. Esse software de código aberto e gratuito permite processar grandes volumes de dados, criar fluxos de trabalho automatizados e extrair insights valiosos para tomada de decisão. Instalar ele pode ser mais fácil do que

Leia mais

Posts by: R-arruda

Replicando a Stack Data Speed na AWS

DBT para documentação e validação dos dados.

Carga incremental de dados com DBT

Como Usar o DBT para Organizar e Controlar seus Códigos SQL

Envio de e-mail no Jenkins

Como tratar valores nulos no Apache Hop?

Orquestração de ETL: Automatize o Apache Hop com Jenkins

Evite Surpresas no DW: Use o Data Validator do Apache Hop

Primeiros passos com o KNIME Analytics Platform

Como instalar o KNIME Analytics Platform

Pesquisar

Categorias

Artigos recentes

Como evoluir o seu DW para uma Stack Moderna sem refazer o seu projeto

Qual a melhor arquitetura de dados para sua empresa? Deixe os dados decidirem

20 Milhões em 2 minutos, nossa primeira entrega de 2026.