R-arruda – Página: 2 – Arruda

Carga incremental de dados com DBT

Neste artigo, vamos falar sobre a ferramenta dbt (Data Build Tool), focando especificamente na realização de cargas incrementais em nossos modelos. Ao criarmos um modelo e realizarmos a primeira carga de dados, pode não ser vantajoso executar uma carga completa (full load) a cada atualização, especialmente em projetos com grande volume de dados. É justamente

Leia mais

Como Usar o DBT para Organizar e Controlar seus Códigos SQL

Neste artigo, vamos falar sobre a ferramenta dbt (Data Build Tool) e por que ela vem se tornando cada vez mais requisitada em ecossistemas de dados modernos, como Snowflake, BigQuery, Redshift, entre outros. Ao utilizarmos uma infraestrutura de dados moderna, é comum realizarmos diversas transformações por meio de SQL, aproveitando a alta performance dos bancos

Leia mais

Envio de e-mail no Jenkins

No artigo passado, mostramos as vantagens de utilizar o Jenkins para automação de jobs. E embora ele mostre o histórico das execuções — incluindo quantas falharam e quantas foram bem-sucedidas — ainda é um trabalho chato ter que abrir o console todos os dias para verificar os jobs um por um. É aí que entra

Leia mais

Como tratar valores nulos no Apache Hop?

Olá, sempre que falamos de ETL, independente da ferramenta um dos tratamentos mais comuns são os valores nulos, normalmente temos duas abordagens nesse caso: Tratar os dados por coluna. Tratar os dados por tipo de dados. Quando tratamos os dados por coluna, no nosso ETL informamos o valor de cada coluna que iremos substituir, caso

Leia mais

Orquestração de ETL: Automatize o Apache Hop com Jenkins

No mundo da engenharia de dados e desenvolvimento de software, a automação é indispensável. Seja para executar pipelines, scripts ou rotinas de manutenção, agendar tarefas de forma confiável faz toda a diferença. Embora sistemas operacionais como Linux (com o cron) ou Windows (com o Agendador de Tarefas) ofereçam mecanismos nativos de agendamento, essas abordagens muitas

Leia mais

Evite Surpresas no DW: Use o Data Validator do Apache Hop

Olá, O Apache Hop é uma excelente solução para implementar um Data Warehouse ou um Data Lake, seja em um ambiente On-Prem ou na Cloud, e uma etapa importante nessa etapa é a validação dos dados. E é justamente esste tema que iremos abordar nesse artigo. Você já ouviu falar do Step: Data Validator? Próprio

Leia mais

Primeiros passos com o KNIME Analytics Platform

O KNIME Analytics Platform é uma ferramenta visuale intuitiva para análise de dados, automação de processos e ciência de dados. Ele permite que você crie fluxos de trabalho (workflows) sem precisar programar, o que o torna ideal para quem quer otimizar tarefas repetitivas de análise e transformação de dados de maneira simples e eficiente. Caso

Leia mais

Como instalar o KNIME Analytics Platform

O que é KNIME Analytics Platform? O KNIME Analytics Platform é uma poderosa ferramenta de ciência de dados e análise avançada. Esse software de código aberto e gratuito permite processar grandes volumes de dados, criar fluxos de trabalho automatizados e extrair insights valiosos para tomada de decisão. Instalar ele pode ser mais fácil do que

Leia mais

Python ou KNIME: Qual a Melhor Escolha? Por Que Não Ambas?

Introdução A análise de dados moderna exige ferramentas que equilibrem automação, flexibilidade e poder computacional. Um cientista de dados que precisa processar grandes volumes de informações pode optar por uma abordagem visual e automatizada no KNIME, simplificando a construção de workflows sem a necessidade de codificação manual. Por outro lado, se for necessário desenvolver um

Leia mais

KNIME: Simplificando o Trabalho do Cientista de Dados

O papel do Cientista de Dados envolve uma série de tarefas complexas, desde a coleta e preparação das informações até a construção e avaliação de modelos preditivos, culminando no deploy das soluções que impulsionam a tomada de decisão nas empresas. Para isso, é necessário combinar diferentes técnicas, ferramentas e abordagens, adaptando-as a distintos contextos de

Leia mais

Posts by: R-arruda

Carga incremental de dados com DBT

Como Usar o DBT para Organizar e Controlar seus Códigos SQL

Envio de e-mail no Jenkins

Como tratar valores nulos no Apache Hop?

Orquestração de ETL: Automatize o Apache Hop com Jenkins

Evite Surpresas no DW: Use o Data Validator do Apache Hop

Primeiros passos com o KNIME Analytics Platform

Como instalar o KNIME Analytics Platform

Python ou KNIME: Qual a Melhor Escolha? Por Que Não Ambas?

KNIME: Simplificando o Trabalho do Cientista de Dados

Pesquisar

Categorias

Artigos recentes

20 Milhões em 2 minutos, nossa primeira entrega de 2026.

O que são as Dynamic Tables no Snowflake?

Conhece SQL? Então você está a um passo da Engenharia de Dados