Criando colunas condicionais no Apache Hop
É muito comum a gente criar colunas condicionais no nosso dia a dia, nem sempre teremos a informação já pronta da forma que precisamos. Para quem trabalha com banco de dados deve estar mais acostumado a fazer esta tarefa utilizando If ou Case When, a lógica é exatamente a mesma. Neste Artigo irei mostrar como
Leia mais
Como obter o último dia do mês anterior no Hop/Pentaho
Olá, tudo bem contigo? Hoje o artigo de hoje é compartilhar contigo uma forma de obter o último dia do mês anterior, de uma forma simples, e objetiva. Essa solicitação é muito comum recebermos das áreas de negócios principalmente da área financeira quando ocorre o fechamento. Para este exemplo, irei trazer 3 steps: Get System
Leia maisProteja dados sensíveis com Hop
Olá, tudo bem contigo? Há um tempo átras muito tem se falado sobre LGPD. E com os diversos vazamentos de dados que diversas empresas já sofreram, esse tema vem se tornando cada vez mais importante dentro das empresas e especificas nas áreas de dados. Nesse artigo irei trazer um exemplo de como podemos proteger os
Leia mais
Automatizando o seu pipeline no Apache Hop.
Olá, tudo bem contigo? A ideia deste artigo é poder te ajudar a implementar o teu pipeline de dados, pois nada adianta você desenvolver todo o ETL, e ficar executando de forma manual, não faz sentido. Como podemos agendar um pipeline desenvolvido no Apache Hop? Bom, temos algumas formas de fazer isso. A forma mais
Leia mais
Removendo acentos com Pentaho /Hop
Olá, Tudo bem contigo? Quantas vezes já tivemos que remover os acentos de alguma palavra específica, utilizando replace, por exemplo ou até mesmo utilizando o próprio SQL para isso. Uma forma bem mais prática de fazer isso é utilizando o step: “User defined Java expression”, este step existe tanto no Pentaho quando no Apache Hop.
Leia mais
Como criar uma coluna Hash no Pentaho
Olá, Tudo bem contigo? Muito se fala em LGPD, Lei Geral de Proteção dos Dados, mas como implementarmos isso no nosso ETL, ou melhor como proteger dados sensiveis, como Nome, telefone, email. Uma forma bastante simples de se fazer isso no Pentaho é utilizando o step: Add a checksum. Iremos começar com duas colunas, o
Leia mais
Treinamento: Python para Engenheiro de dados – 1º dia
Olá, Tudo bem contigo? Nesse sábado, 20/05/2023, tivemos o 1º dia do nosso mais novo treinamento, Python para Engenheiro de dados, aplicado pelo instrutor Leandro Silva. Neste sábado foram abordados os seguintes temas: Criação da conta na Google Cloud. Utilizamos o IAM para criar as permissões e acessos. Criação de um banco de dados na
Leia maisComo utilizar a função Zip() no Python
O Python é uma linguagem de programação muito versátil e poderosa, com muitas ferramentas úteis para ajudar a simplificar o desenvolvimento de software. Uma dessas ferramentas é a função zip() que permite combinar elementos de duas ou mais listas em uma única lista. A função zip() é usada para juntar duas ou mais listas em
Leia mais