Olá,
Tudo bem contigo?
Muito se fala em LGPD, Lei Geral de Proteção dos Dados, mas como implementarmos isso no nosso ETL, ou melhor como proteger dados sensiveis, como Nome, telefone, email.
Uma forma bastante simples de se fazer isso no Pentaho é utilizando o step: Add a checksum.
Iremos começar com duas colunas, o código e o nome.
Agora a ideia é poder normalizar esses dados, com o intuito de proteger o nome da pessoa.
Utilizando o step mencionado acima iremos escolher o tipo MD5 para criar o nosso hash.
Após executar o nosso pipeline, temos os nossos dados inciais e a nova coluna que foi criada pelo step.
Agora para finalizar adicionamos um Select Values para removermos a coluna nome, e assim iremos ter o nome e a coluna hash no etl.
Muito Obrigado.
E até o próximo artigo.
valeu pelo conteúdo Rafael…será que se eu executar essa transformação novamente, com os mesmos campos, a hash será igual? Obrigado.
Fiz o teste aqui, executei umas 3 vezes e o hash foi o mesmo.
Obrigado.
Rafael Arruda
Excelente