04 fev

Olá,

Tudo bem contigo?

Quantas vezes já tivemos que remover os acentos de alguma palavra específica, utilizando replace, por exemplo ou até mesmo utilizando o próprio SQL para isso.

Uma forma bem mais prática de fazer isso é utilizando o step: “User defined Java expression”, este step existe tanto no Pentaho quando no Apache Hop.


No 1º step, iremos utilizar o Datagrid para escrever algumas palavras que possuem acentuação, e com a expressão abaixo, iremos criar a coluna: sem_acentos removendo todos os acentos que a coluna palavra possui:

org.apache.commons.lang3.StringUtils.stripAccents(palavra)

A grande vantagem é que dessa forma, com uma única expressão, garantimos que diversos tipos de acentos serão removidos.


E após executar o ETL ficou assim os dados.


Mais um artigo que saiu da comunidade #pentarruda.

Espero que este artigo tenha ajudado.

Muito Obrigado.

Rafael Arruda.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Translate »