Olá,
Tudo bem contigo?
Quantas vezes já tivemos que remover os acentos de alguma palavra específica, utilizando replace, por exemplo ou até mesmo utilizando o próprio SQL para isso.
Uma forma bem mais prática de fazer isso é utilizando o step: “User defined Java expression”, este step existe tanto no Pentaho quando no Apache Hop.
No 1º step, iremos utilizar o Datagrid para escrever algumas palavras que possuem acentuação, e com a expressão abaixo, iremos criar a coluna: sem_acentos removendo todos os acentos que a coluna palavra possui:
org.apache.commons.lang3.StringUtils.stripAccents(palavra)
A grande vantagem é que dessa forma, com uma única expressão, garantimos que diversos tipos de acentos serão removidos.
E após executar o ETL ficou assim os dados.
Mais um artigo que saiu da comunidade #pentarruda.
Espero que este artigo tenha ajudado.
Muito Obrigado.
Rafael Arruda.