6 de janeiro, 2022

Olá Tudo bem com você? Hoje vou mostrar Como cortar Strings com o Pentaho

Antes de mais nada Em diversos momentos a gente acaba tendo que trabalhar e tratar alguns campos do tipo string, seja para concatenar colunas, limpar os dados, e as vezes a gente necessita de uma parte da informação.

E uma das forma de se fazer isso é com o Step: Strings Cut.

Ele é parecido com as funções Left ou Right do SQL que a gente corta uma parte da string.

Então iremos criar uma Transformação com dois steps, o Data Grid para utilizarmos os dados de teste e depois o Strings Cut para entender como este step se aplica na prática:

Agora que já temos os dados, iremos utilizar o step para pegar somente as duas primeiras letras.

Então temos o campo que queremos pegar os dados, depois iremos criar uma coluna chamada cut para podermos comparar a diferença antes e após o uso do step, e depois informamos que iremos cortar da string da posição 0 até a posição 2.

Ou seja, as duas primeiras letras da nossa string, um step parecido com as funções Left e Right aonde conseguimos utilizar no step formula também, no Pentaho por algumas vezes temos mais de uma maneira de realizar um mesmo tratamento.

E é isso, espero que tenham gostado de mais uma dica e até o próximo artigo!

Obrigado.

 

2 comments on “Cortando Strings com o Pentaho Data Integration

  1. Obrigado pelo compartilhamento.
    Mas me parece um comando básico do ponto de vista que deve-se limitar a posição entre números exatos.

    Como podemos utilizá-lo para cortar nomes de arquivos sem tamanho exato?
    Ex.:
    arquivoDepartamento2022-01.csv
    arquivoEmpregados2022-01.csv

    Nesse caso, com nomes de arquivos distintos como podemos utilizar o Strings cut para pegar o “Ano-Mes”, considerando que o ponto de partidade seria o ” . ” (ponto) da extensão voltando 7 caracteres?

    1. Nesse caso, você poderia utilizar o string operations aonde tem a opção de deixar somente os números, e assim teria 202101 por exemplo, é uma opção.

Deixe um comentário

O seu endereço de e-mail não será publicado.

Translate »