Neste post compartilho com vocês duas maneiras de criar Loop utilizando o Apache Hop. Objetivo: Criar 2 modelos de loop que percorra uma pasta principal, acesse todas as subpastas dentro dela, e leia todos os arquivos XLSX encontrados em cada subpasta. O loop funcionará independe do número de…

É muito comum a gente criar colunas condicionais no nosso dia a dia, nem sempre teremos a informação já pronta da forma que precisamos. Para quem trabalha com banco de dados deve estar mais acostumado a fazer esta tarefa utilizando If ou Case When, a lógica é exatamente …

O que é o Apache Spark?

  • By Wallace Camargo
  • / spark

Apache Spark é um framework open source para computação distribuída, capaz de processar grandes conjuntos de dados. E o que é computação distribuída? A computação distribuída é a forma encontrada de conectar diversos computadores e dividir o processamento entre as máquinas, ou seja, é possível dividir uma grande…

31 maio

Olá, Desde o Pentaho o banco de dados que dava um pouco mais de trabalho para conectar era o SQL Server, e isso se manteve no Hop. Portanto, a ideia deste artigo é disponibilizar um tutorial de como fazer esta integração do SQL Server com Apache Hop, este…

25 maio

Olá, tudo bem contigo? Compartilhando o depoimento de alguns alunos que finalizaram o nosso Treinamento: Hopbase. Neste treinamento os alunos aprenderam a criar um Produto de BI do zero, abordando as seguintes etapas: Modelagem dos dados. Staging Area. Dimensões e Fatos. Carga Full vs Carga Incremental. Orquestração do…

Translate »