Taverna /dev/All

Soluções abertas de Business Inteligence - bora analisar algumas?

image

Ano passado iniciamos um trabalho de pesquisa avaliando as principais soluções de Business Inteligence (BI) do mercado (ao menos as mais populares). Então gostaria de iniciar esta discussão aqui com vocês pra que possamos trocar experiências a respeito do que existe hoje e como podemos adotá-las de uma forma mais produtiva.

Primeiro vou elencar algumas das soluções e as principais impressões que tive.

Pentaho - https://www.hitachivantara.com/en-us/products/data-management-analytics/pentaho-platform.html

Retomei o contato ano passado após alguns anos de distância e pra minha surpresa, agora é mantido pela Hitachi. Já tinha uma documentação complicada antes, agora achei bem pior.

JasperReports Server - https://community.jaspersoft.com/project/jasperreports-server

É uma solução bem interessnate, mas a licença me pareceu bastante confusa pra qeu pudéssemos usar em nossos projetos.

image

BIRT - https://www.eclipse.org/birt/

Como uma solução desktop, é bem interessante, bastado no Eclipse inclusive. Mas sentimos falta de algo que desse maior flexibilidade para o usuário final.

image

Report Server - https://reportserver.net/en/

Nos surpreendeu muito positivamente. Tem boa parte do que precisamos, mas tivemos muita dificuldade com a documentação.

Spago BI - https://www.spagobi.org/

O Spago nos decepcionou um pouco pela documentação: tivemos muita dificuldade pra começar a análise.

E agora abro a discussão para vocês: o que tem usado? Quais tem sido as maiores dificuldades?

De cara digo que a maior dificuldade que enfrentei diz respeito à documentação. Muitos destes projetos oferecem versões gratuitas e pagas. A impressão que tenho é que somente nas pagas é que a documentação é melhor. Na esmagadora maioria dos casos um curso ou treinamento acaba sendo essencial para que possamos dar os primeiros passos.

1 Curtida

usei essa tem alguns anos https://github.com/rsim/mondrian-olap , atendia bem mas a demanda era bem simples.

acho que solução igual a essa que citei hj só resistem em lugares que ainda não aderiram ao movimento data-driven e tem seus times de dados.

o que vejo é o povo indo p/ o Redshift / BigQuery com alguma ferramenta de ETL, PDI, Airflow e outros, com uma ferramenta de visualização como Metabase / Redash / Superset.

1 Curtida

Oi João (feliz ano novo pra começar!), bacana esta solução, não conhecia, valeu!

O problema de soluções como Redshift/BigQuery é que se aplicam apenas a clientes maiores, com infraestruturas maiores também. Muitas vezes o que o cliente precisa é essencialmente de algo que lhe gere alguns relatórios, como o Jasper, por exemplo.

Um cara que você menciona aí que achei muito interessante foi o Metabase

é… tenho amigos que usam o Jasper pois não acharam nada melhor p atender essa demanda de relatórios. Um deles mantém um sistema a anos sem problemas.

o Metabase é bem legal mesmo mas ele e os demais que mencionei não suportam grandes empresas. Ambos falham na escalabilidade do produto.

Pelo que vi p/ grandes empresas o Looker e Tableau seguem na liderança de mercado.

Um que usamos na empresa que não é um BI diretamente, eu acredito, é o Metabase (https://www.metabase.com/). Para quem sabe SQL e quer visualizações simples e elegantes, sugiro como uma boa opção.

1 Curtida

Vocês usam a versão community ou enterprise?

No caso de estarem usando a Community, quais estão sendo as principais limitações que estão enfrentando?

Community, exportar dados dele é pesado, principalmente se não for CSV.
Ele gera muitas consultas no banco e pode detonar o mesmo.
Nubank abandonou ele e o Redshift final do ano passodo pelo BigQuery+Looker por conta disso

mas no caso do Nubank não foi por se tratar de uma situação com uma base de dados bem maior?

tipo: pra um usuário “normal” (que não seja o Nubank), ele ainda é um problema?
o pessoal usou ele diretamente contra uma base de produção?

a base devia ser grande e com muita mudança.
se o seu pipeline de montar os dados p/ serem usados no metabase forem ruins vai ter dor de cabeça.
evite criar tabelas q vc precisa dar truncate e recriar tds as vezes, incremental é sempre melhor

2 Curtidas

bacana: o que gostei muito do metabase é que aparentemente é algo fácil de usar, ao contrário dos outros.

Pra clientes menores pode ser uma solução muito interessnate.

sim, é bem fácil usar.
o critério nosso em escolher ele foi pessoas não técnicas conseguirem usar e deu certo.

Estou utilizando em produção, o Metabase.

Lembra daquele job que te falei, de Multitenancy?
Era para implementar no Metabase - feature que não está disponível na versão community.

Ai esbarrei na dificuldade do Clojure… rsss

1 Curtida

itexto