Salve, tripulação!

Como já falamos aqui, citamos no artigo anterior os 5 principais erros que um cientista de dados pode cometer no seu início de carreira.

Desta forma, como queremos que os relatórios fluam da melhor maneira possível para as pessoas que utilizam nossos serviços e o desenvolvem Power BI, segue os erros mais comuns quando se trata de ETL, ou seja, a extração, transformação e o carregamento de dados.

 Erro – Ignorar o modelo estrela

O modelo estrela é uma recomendação da própria Microsoft para melhor organização dos dados a serem tratados. Trata-se da divisão do projeto em tabelas FATO e DIMENSÃO onde:

Tabelas FATO – eventos que aconteceram (ex. venda);

Tabelas DIMENSÃO – detalha os eventos (ex. quem comprou? Qual seu telefone?)

2º Erro – Utilizar relacionamento muito para muitos (bidirecional) sem entender

Uma falta muito grave encontrada com muita facilidade em projetos é a de tabelas com relacionamentos muitos para muitos, onde muitos campos se relacionam também com outros muitos campos (é confuso até de ler, não?), fornecendo um risco muito grande de conflitar dados e gerar relatórios falsos se não usado com muito controle e moderação.

Também segundo a Microsoft, esse modelo de relacionamento pode causar impacto negativo no desempenho de consulta do modelo e gerar experiências confusas aos analistas (você, que irá interpretar os dados).

3º Erro – Pensar em Power BI como a única ferramenta

Automaticamente temos a tendência de querer que uma única ferramenta realize todos os nossos desejos, principalmente se for a única ferramenta com que temos contato. Porém, existem ferramentas adequadas para cada situação.

É frequente sermos abordados em nossas reuniões com as seguintes perguntas:

Posso armazenar dados no Power B.I?

R. Não, para a criação dos dashboards nós nos conectamos com uma base de dados ativa de nossos clientes e a partir dos dados importados dessa base desenvolvemos os projetos, logo, sem essa fonte de dados, não há como atualizar o relatório apresentado.

Posso cadastrar e alterar dados na fonte com o Power B.I?

R. Não, o Power B.I não um é SGBD (Sistema Gerenciador de Banco de Dados).

O que é Power B.I?

R. O Power B.I é uma ferramenta de análise e visualização de dados.

4º Erro – Abusar de colunas calculadas

Talvez porque elas sejam mais visuais ou porque estamos mais familiarizados com esse tipo de visualização que temos no Excel, onde os cálculos são exibidos em uma nova coluna.

É bem diferente de uma medida onde primeiro fazemos o cálculo e depois visualizamos o seu resultado que inclusive pode mudar de acordo com o contexto em que ela foi inserida.

Porém, as colunas calculadas demandam esforço da memória RAM do seu computador enquanto as medidas são processadas na CPU e demandam menos da sua RAM (que pode ser um recurso escasso). Para os que ainda preferem as colunas calculadas é muito provável que em breve se deparem com a seguinte mensagem:

5º Erro – Filtrar tabelas ao invés de colunas

Ao desenvolver uma fórmula durante o projeto é muito comum encontrarmos filtros aplicados sobre uma tabela inteira. Os filtros aplicados leem linha por linha de cada tabelas e colunas filtradas, portanto, uma tabela com 100.000 linhas iria pesar muito o carregamento.

A melhor maneira de se aplicar um filtro é sobre as colunas específicas que se quer analisar, tornando o relatório mais fluido.

É isso aí pessoal, se gostaram do nosso conteúdo, nos siga nas redes sociais, e nos conheça através do @roqtgroup.

Então não se esqueça de sempre estar atento e ter muito cuidado caso for desenvolver um projeto no Power BI. Curtiu o post? Deixe sua dúvida ou comentário abaixo que iremos te responder! 

Grande abraço, até a próxima!

Deixe um comentário

O seu endereço de e-mail não será publicado.