1. O que são Dados
Pode ser definido como a menor partícula de uma informação, são a representação de um fato conhecido ou desconhecido, existe em diversas formas como: texto, números, gráficos, imagens, sons ou até mesmo em vídeo.
Segundo (ABREU, M. P.; MACHADO, F. N. R., 2004, p.1) O dado é uma representação, um registro de uma informação. Este dado pode ser registrado fisicamente através de um papel (receita médica), um disco de computador ou um impulso elétrico, etc. Este registro pode ser o originador de uma série de processos que influenciam na realidade observada
Dado é a matéria-prima utilizada pelos usuários, é como uma pedra bruta extraída da rocha que vai para as mãos do artesão para ser lapidada e polida para gerar informações.
Para uma melhor compreensão; dado é o registro de uma informação, podendo ser registrado na forma física através de papel (certidão nascimento, prontuário médico), ou na forma lógica através de meios de armazenamento digital (Pendrive, DVD, Hard Disk). Normalmente esses registros podem ser originados de diversas fontes e podem ter um papel muito importante na realidade analisada.
2. O que é Informação
“No começo a informação era vazia e não tinha forma e nem dados; e o vazio estava sobre a face dos sistemas. E os dedos do autor moveram-se sobre o teclado. E o autor disse: Que haja informações”(SACRAMENTO, 2015, p.13).
Segundo (ABREU, M. P.; MACHADO, F. N. R., 2004, p.1) A informação acrescenta algo ao conhecimento da realidade a ser analisada. Por exemplo, a dosagem que um paciente precisa receber de um determinado remédio, é uma informação. Este conhecimento pode ser (ou não) modelado (registrado).
A informação é definida como um conjunto de dados em contexto, que foram lapidados pelo usuário, sem esse conjunto, a informação não tem relevância. A informação é algo valioso para o conhecimento.
3. O que é conhecimento
O conhecimento é a compreensão dos fatos, o conhecimento é a compreensão, a consciência, é o reconhecimento de uma situação e familiaridade com a sua complexidade. Como os dados e as informações, o conhecimento é também um recurso da organização.
Segundo (BARBIERI, 2011, p. 125) O conhecimento cria condições para que seja, socializado e externalizado dentro da empresa, transformando-o de tácito em explícito.
4. O que é Qualidade
Qualidade não é algo abstrato ou concreto, é algo totalmente diferente e independente das duas, não pode ser definida, a qualidade é transcendente, sabe-se que a qualidade de dados é sinônimo de qualidade de informação.
Segundo Deming (1990, P. 124) qualidade depende da opinião do avaliador. Um produto tem muitas escalas, pode ser considerado de alta qualidade pelo consumidor em uma delas e de baixa qualidade em outra. A qualidade depende da satisfação do cliente.
A informação contribui para o conhecimento, é o reconhecimento de uma situação e familiaridade com a sua complexidade, a falta de qualidade nos dados resulta em informações imprecisas por falta de conhecimento, o que resulta em um desempenho fracos nos negócios.
5. Qualidade de Dados
A Qualidade de dados é algo complexo porque está condicionada ao processo de extração, transformação e carga dos dados. Durante esse processo, pode ser utilizado diversos domínios para garantir a qualidade conforme proposta de Total Quality Data Management, do MIT –, que define que os dados devem ser vistos e controlados como um produto de transformação, sendo insumo e resultante de processos que deverão ser definidos e mapeados.
Segundo (BARBIERI, 2011) Um dos principais focos da governança de dados está centrado na área de qualidade de dados, visto ser esse atributo fundamental nos aspectos de reputação, valoração da marca e resposta efetiva a certas ações regulatórias de algumas empresas.
Os dados podem ser considerados de qualidade, após passarem por validação conforme os requisitos:
Precisão – é a medida de quão correto, quão livre de erros, quão próximo está esse dado do fato verdadeiro. É o princípio fundamental da qualidade de dados; se um dado não é correto, as outras dimensões são menos importantes. Para ser correto, um valor deve ser certo e deve ser representado de uma forma consistente e sem ambiguidade.
Atualização – os dados estão suficientemente atualizados para as tarefas que os utilizarem.
Relevante – os dados devem ser importantes para o tomador de decisões em um contexto, úteis e aplicáveis na tarefa em questão.
Completo – os dados devem conter todos os fatos importantes, na amplitude e profundidade adequadas às necessidades.
Simples – os dados devem ser de fácil compreensão, evitando a chamada “sobrecarga de informação”.
Confiável – os dados são dependentes da fonte ou método de coleta.
Aspectos de baixa qualidade de dados, cada vez mais, causam problemas de imprecisão em um Data Warehouse, destacam-se dentre eles: entrada inicial de dados com problema, degradação, mudanças e reestruturação e uso de dados. Aumentando os riscos de maiores custos internos, além de evidenciar sinais de baixo controle dos insumos fundamentais de uma empresa.
A qualidade da informação é dependente da opinião e análise do seu utilizador Deming (1990, P. 124). Uma informação pode ser composta de vários dados, pode ser considerada de alta qualidade pelo usuário em uma determinada análise e de baixa qualidade em outra.
O que define se a informação tem qualidade, é a excelência do resultado final de sua análise, garantida pelos atributos de credibilidade, acessibilidade, facilidade de manipulação, reputação, disponibilidade, pontualidade, além de segurança e confiabilidade da informação para satisfação do usuário na sua utilização.