Título
A framework for open data quality assessment
Autor
Ibarra Mendoza, Abelardo Miguel
Resumo
pt
Hoje em dia, as entidades públicas e privadas partilham frequentemente os seus dados
com os consumidores de dados através de diversas plataformas digitais. Esta partilha
de dados, que não tem restrições ou custos, tem sido designada por Dados Abertos.
A utilização crescente deste tipo de dados coloca vários desafios, como a qualidade
dos dados fornecidos. Garantir a qualidade dos dados é essencial para estabelecer a
confiança nos dados abertos e para a sua utilização eficiente em diferentes aplicações.
O principal objetivo desta dissertação é criar uma proposta de uma framework que
avalie e meça a qualidade dos Dados Abertos em termos de dimensões e suas métricas.
A framework proposta avalia os dados abertos com base em duas extensões distintas.
A primeira (Acessibilidade, Interoperabilidade) baseia-se nas caraterísticas sistémicas
e técnicas do ecossistema de dados abertos, enquanto a segunda (Completude, Unicidade)
incorpora duas propriedades intrinsecamente relacionadas de um conjunto de
dados abertos.
O quadro proposto é avaliado utilizando oito conjuntos de dados provenientes de
vários domínios que estão acessíveis nos portais da Administração Pública Aberta de
Portugal. Os resultados desta dissertação revelam que os actuais conjuntos de dados
abertos têm certos problemas de qualidade associados ao sistema e às dimensões
técnicas do ecossistema de dados abertos. A contribuição deste trabalho é avaliar os
dados abertos dados abertos na perspetiva dos dados em si e dos aspectos técnicos que
permitem a sua reutilização.
en
Nowadays, public and private entities often share their data with data consumers
through various digital platforms. This sharing of data, which has no restrictions or
costs, has been called Open Data. The increased use of this kind of data poses several
challenges, such as the quality of the data provided. Ensuring the quality of data is
essential for establishing trust in open data and for its efficient utilization in different
applications.
The main goal of this dissertation is to create a proposal for a framework that assesses
and measures the quality of Open Data in terms of dimensions and its metrics.
The proposed framework evaluates open data based on two distinct extend. The first
one (Accessibility, Interoperability) is founded upon the systemic and technical characteristics
of the open data ecosystem, whereas the second extends (Completeness,
Uniqueness) incorporates two inherently related properties of an open dataset.
The proposed framework is assessed using eight datasets originating from various
domains that are accessible on the Portuguese Open Government portals. The findings
of this dissertation reveal that open datasets today have certain quality issues
associated with the system and technical dimensions of the open data ecosystem. The
contribution of this work is to assess open data from the perspective of the data itself
and technical aspects to allow their reuse.