Framework for Data Quality and Cleaning Management in the LOD (DCleanLOD)

Data de início

12/2018

Data de fim

12/2020

– Elaboração de estratégias para lidar com a heterogeneidade de vocabulários entre ontologias presentes nas Web de dados:

1) Desenvolvimento de uma abordagem para reduzir o problema de criar e reutilizar mapeamentos entre diferentes origens de dados na Web de dados.

2) Desenvolvimento de uma abordagem para criar mapeamentos entre bases de dados relacionais e vocabulários (ontologias) da web de dados. Em fase de conclusão. Em fase de conclusão está uma extensão a esta primeira proposta.

3) O desenvolvimento de abordagens para examinar a qualidade dos mapeamentos na Web de Dados, incluindo pontuações, métricas estatísticas, etc.. Em desenvolvimento.

– Elaboração de estratégias para lidar com a avaliação da qualidade dos dados na Web de dados:

1) O desenvolvimento de uma abordagem de alto nível para especificar e publicar regras de qualidade de dados na Web de dados. Em fase de conclusão uma abordagem que utiliza lógica fuzzy no processo de avaliação da qualidade dos dados.

2) O uso de dependências funcionais condicionais (e outras formas de dependências condicionais) na Web de Dados. Por desenvolver.

3) O desenvolvimento de abordagens para tornar o processo de identificação da qualidade dos dados mais amigável para o utilizador. Em desenvolvimento.

– Elaboração de estratégias para lidar com a limpeza de dados na Web de Dados:

1) Investigar procedimentos para reparar dados “sujos” na Web de Dados, em particular usando as regras de qualidade de dados publicadas na Web de Dados. Por desenvolver.
Práticas:

– Desenvolvimento de uma ferramenta para ajudar o utilizador no processo de mapeamento entre ontologias da web de dados. Foi criado um protótipo com alguns tipos de mapeamentos. Em fase de conclusão um aplicativo Web para definir mapeamentos entre ontologias usando a linguagem SPARQL.

– Desenvolvimento de uma ferramenta para ajudar o utilizador no processo de criação e reuso de mapeamentos entre bases de dados relacionais e ontologias da Web de Dados. Em desenvolvimento.

– Desenvolvimento de uma ferramenta para ajudar o utilizador no processo de avaliação da qualidade de dados disponíveis na web de dados. Em desenvolvimento.

– Desenvolvimento de uma ferramenta para ajudar o utilizador no processo de limpeza dos dados na web de dados. Por desenvolver.

Objetivos

Explorar novos desafios e diferentes abordagens no que diz respeito a utilização de dados ligados (presentes na web de dados), contribuindo também para o desenvolvimento de novas aplicações com dados confiáveis.

– Avançar o atual estado da arte em termos de métodos e bibliotecas para a qualidade de dados e limpeza de dados na Web de Dados.

Especificamente:

– Desenvolvimento de métodos e aplicativos para lidar com o problema de qualidade de dados na Web de dados (LOD)

– Desenvolvimento de protótipos que reutilizarão ou estenderão abordagens relevantes na área de qualidade de dados.

– Divulgação dos resultados obtidos (quer teóricos, quer práticos) em fórum internacional relacionado à Web Semântica, qualidade de dados e limpeza de dados.

Linhas de Investigação

Big Data

Investigadores

Valéria Pequeno