Skip to content

Link Discovery Tool

John Curcio edited this page Nov 6, 2018 · 13 revisions

Descrição

Este step fornece a habilidade de fazer a ligação entre duas fontes de dados RDF e retornar um conjunto de triplas no formato N-Triples com o tipo de ligação que foi encontrada. Por default, este step utiliza o Silk Framework para gerar seu resultado.

Opções

Data Sources

Aba que permite definir a entrada de dados a ser usada pelo Silk na hora de fazer a ligação. Caso um arquivo de configuração SLS seja carregado no step, todos os outros campos serão ignorados, dando preferência ao arquivo carregado.

Opção Descrição
Config File Arquivo .xml no formato SLS com a configuração da ligação a ser feita. Esse arquivo é gerado pelo Silk durante a criação do grafo de ligação.
Endpoint URL Endpoint Sparql ou arquivo contendo os dados fonte/alvo para ligação
Graph Grafo dos dados fontes/alvos a ser ligado
Restriction Restrição a ser aplicada aos dados fontes/alvo para filtrar o que é ligado

Prefixos

A aba de fornece a facilidade e descrever todos os prefixos que serão usados em Linkage Rules.

Opção Descrição
Prefixo Prefixo usado nas regras de ligação
Namespace URI onde esse prefixo é encontrado, exemplo http://xmlns.com/foaf/0.1/
Defaults Insere os prefixos mais comuns automaticamente nesta aba
Clear Limpa todos os prefixo inseridos

Linkage Rules

Esta aba permite a criação de um grafo simplificado do Silk com n métricas e uma agregação. Por limitações da UI do Kettle, não é possível atualmente mais de uma agregação.

Opção Descrição
Linkage Type Tipo de ligação a ser procurada, por exemplo, owl:sameAs, rdfs:seeAlso, etc
Aggregation Type Tipo de agregação a ser feita na tabela de métricas
Source Path Propriedade a ser procurada nos arquivos fonte, exemplo: /madsrdf:authoritativeLabel
Target Path Propriedade a ser procurada nos arquivos alvo, exemplo: /skos:prefLabel[@lang='en']
Metric Métrica a ser usada para comparar o Source Path com o Target Path, por exemplo, igualdade

Output

Aba que permite definir o tipo de saída, arquivo ou SPARQL Endpoint, que o resultado do Silk será salvo.

Opção Descrição
Output File Arquivo N-Triples onde a saída do Silk será escrita
Output to a Sparql Endpoint? Marcar caso a saída do Silk for para um Endpoint Sparql
Endpoint URL URL do endpoint SPARQL onde a saída do Silk será escrita
Graph Nome do grafo no Endpoint URL onde a saída será escrita

Exemplos

Exemplo 1: Alinhamento de Países

O exemplo a seguir é baseado no exemplo disponível na joinup, no qual estamos buscando uma ligação do tipo owl:sameAs entre países em arquivos RDF diferentes.

Os prints acima mostram a configuração necessária para reproduzir o exemplo da joinup. Quando o step termina de executar, 220 links são encontrados na forma:

<http://publications.europa.eu/resource/authority/country/VEN>  <http://www.w3.org/2002/07/owl#sameAs>  <http://id.loc.gov/vocabulary/countries/ve> .
<http://publications.europa.eu/resource/authority/country/CZE>  <http://www.w3.org/2002/07/owl#sameAs>  <http://id.loc.gov/vocabulary/countries/xr> .
<http://publications.europa.eu/resource/authority/country/LVA>  <http://www.w3.org/2002/07/owl#sameAs>  <http://id.loc.gov/vocabulary/countries/lv> .
...