Automatic RDF-ization of big data semi-structured datasets

Journal Title: MASKANA - Year 2016, Vol 7, Issue 3

Abstract

Linked data adoption continues to grow in many fields at a considerable pace. However, some of the most important datasets usually remain underexploited because of two main reasons: the huge volume of the datasets and the lack of methods for automatic conversion to RDF. This paper presents an automatic approach to tackle these problems by leveraging recent Big Data tools and a program for automatic conversion from a relational model to RDF. Overall, the process can be summarized in three steps: 1) bulk transfer of data from different sources to Hive/HDFS; 2) transformation of data on Hive to RDF using D2RQ; and 3) storing the resulting RDF in CumulusRDF. By using these Big Data tools, the platform will cope with the handling of big amounts of data available in different sources, which can include structured or semi-structured data. Moreover, since the RDF data are stored in CumulusRDF in the final step, users or applications can consume the resulting data by means of web services or SPARQL queries. Finally, an evaluation in the hydro-meteorological domain demonstrates the soundness of our approach.

Authors and Affiliations

Ronald Gualán, Renán Freire, Andrés Tello, Mauricio Espinoza, Víctor Saquicela

Keywords

Related Articles

Diseño y construcción de una máquina semiautomática para la fabricación de bloques

Este artículo presenta el diseño de una máquina semiautomática para la fabricación de bloques, con el objetivo de facilitar el proceso manual de fabricación. Para empezar se detalla el proceso de fabricación y las espe...

Desempeño de modelos hidráulicos 1D y 2D para la simulación de inundaciones

En la actualidad, la disponibilidad de modelos digitales de elevación digital (MDEs) para representar la superficie de la tierra permite el acoplamiento de modelos hidráulicos con sistemas de información geográfica (SI...

International students at the University of Cuenca: A study of their needs and perceptions

Baumrind, psicóloga clínica del siglo 20, reconocida por su investigación sobre estilos de crianza distingue tres estilos de la educación familiar. Sustentado en este enfoque se inició un estudio para identificar el es...

Módulo de recuperación de fallos de los procesos de un sistema FreeBSD utilizando variables en disco

This paper describes the creation of a crash-recovery module of the processes in a reliable communication program with fall and recovery of equipment, on a FreeBSD system. The creation of this module is based on the pa...

Filtrado de SPAM en SMS mediante algoritmos de aprendizaje automático

Una de las más comunes formas de comunicación a través de teléfonos móviles sigue siendo mediante SMS o servicio de mensajes cortos, por sus siglas en inglés. Las entidades financieras, televisoras y las propias operad...

Download PDF file
  • EP ID EP42148
  • DOI -
  • Views 241
  • Downloads 0

How To Cite

Ronald Gualán, Renán Freire, Andrés Tello, Mauricio Espinoza, Víctor Saquicela (2016). Automatic RDF-ization of big data semi-structured datasets. MASKANA, 7(3), -. https://europub.co.uk./articles/-A-42148