Semantikkbasert informasjonsforvaltning for Forsvaret - sluttrapportering av aktiviteten på semantiske teknologier i FFI-prosjekt Informasjons- og integrasjonstjenester i INI
Abstract
Rapporten oppsummerer forskningsaktiviteten på semantiske teknologier i FFI-prosjekt 1277 –
Informasjons- og integrasjonstjenester i INI. Delaktivitetens oppgave var å studere hvordan semantiske
teknologier kan brukes til å bidra til å løse problemet med å integrere informasjon fra heterogene
kilder.
Et overblikk over fagfeltet, grunnleggende konsepter og standarder blir først presentert. Her
beskrives semantiske teknologier generelt, før det dykkes ned i teknologier og standarder assosiert
med Semantic Web, en gruppe semantiske teknologier som har blitt lingua franca for feltet og som er
bygget på web-arkitekturen. Rapporten fortsetter så med å legge frem lovende anvendelsesområder
for teknologiene med tanke på bruk i forsvarssammenheng. Anvendelsene skissert er følgende:
ontologibasert dataintegrasjon der ontologier fungerer som et abstraksjonslag over heterogene kilder,
reaktiv hendelsesdeteksjon over strømmer av data, semantiske teknologier som stordatarammeverk,
samt bruk av RDF (en standard under Semantic Web paraplyen) som metadatastrategi.
Deretter skiftes fokus over til å beskrive forskningsproblemene som prosjektet konsentrerte
seg om, eksemplifisert med to konkrete militære problemstillinger, henholdsvis planlegging av
evakueringsflygninger i en konfliktsituasjon og et konseptuelt informasjonssystem for helse- og
hendelsesregister. Fellesnevneren for eksemplene er behovet for å hente inn informasjon fra en
rekke heterogene informasjonskilder. Basert på de ovennevnte problemstillingene, ble det å løse
problemer relatert til innsamling av relevant informasjon fra heterogene informasjonskilder, under de
særskilte behov og begrensninger som det militære domenet fordrer, prosjektets hovedfokus. Dette
førte til forskningsresultater som er av teoretisk og prinsipiell natur, men som er appliserbare i en
videre forstand både innenfor og utenfor det militære domenet. I tillegg ble det, basert på de teoretiske
resultatene, utviklet programvare for praktisk informasjonsintegrasjon. Rapporten dokumenterer
resultatene som er oppnådd samt lærdommene som ble trukket av dem.
Til slutt forelegges konkrete anbefalinger med tanke på å tilrettelegge for bruk av teknologien
både på kort og lang sikt. Mer konkret er det prosjektets oppfatning at dataorientering ved bruk av
RDF har et stort potensial for Forsvaret. For at dette skal kunne være realiserbart, har prosjektet
kommet frem til anbefalinger som dekker både strategi og retningslinjer og mer tekniske aspekter.
For førstnevnte gruppe, anbefales det å utvikle en strategi for standardisert navngiving av ressurser
i en dataorientert setting, samt tilhørende metadatastrategi, for bruk i Forsvaret. De mer tekniske
anbefalingene er å utvikle kompetanse på grafdatabaser samt å utvikle datafederering som et
alternativ til datavarehus. Grafdatabaser er nyttige teknologier som egner seg for analyse av store
datamengder, mens datafederering er svært nyttig som et alternativ til datavarehus der informasjon
må hentes utenifra og juridiske barrierer kan forhindre lokal lagring av data. This document summarizes the research undertaken and recommendations produced in the FFIproject
1277 regarding semantic technologies. The mandate for the activity was to study how semantic
technologies can contribute in solving the problem of integrating information from heterogeneous
sources
First, a high-flying overview of the subject area, the basic concepts and related standards are
presented. The general field of semantic technologies is introduced before diving into the technologies
and standards that are associated with the Semantic Web, a group of semantic technologies built
on top of the web-architecture, that have become the lingua franca for the field. The document
then proceeds to highlight some promising military application areas for the technologies. More
specifically, the areas are: ontology-based data access where ontologies act as an abstraction layer
over the heterogeneous sources, event detection over streaming data, semantic technologies as a
big-data framework, and finally the use of RDF as a metadata strategy.
The focus of the document then shifts over to describing the research questions that were in focus,
exemplified by using two concrete cases from the military domain. More specifically, a case involving
planning military evacuation flights in a conflict zone and a case conceptualizing an information
system involving accessing medical and event-based data. The commonality between the two cases
is the need to collect and integrate information from various heterogeneous sources. Based on the
aforementioned, the concrete research activities undertaken focused on solving problems related to
federated information gathering from heterogeneous data sources, under the distinctive constraints
and requirements that the military domain imposes. This produced research results of a theoretical
and principal nature, yet are applicable in a wider context both within and outside the military domain.
Furthermore, software was produced that facilitates practical information integration based on the
theoretical results. The results and lessons learned are subsequently documented.
Finally, a set of recommendations are produced regarding what activities that should be undertaken
in order to make the technology ready for use both in the short and the long term. More
concretely, the project believes that a data-oriented approach, using RDF, has great potential for
military use. However, in order to ensure that it is realizable, the project has produced a set of
recommendations regarding strategy and best-practices, as well as technologies that that warrant
further focus. With respect to the former group, it is recommended that an URI strategy for naming
resources in a data-oriented setting for use in the Norwegian defence is developed, together with
a matching metadata strategy. With respect to technology areas, the project recommends acquiring
and developing knowledge regarding graph databases as these are well-suited for analyzing
large amounts of data. Another recommendation is to develop federated information gathering and
querying as an alternative to traditional data warehouse strategies, which is especially useful in
situations where information must be collected from sources outside the home organization and/or
judicial barriers prevents local storage of data.