Ergebnisse vom AIFB aus dem Projekt syncTech

Projektziele: Das Ziel des Forschungsprojekts syncTech ist es, produzierende Unternehmen in die Lage zu versetzen, schnell neue, für sie relevante Tehnologien zu erkennen und diese gezielt in das eigene Technologieportfolio integrieren zu können.
Projektlaufzeit: 03/2012-04/2015



Im Folgenden finden Sie eine Auflistung der Ergebnisse vonseiten des Instituts AIFB aus dem Projekt syncTech:


Semantic MediaWiki-Umfeld

Folgende Semantic MediaWiki-Erweiterungen wurden konzipiert und implementiert:

Technology Portfolio
Die Technologie-Portfolio-Erweiterung dient der Erstellung eines Portfolios nach Pfeiffer et al. auf Basis von im Wiki abgespeicherten Technologien. Hierzu wurden Technologien als Wikiseiten angelegt und mit notwenigen Attributen versehen. Das Technologie-Portfolio enthält Kreise angeordnet nach den Dimensionen Technologieattraktivität und Ressourcenstärke. Die Einbettung des Portfolios erfolgt mit Hilfe einer semantischen Abfrage, so dass beim Seitenaufruf dynamisch gespeicherte Technologien visualisiert werden.

Die SMW-Erweiterung und weitere Informationen sind unter http://www.mediawiki.org/wiki/Extension:Technology_Portfolio verfügbar.


Technology Radar
Die Technologieradar-Erweiterung dient der Erstellung eines Radars mit im Wiki abgespeicherten Technologien. Hierzu wurden Technologien als Wikiseiten abgelegt und mit notwendigen Attributen versehen. Das Technologie-Radar hift der Relevanzeinschätzung von Technologien für das Unternehmen.
Die Einbettung des Technologieradars erfolgt mit Hilfe einer semantischen Abfrage, so dass beim Seitenaufruf dynamisch gespeicherte Technologien visualisiert werden.

Die SMW-Erweiterung und weitere Informationen sind unter http://www.mediawiki.org/wiki/Extension:Technology_Radar verfügbar.


Access Control List
Sollen bestimmte Informationen in einer MediaWiki-Instanz nur bestimmten Mitarbeitern zugänglich sein, kann eine Erweiterung installiert werden, die es ermöglicht, Wikiseiten für Nutzer für das Editieren und/oder Lesen zu sperren.  Oft sollen allerdings gewisse Informationen für alle Mitarbeiter zugänglich sein, während andere verborgen sein sollten. Beispielsweise sollen allgemeine Informationen wie Vor- und Nachteile von Technologien für alle zugänglich sein, während Bewertungen von Technologien für die meisten Personen weder verändert noch eingesehen werden sollen. In diesem Fall ist ein Zugriffsschutz auf Attributebene notwendig. Da keine momentan verfügbare Erweiterung dies ermöglicht hat, wurde im Rahmen des Projekts syncTech eine entsprechende Erweiterung entwickelt.

Die SMW-Erweiterung und weitere Informationen befinden sich unter https://www.mediawiki.org/wiki/Extension:Access_Control_List.


ReferenceHelper
Diese Erweiterung, die im Rahmen des Seminars "Anwendungen mit Semantic MediaWiki" entwickelt wurde, soll den Nutzer in die Lage versetzen, wissenschaftliche Dokumente auf angegebene Referenzen zu durchsuchen. Die sich daraus ergebenden Beziehungen der verschiedenen Publikationen untereinander sollen dann in einem Wiki abgebildet und gespeichert werden können.

Die SMW-Erweiterung und weitere Informationen sind hier abrufbar.


SemanticSources
Derzeit besteht bei MediaWiki und Semantic MediaWiki nicht die Möglichkeit, Quellen von im Wiki gespeicherten Fakten optisch hervor zu heben oder semantisch-strukturiert abzuspeichern. Auf Wikiseiten angeführte Quellenangaben werden daher oft nicht beachtet. Ferner gibt es keine Option, die Güte von Quellen im Wiki zu hinterlegen oder die Häufigkeit von Referenzen zu erfassen.
Die entwickelte Erweiterung ermöglicht es, Quellenangaben semantisch-strukturiert abzuspeichern. Die Quellenangaben auf Wikiseiten werden optisch aufbereitet, so dass der Nutzer einen schnellen Überblick über die Quellen und ihre Metainformationen erhält. Zudem können Nutzer Quellen bewerten und damit anderen Nutzern Hinweise geben, ob der Quelle vertraut werden kann. Auch diese Erweiterung ist im Rahmen des Seminars "Anwendungen mit Semantic MediaWiki" entstanden.

Die SMW-Erweiterung und weitere Informationen sind hier abrufbar.


UnstrExtSearch2
Diese Erweiterung ermöglicht die Suche auf Google Search und Bing innerhalb des Wikis. Der Suchstring kann frei definiert und aus dem Wikikontext konzipiert werden. Aufgrund von Updates der APIs ist die Readme-Datei zu beachten.

Die SMW-Erweiterung und weitere Informationen sind hier abrufbar.


getSTWSynonyms
Diese Erweiterung greift den Web Service von "STW Thesaurus for Economics" (http://zbw.eu/beta/econ-ws/about) zurück und ermöglicht das Finden von Synonymen im Bereich "Wirtschaft". Ergebnisse von "solar" sind z.B. "photovoltaics", "photovoltaik", "solar cell", "solarzelle", "fotovoltaikanlage" und "photovoltaikanlage".

Die SMW-Erweiterung und weitere Informationen sind hier abrufbar.


Weitere Semantic MediaWiki-Erweiterungen wurden im Rahmen von Seminaren entwickelt. Siehe http://km.aifb.kit.edu/teach/smw-seminar/wiki/ für mehr Details.



Weitere Werkzeuge und Datensätze

Überblick über verfügbare Datensätze im Kontext von syncTech
Die Datensätze, die im Rahmen des Technologie- und Innovationsmanagement relevant sein könnten, wurden im Rahmen von SyncTech systematisch recherchiert und gegenüber gestellt. Ein Überblick ist hier als PDF verfügbar.


Palladian-Java-Projekt
Palladian (http://palladian.ws) ist ein Tool zur Erkennung von Eigennamen in Text. Neben gängigen Entitätsklassen wie Person können auch Entitätsklassen wie Produkt verwendet werden. Notwendig ist die Bereitstellung von einem seed (Instanzen für die Entitätstypen), um daraus patterns zu erlernen und damit neue Eigennamen zu extrahieren. Für die Gewinnung von Trainingsdaten wird Bing Search verwendet.
Achtung: Aufgrund der geänderten Bing API (hin zu Microsoft Azure Search) ist die Suche nicht mehr durchführbar. Siehe auch bin/config/palladian.properties.

Der Java-Code ist hier verfügbar.


Wikipedia Analysis
Zur Analyse und Extraktion von Artikelnamen, Kategorien etc. von einem gegebenen Wikipedia-Dump wurde ein Java-Projekt geschaffen. Es können die gesamte Wikipedia wie auch Unterbereiche analysiert werden.

Der Code ist hier verfügbar.


PatentIndex
Dieses Java-Projekt dient der Indizierung und Analyse von Patenten. Nach einer Indizierung mit Apache Lucene können pro Dokument Statistiken wie die Term-Häufikgeit extrahiert werden.
Zur Indizierung und Analyse wird LuceneDemo_Only1Corpus.java verwendet.

Der Code ist hier verfügbar.


Anbindung an Semantic MediaWiki in Java
Dieses Java-Projekt kann als Vorlage benutzt werden, um in Java ein Wiki zu editieren. Hierzu muss edu.kit.aifb.CreateArticle.java entsprechend angepasst werden.

Das Java-Projekt ist hier verfügbar.



Weitere Abschlussarbeiten

Andreas Harter: "Eigennamenerkennung auf domänenspezifischen Korpora"
Diese Bachelorarbeit befasst sich mit der Leistungsfähigkeit von Werkzeugen zur Eigennamenerkennung (NERC) auf domänenspezifischen Textkorpora. Dabei wird insbesondere der Einfluss des zugrundeliegenden statistischen Modells (HMM, CRF) untersucht.
Der verwendete Testkorpus beinhaltet Nachrichtentexte aus dem Bereich Wirtschaft und Finanzen. In diesem werden sechs verschiedene Klassen von Eigennamen annotiert. Daraufhin werden fünf verschiedene NERC-Tools vorgestellt und anhand des Korpus getestet und evaluiert. Abschließend werden die Tools gegenübergestellt und eine Aussage über den besten Systemansatz beim Erkennen von Eigennamen getroffen.
Die Arbeit wie auch die Datensätze können auf Nachfrage bezogen werden.

Henriette Gonsior: "Wissensmanagementtools in der industriellen Praxis"
Im Rahmen einer Bachelorarbeit wurde ein Bewertungssystem geschaffen, mit Hilfe dessen Wissensmanagementsysteme eingeordnet und das für den individuellen Anwendungsfall geeignetste Wissensmanagementsystem ermittelt wird.
Die Arbeit und die Bewertungsmatrix ist auf Nachfrage erhältlich.

Alexander Kraetke: "Analyse von Wikidata und Verbindung mit einer semantischen Suche"
Ziel dieser Arbeit ist die Analyse von Wikidata und die Nutzung einer semantic search engine auf Basis von Wikidata. Hierfür wurde zunächst Wikidata analysiert. Es wurden Bereiche, die viele verschiedene Klassen mit vielen Instanzen und zugehörigen Properties, Labels, Aliases und Descriptions haben, beleuchtet. Ferner wurde die Performance der semantic search engine GraphScope von SearchHaus auf den Wikidata-Datenbestand evaluiert.
Die Arbeit und der Code sind auf Nachfrage erhältlich.


Veröffentlichungen

Michael Färber, Achim Rettinger
A semantic wiki for novelty search on documents
Proceedings of the 13th Dutch-Belgian Workshop on Information Retrieval, Seiten: 60-61, Springer, Berlin, Heidelberg, April, 2013

Michael Färber
Ontology-supported document ranking for novelty search

Proceedings of the 9th Extended Semantic Web Conference (ESWC '13), Seiten: 639-644, Springer, Berlin, Heidelberg, Mai, 2013

Lei Zhang, Michael Färber, Thanh Tran, Achim Rettinger
Exploiting Semantic Annotations for Entity-based Information Retrieval
Proceedings of the ISWC 2014 Posters & Demonstrations Track, CEUR-WS, Oktober, 2014

Michael Färber, Lei Zhang, Achim Rettinger
Kuphi - An Investigation Tool for Searching for and via Semantic Relations
The Semantic Web: ESWC 2014 Satellite Events, Springer, LNCS, Heidelberg, Mai, 2014





(c) 2015 Michael Färber, Institute AIFB, KIT



Verfasst von Michael Färber , AIFB, 2015