Ergebnisse vom AIFB aus dem Projekt syncTech
Projektziele: Das Ziel des Forschungsprojekts
syncTech
ist es, produzierende Unternehmen in die Lage zu versetzen, schnell
neue, für sie relevante Tehnologien zu erkennen und diese gezielt in
das eigene Technologieportfolio integrieren zu können.
Projektlaufzeit: 03/2012-04/2015
Im Folgenden finden Sie eine Auflistung der Ergebnisse vonseiten des Instituts AIFB aus dem Projekt syncTech:
Semantic MediaWiki-Umfeld
Folgende Semantic MediaWiki-Erweiterungen wurden konzipiert und implementiert:
Technology Portfolio
Die Technologie-Portfolio-Erweiterung dient der Erstellung eines
Portfolios nach Pfeiffer et al. auf Basis von im Wiki abgespeicherten
Technologien. Hierzu wurden Technologien als Wikiseiten angelegt und
mit notwenigen Attributen versehen. Das Technologie-Portfolio enthält
Kreise angeordnet nach den Dimensionen Technologieattraktivität und
Ressourcenstärke. Die Einbettung des Portfolios erfolgt mit Hilfe einer
semantischen Abfrage, so dass beim Seitenaufruf dynamisch gespeicherte
Technologien visualisiert werden.
Die SMW-Erweiterung und weitere Informationen sind unter
http://www.mediawiki.org/wiki/Extension:Technology_Portfolio
verfügbar.
Technology Radar
Die Technologieradar-Erweiterung dient der Erstellung eines Radars mit
im Wiki abgespeicherten Technologien. Hierzu wurden Technologien als
Wikiseiten abgelegt und mit notwendigen Attributen versehen. Das
Technologie-Radar hift der Relevanzeinschätzung von Technologien für
das Unternehmen.
Die Einbettung des Technologieradars erfolgt mit Hilfe einer
semantischen Abfrage, so dass beim Seitenaufruf dynamisch gespeicherte
Technologien visualisiert werden.
Die SMW-Erweiterung und weitere Informationen sind unter
http://www.mediawiki.org/wiki/Extension:Technology_Radar
verfügbar.
Access Control List
Sollen bestimmte Informationen in einer MediaWiki-Instanz nur
bestimmten Mitarbeitern zugänglich sein, kann eine Erweiterung
installiert werden, die es ermöglicht, Wikiseiten für Nutzer für das
Editieren und/oder Lesen zu sperren. Oft sollen allerdings
gewisse Informationen für alle Mitarbeiter zugänglich sein, während
andere verborgen sein sollten. Beispielsweise sollen allgemeine
Informationen wie Vor- und Nachteile von Technologien für alle
zugänglich sein, während Bewertungen von Technologien für die meisten
Personen weder verändert noch eingesehen werden sollen. In diesem Fall
ist ein Zugriffsschutz auf Attributebene notwendig. Da keine momentan
verfügbare Erweiterung dies ermöglicht hat, wurde im Rahmen des
Projekts syncTech eine entsprechende Erweiterung entwickelt.
Die SMW-Erweiterung und weitere Informationen befinden sich unter
https://www.mediawiki.org/wiki/Extension:Access_Control_List.
ReferenceHelper
Diese Erweiterung, die im Rahmen des Seminars "Anwendungen mit Semantic
MediaWiki" entwickelt wurde, soll den Nutzer in die Lage versetzen,
wissenschaftliche Dokumente auf angegebene Referenzen zu durchsuchen.
Die sich daraus ergebenden Beziehungen der verschiedenen Publikationen
untereinander sollen dann in einem Wiki abgebildet und gespeichert
werden können.
Die SMW-Erweiterung und weitere Informationen sind
hier
abrufbar.
SemanticSources
Derzeit besteht bei MediaWiki und Semantic MediaWiki nicht die
Möglichkeit, Quellen von im Wiki gespeicherten Fakten optisch hervor zu
heben oder semantisch-strukturiert abzuspeichern. Auf Wikiseiten
angeführte Quellenangaben werden daher oft nicht beachtet. Ferner gibt
es keine Option, die Güte von Quellen im Wiki zu hinterlegen oder die
Häufigkeit von Referenzen zu erfassen.
Die entwickelte Erweiterung ermöglicht es, Quellenangaben
semantisch-strukturiert abzuspeichern. Die Quellenangaben auf
Wikiseiten werden optisch aufbereitet, so dass der Nutzer einen
schnellen Überblick über die Quellen und ihre Metainformationen erhält.
Zudem können Nutzer Quellen bewerten und damit anderen Nutzern Hinweise
geben, ob der Quelle vertraut werden kann. Auch diese Erweiterung ist
im Rahmen des Seminars "Anwendungen mit Semantic MediaWiki" entstanden.
Die SMW-Erweiterung und weitere Informationen sind
hier abrufbar.
UnstrExtSearch2
Diese Erweiterung ermöglicht die Suche auf Google Search und Bing
innerhalb des Wikis. Der Suchstring kann frei definiert und aus dem
Wikikontext konzipiert werden. Aufgrund von Updates der APIs ist die
Readme-Datei zu beachten.
Die SMW-Erweiterung und weitere Informationen sind
hier
abrufbar.
getSTWSynonyms
Diese Erweiterung greift den Web Service von "STW Thesaurus for
Economics" (http://zbw.eu/beta/econ-ws/about) zurück und ermöglicht das
Finden von Synonymen im Bereich "Wirtschaft". Ergebnisse von "solar"
sind z.B. "photovoltaics", "photovoltaik", "solar cell", "solarzelle",
"fotovoltaikanlage" und "photovoltaikanlage".
Die SMW-Erweiterung und weitere Informationen sind
hier
abrufbar.
Weitere Semantic MediaWiki-Erweiterungen wurden im Rahmen von Seminaren
entwickelt. Siehe
http://km.aifb.kit.edu/teach/smw-seminar/wiki/
für mehr Details.
Weitere Werkzeuge und Datensätze
Überblick über verfügbare Datensätze
im Kontext von syncTech
Die Datensätze, die im Rahmen des Technologie- und
Innovationsmanagement relevant sein könnten, wurden im Rahmen von
SyncTech systematisch recherchiert und gegenüber gestellt. Ein
Überblick ist
hier als PDF verfügbar.
Palladian-Java-Projekt
Palladian (
http://palladian.ws) ist ein Tool zur Erkennung von
Eigennamen in Text. Neben gängigen Entitätsklassen wie Person können
auch Entitätsklassen wie Produkt verwendet werden. Notwendig ist die
Bereitstellung von einem seed (Instanzen für die Entitätstypen), um
daraus patterns zu erlernen und damit neue Eigennamen zu extrahieren.
Für die Gewinnung von Trainingsdaten wird Bing Search verwendet.
Achtung: Aufgrund der geänderten Bing API (hin zu Microsoft Azure
Search) ist die Suche nicht mehr durchführbar. Siehe auch
bin/config/palladian.properties.
Der Java-Code ist
hier verfügbar.
Wikipedia Analysis
Zur Analyse und Extraktion von Artikelnamen, Kategorien etc. von einem
gegebenen Wikipedia-Dump wurde ein Java-Projekt geschaffen. Es können
die gesamte Wikipedia wie auch Unterbereiche analysiert werden.
Der Code ist
hier verfügbar.
PatentIndex
Dieses Java-Projekt dient der Indizierung und Analyse von Patenten.
Nach einer Indizierung mit Apache Lucene können pro Dokument
Statistiken wie die Term-Häufikgeit extrahiert werden.
Zur Indizierung und Analyse wird LuceneDemo_Only1Corpus.java verwendet.
Der Code ist
hier verfügbar.
Anbindung an Semantic MediaWiki in Java
Dieses Java-Projekt kann als Vorlage benutzt werden, um in Java ein
Wiki zu editieren. Hierzu muss edu.kit.aifb.CreateArticle.java
entsprechend angepasst werden.
Das Java-Projekt ist
hier verfügbar.
Weitere Abschlussarbeiten
Andreas Harter: "Eigennamenerkennung auf
domänenspezifischen Korpora"
Diese Bachelorarbeit befasst sich mit der Leistungsfähigkeit von
Werkzeugen zur Eigennamenerkennung (NERC) auf domänenspezifischen
Textkorpora. Dabei wird insbesondere der Einfluss des zugrundeliegenden
statistischen Modells (HMM, CRF) untersucht.
Der verwendete Testkorpus beinhaltet Nachrichtentexte aus dem Bereich
Wirtschaft und Finanzen. In diesem werden sechs verschiedene Klassen
von Eigennamen annotiert. Daraufhin werden fünf verschiedene NERC-Tools
vorgestellt und anhand des Korpus getestet und evaluiert. Abschließend
werden die Tools gegenübergestellt und eine Aussage über den besten
Systemansatz beim Erkennen von Eigennamen getroffen.
Die Arbeit wie auch die
Datensätze können auf Nachfrage bezogen werden.
Henriette Gonsior:
"Wissensmanagementtools in der industriellen Praxis"
Im Rahmen einer Bachelorarbeit wurde ein Bewertungssystem geschaffen,
mit Hilfe dessen Wissensmanagementsysteme eingeordnet und das für den
individuellen Anwendungsfall geeignetste Wissensmanagementsystem
ermittelt wird.
Die Arbeit und die Bewertungsmatrix ist auf Nachfrage erhältlich.
Alexander Kraetke: "Analyse von Wikidata und Verbindung mit einer semantischen Suche"
Ziel dieser Arbeit ist die Analyse von Wikidata und die Nutzung einer
semantic search engine auf Basis von Wikidata. Hierfür wurde zunächst
Wikidata analysiert. Es wurden Bereiche, die viele verschiedene Klassen
mit vielen Instanzen und zugehörigen Properties, Labels, Aliases und
Descriptions haben, beleuchtet. Ferner wurde die Performance der
semantic search engine GraphScope von SearchHaus auf den
Wikidata-Datenbestand evaluiert.
Die Arbeit und der Code sind auf Nachfrage erhältlich.
Veröffentlichungen
Michael Färber, Achim Rettinger
A semantic wiki for novelty search on documents
Proceedings of the 13th Dutch-Belgian Workshop on Information
Retrieval, Seiten: 60-61, Springer, Berlin, Heidelberg, April, 2013
Michael Färber
Ontology-supported document ranking for novelty search
Proceedings of the 9th Extended Semantic Web Conference (ESWC '13), Seiten: 639-644, Springer, Berlin, Heidelberg, Mai, 2013
Lei Zhang, Michael Färber, Thanh Tran, Achim Rettinger
Exploiting Semantic Annotations for Entity-based Information Retrieval
Proceedings of the ISWC 2014 Posters & Demonstrations Track, CEUR-WS, Oktober, 2014
Michael Färber, Lei Zhang, Achim Rettinger
Kuphi - An Investigation Tool for Searching for and via Semantic Relations
The Semantic Web: ESWC 2014 Satellite Events, Springer, LNCS, Heidelberg, Mai, 2014
(c) 2015
Michael Färber,
Institute AIFB, KIT