Die Unterstützung von Geschäftsprozessen durch Workflow-Management-Systeme ist in großen Unternehmen bereits selbstverständlich. Dies umfasst auch die automatisierte Extraktion von Informationen aus Geschäftsdokumenten und die anschlißende Bereitstellung innerhalb des Prozessablaufes. Laut verschiedener Studien ist das Interesse an Methoden, die die Automatisierung von dokumentintensiven Prozessen ermöglichen, auch in Zukunft besonders groß.
Kleinere und mittlere Unternehmen profitieren indes von diesen Entwicklungen der vergangenen Jahrzehnte jedoch nicht in gleichem Maße wie große Unternehmen. Während in großen Unternehmen Prozesse und Dokumente standardisiert sind, fehlt diese Strukturierung in KMUs häufig. Um deren Anforderungen gerecht zu werden, müssten prozessgestützte Informationssysteme über die notwendige Flexibilität verfügen und sich ohne großen personellen und finanziellen Aufwand in die vorhandene IT-Landschaft integrieren lassen.
Zur Unterstützung dieses Flexibilitätsansatzes werden in dieser Dissertation Methoden zur Klassifikation von Geschäftsdokumenten und der anschließenden automatischen Extraktion von Prozessinformationen entworfen. Hierzu werden Techniken des Maschinellen Lernens auf die Domäne der Geschäftsdokumente angewandt und entsprechend adaptiert. Um den Bedürfnissen von KMUs gerecht zu werden, sollen die adaptierten Methoden mittels einfach modellierbarem Extraktionswissen und ohne größeren Trainingsaufwand zum Einsatz kommen können.
Ziel ist es, mit Hilfe der extrahierten Informationen aus den Geschäftsdokumenten, eine Wissensbasis aufzubauen, innerhalb derer das Dokument- und Prozesswissen semantisch integriert wird. Zum Aufbau der Wissensbasis wird ein ontologie-basierter Ansatz verfolgt, der es ermöglicht, durch logische Schlussfolgerungen Rückschlüsse auf ausgeführte Aktivitäten zu ziehen.