Informationstechnik für die Fachlichkeit (1)

Daten- und Informationsmodelle

»Informationsmodell« – was für ein harmloses Wort! Dabei ist das Informationsmodell der entscheidende Faktor für die Qualität eines (polizeilichen) Informationssystems. Und wesentlich für seine Fähigkeit zum Informationsaustausch mit anderen Informationssystemen. Wenn Sie also verstehen wollen, wo die aktuellen Probleme beim Informationsaustausch liegen oder wenn Sie gar mit zu entscheiden haben über die Beschaffung eines Informationssystems, lohnt es sich, sich mit dem »Informationsmodell« etwas näher vertraut zu machen.

Datenbank? Datenmodell? Informationsmodell?

Datenbanksystem? Informationsmodell? Datenmodell? – auch Experten wissen häufig nicht genau, was eigentlich was ist. So kommt es dann zu Veröffentlichungen, wie dieser Antwort [1] auf eine Anfrage eines CDU-Abgeordneten in der Hamburgischen Bürgerschaft:

„CRIME ist ein hochflexibles Datenbanksystem. Diese Flexibilität ermöglicht eine Anpassung an unterschiedliche Datenmodelle wie zum Beispiel ein Informationsmodell (IMP), welches derzeit als einheitliches Datenmodell zwischen den Ländern und dem Bund abgestimmt wird.“

Ja, was denn nun? fragt sich der irritierte Leser: Ist Informationsmodell und Datenmodell denn ein- und dasselbe?! Die eindeutige Antwort lautet: Nein! Richtig ist vielmehr, dass im Inneren jedes Informationssystems eine Datenbank steckt. Und dass für jede Datenbank sowohl ein Informationsmodell notwendig ist, als auch ein Datenmodell. Das Datenbank(verwaltungs)systemdagegen ist eine Art Betriebssystem für die Datenbank, das der Entwickler allenfalls nutzen kann. Doch was ist jetzt was?!

Die Begriffsverwirrung geht zurück auf Fachbegriffe aus Amerika, woher die heute verwendete Datenbanktechnik stammt. Ursprünglich amerikanische Fachbegriffe wurden eingedeutscht und werden heute zunehmend unfachmännisch bzw. unzulässig verkürzt benutzt. Schauen wir’s uns im Einzelnen an:

Die Entwicklung einer Datenbank wird im Amerikanischen als »Modelling«, also Modellierung bezeichnet, das Ergebnis dieses Prozesses als das »data(base) model«, also das Daten(bank)mode‘. Aus dem früher verwendeten »data base ….« bzw. Datenbank… ist inzwischen nur der Bestandteil »data« / Daten… übriggeblieben. Man spricht heute also eher von »data()model« bzw. Daten()modell.

Es gibt jedoch nicht ein und nur ein Datenmodell für eine Datenbank, sondern eigentlich mehrere Datenmodelle pro Datenbank. Und das kam so: Das amerikanische Standardisierungsinstitut ANSI hat sich schon in den siebziger Jahren des letzten Jahrhunderts mit der Frage der effektiven Datenbankentwicklung beschäftigt. Dabei herausgekommen ist die Empfehlung, dass Datenbanken in einem mehrstufigen Entwicklungsprozess entwickelt werden sollten. Und am Ende jedes Teil-Entwicklungsschrittes stand ein Datenmodell mit einer ganz bestimmten Bezeichnung. Uns interessiert im Folgenden

  • das externe Datenmodell = Informationsmodell und
  • das physische Datenmodell.

Aufgabe für die Fachlichkeit: Das EXTERNE DATENMODELL oder INFORMATIONSMODELL

Am Anfang der Entwicklung ist die Fachlichkeit gefragt, also die (Vertreter der) späteren Anwender: Sie sollen definieren, welche Informationen in der neuen Datenbank gespeichert werden sollen bzw. welche Fragen die neue Datenbank beantworten soll. Nehmen wir eine Autovermietung als Beispiel: Sie muss in der Lage sein, Informationen über Fahrzeuge, Standorte, Verleih-Transaktionen, Fahrer und Mieter des Fahrzeugs, sowie Rechnungsempfänger zu speichern.

Man nennt solche Elemente INFORMATIONSOBJEKTE, weil ein Objekt, z.B. über ein Fahrzeug, in der Datenbank die relevanten Informationen über ein konkretes Fahrzeug in der Wirklichkeit enthält. Das Informationsobjekt ist das Abbild eines bestimmten Objekts der Wirklichkeit in der Datenbank. Informationsobjekte werden zu Kategorien zusammengefasst, um gleichartige Objekte miteinander vergleichbar zu machen. SOlche Kategorien heißten OBJEKTTYPEN. Beispiele für Objekttypen sind

  • Person>
  • Firma/Geschäft/Gewerbe (juristisch korrekt: Körperschaft privaten Rechts)
  • Adresse
  • Fahrzeug
  • Telefonanschluss(nummer)
  • Email-Adresse usw

Für jeden Objekttyp wird auch noch festgelegt, welche Einzelinformationen benötigt werden, um ein Objekt des jeweiligen Typs näher zu identifizieren oder zu beschreiben. Diese Einzelinformationen werden als MERKMALE oder ATTRIBUTE bezeichnet. Dafür werden Merkmals-Kategorien gebildet, das sind z.B. für
den Objekttyp PERSON

  • Familienname
  • Vorname(n)
  • Geburtsdatum
  • Geburtsort usw.

oder für den Objekttyp Adresse (Postanschrift)

  • Strasse
  • Hausnummer
  • PLZ
  • Ort usw.

Die Kategorien geben also an, welche BEDEUTUNG ein bestimmter Merkmalsbegriff hat.
Beispiel für eine Person

  • Familienname:Müller
  • Vorname:Thomas
  • Geburtsdatum 13.09.1989
  • Geburtsort:Weilheim

Das Ergebnis dieses Entwicklungsschrittes wird als externes Datenmodell bezeichnet. Dieser fachlich korrekte Begriff wurde im Deutschen allerdings zunehmend verdrängt vom Begriff »Informationsmodell«.

Aufgabe für die Techniker: Das PHYSISCHE DATENMODELL

In den Empfehlungen des amerikanischen Standardisierungsinstituts ANSI ist ein weiterer Entwicklungsschritt für eine Datenbank beschrieben: Sein Ergebnis wird als das ‚physical data model‘ bezeichnet, im Deutschen wurde daraus das ‚physische Datenmodell‘. Es beschreibt, welche Speicherstrukturen auf der Datenbank eingerichtet werden müssen, um die Informationen zu speichern, die zuvor im externen Datenmodell = Informationsmodell definiert worden waren.

Was hat das verwendete DATENBANKSYSTEM mit dem physischen Datenmodell zu tun?!

In den meisten Fällen wird für polizeiliche Informationssysteme als Datenbanksystem ein so genanntes relationales Datenbanksystem (engl: relational database management system = RDBMS) eingesetzt. Man kann die Speicherstruktur einer relationalen Datenbank vergleichen mit einem Lagerhaus, in dem viele Hochregale stehen. Das INFORMATIONSMODELLbestimmt, welche Güter, d.h. Informationsobjekte, in diesem Lagerhaus gespeichert werden dürfen. Das physische DATENMODELL legt fest, wie die einzelnen Regale = Speicherbereiche strukturiert sein müssen, damit die Güter, also Informationsobjekte (z.B. Personen, Fahrzeuge, Adressen usw.), im jeweiligen Regal gespeichert werden können und wiedergefunden werden. Vereinfacht gesagt, muss es für sämtliche Merkmale einer bestimmten MERKMALSBEDEUTUNG ein eigenes Fach im zugehörigen Regal für den Objekttyp geben.

Außerdem regelt das physische Datenmodell, wie Objekte eines bestimmten Typs mit anderen Objekten in Beziehung stehen. In der Datenbank der Autovermietung möchte man zu jedem Mieter auch die Adresse speichern; in einem polizeilichen Informationssystem braucht man zu einer Straftat auch den einen oder die mehreren Geschädigten, usw. Solche Zusammenhänge zwischen Informationsobjekten werden als ‚Beziehungen‘ bezeichnet. RELATIONALE, also „beziehungs-orientierte“ Datenbanksysteme, haben daher ihren Namen.

Eine relationale Datenbank ist aufgebaut aus Tabellen. Jede Tabelle besteht aus beliebig vielen Zeilen, von denen jede Zeile die Einzelinformationen über ein ganz bestimmtes Informationsobjekt enthält. Vertikal ist jede Tabelle in Spalten unterteilt. Die Zellen in einer bestimmten Spalte nehmen Merkmale einer ganz bestimmten Bedeutung auf: So stehen z.B. in einer Tabelle für Personen in der Spalte ‚Familienname‘ eben die Familiennamen der dort gespeicherten Personen-Informationsobjekte und in der Spalte ‚Vorname‘ der jeweilige Vorname dieser Personen usw.

Wie man ein physisches Datenmodell entwickelt, wollen wir gar nicht weiter vertiefen: Dass und warum es dafür einen sehr flexiblen Ansatz gibt, das so genannten GENERISCHE DATENMODELL, welches patentiert und im Informationssystem POLYGON in ein funktionales System umgesetzt ist, darauf kommen wir in einem späteren Artikel dieser Serie zurück.

Nachdem Sie nun wissen, dass Informationsmodell und Datenmodell nicht ein- und dasselbe sind, ist es leicht, die eingangs erwähnte Stellungnahme der Experten aus Hamburg so zu formulieren, wie es sachlich und fachlich richtig ist:

„CRIME ist ein hochflexibles Informationssystem, das das relationale Datenbanksystem Oracle nutzt. Es verwendet ein (immer gleiches) physisches Datenmodell (, das vielfach auch als „generisches Datenmodell“ bezeichnet wird). Sein Informationsmodell kann angepasst werden, so z.B. auf das Informationsmodell Polizei (IMP), welches als einheitliches Informationsmodell für die Polizeibehörden zwischen den Ländern und dem Bund abgestimmt wurde.

Dieser Beitrag ist Teil der Serie »Grundlagen der polizeilichen Informationstechnik« …

Quelle zu diesem Beitrag

[1]     Kriminalität und der Einsatz moderner Fahndungsmethoden, Schriftliche Kleine Anfrage des Abgeordneten
Kai Voet van Vormizeele (CDU) vom 14.10.11 und Antwort des Senats vom 21.10.2011, Drucksache
Nr. 20/1841 über http://www.buergerschaft-hh.de/parldok/