Redundanzen beseitigen

Previous  Next

Das Speichern aller Datensätze in einer einzigen Tabelle führt auch dazu, dass sich in vielen Spalten immer wieder Werte wiederholen. Diese Wiederholungen werden als Redundanzen bezeichnet, die Sie im nächsten Schritt beseitigen müssen. Dazu müssen Sie für jede Spalte, in der sich Einträge wiederholen können, eine eigene Tabelle anlegen. Jede dieser Tabellen erhält zudem eine Spalte ID, um jeden Datensatz eindeutig kennzeichnen zu können. In die neuen Tabellen übernehmen Sie dann die entsprechenden Werte aus der Haupt-Tabelle. Anders als bisher in der Haupt-Tabelle wird in der neuen Tabelle jeder Wert nur noch 1 Mal aufgeführt. Im Gegenzug ersetzen Sie die Werte in der Haupt-Tabelle mit den dazugehörigen ID der neuen Tabellen. Die Tabellen sind somit über die jeweiligen IDs miteinander verknüpft und stehen zueinander in Relation. Die entsprechenden IDs werden nun als Schlüssel bezeichnet. Die Namen der neuen Tabellen und die Spaltennamen der Tabelle Fahrzeuge sollten möglichst gleich sein. Es ist empfehlenswert bei allen Spalten die Fremdschlüssel enthalten, deren Spaltennamen dem Kürzel _ID zu erweitern, um diese klar zu kennzeichnen.

 

Bei einem Blick auf die Beispieldaten fällt auf, dass in allen Spalten außer bei ID Redundanzen auftreten oder zumindest später im praktischen Einsatz auftreten können. Spalten, in denen ausschließlich Zahlen vorkommen, müssen Sie jedoch genauer prüfen. Ganzzahlen verbrauchen so wenig Speicherplatz, dass es in der Praxis meistens keinen Sinn macht, diese in eine eigene Tabelle auszulagern. Somit kommen für ein Auslagern der Daten die Spalten Marke, Modell, Fahrzeugart, Kategorie, Farbe, Kraftstoff, Getriebe, Tueren und Schadstoffklassen in Frage.

 

Hinweis: Da die IDs in der Tabelle Fahrzeuge aus einer fremden Tabelle stammen, werden diese als Fremdschlüssel bezeichnet, während die selben IDs in den neuen Tabellen als Primärschlüssel bezeichnet werden.

 

Marken

clip0274

Modelleclip0282

 

Fahrzeugarten

clip0275

Kategorienclip0276

Farben

clip0290

Kraftstoffe clip0291

Getriebe

clip0278

Tueren

clip0279

Schadstoffklassen

clip0280

 

 

 

Fahrzeuge

clip0284

Die neue Situation.

 

 

Neben der Haupt-Tabelle Fahrzeuge treten jedoch auch in der zweiten Tabelle Fahrzeug_Extras Redundanzen auf, die beseitigt werden müssen. Hier lassen sich die Werte der Spalte Extras in eine neue Tabelle Extras ausgliedern. Nach dieser Maßnahme stehen erstmals 3 Tabellen miteinander in Relation, und zwar Fahrzeuge, Fahrzeug_Extras und Extras.

 

 

Fahrzeug_Extras

clip0268

Extras

clip0289

Fahrzeug_Extras

clip0285

Vorher. Die Spalte Extras enthält

Redundanzen, die aufgelöst werden.

Nachher. Die Werte der Spalte Extras werden in eine neue

Tabelle Extras ausgelagert.

 

 

Hinweis: Allein den Speicherbedarf haben wir durch die vorgenommenen Veränderungen bereits deutlich reduzieren können. Während die ursprüngliche Tabelle Fahrzeuge noch 3.136 Zeichen enthielt, kommen wir nun mit nur noch 1.633 Zeichen aus. Umso mehr Datensätze dazu kommen, desto größer wird sich die Einsparung auswirken.