Zahlenanalyse

Warum Zahlenanalyse bei Lean?

Geld regiert die Welt, mit Zahlen kann man Dinge verdeutlichen, Auswertungen werden für die Steuerung eingesetzt. In jedem Workshop zum Thema Shopfloor lernt man, dass Kennzahlen für Fehler oder Sicherheit transparent gemacht werden müssen. In der Analysephase bei SixSigma wird häufig die längste Zeit dazu verwendet, Zahlen zu analysieren und das Projekt messbar zu machen. Visualisiert werden die Daten in Berichten oder Dashboards. Die Arbeit mit Zahlen zu vereinfachen und Auswertungen zu standardisieren bzw. automatisieren, kann mit BI-Tools (Business Intelligence oder Geschäftsanalytik) realisiert werden. Nachdem die Datenstrukturen festgelegt wurden, werden Datenveränderungen nach immer der gleichen Vorgehensweise ohne oder mit geringem manuellem Eingriff aufbereitet. Es wird die Vorgehensweise gezeigt, keine spezielle Software vorgestellt.

Datenquellen

Statische Daten oder Stammdaten verändern sich selten und beschreiben zum Beispiel eine Kostenstellenstruktur, Arbeitspläne, Lieferantendaten. Bewegungsdaten oder dynamische Daten ändern sich ständig. Sie haben eine Beziehung zur Wertschöpfung. In einem ERP-System sind das Bestelldaten wie Liefertermine oder Mengen, geleistete Arbeitszeiten für einen Auftrag. Beide Datenquellen werden bei einer Datenanalyse kombiniert.

Algorithmen und Mathematik

Bei heutigen Analyseprogrammen wird man mit Algorithmen und grafischen Tools unterstützt. Das befreit nicht, sich mit den Algorithmen beschäftigen zu müssen, um die Analyseergebnisse zu verstehen.

Bei der Zahlenanalyse sollte mathematisches Grundverständnis gegeben sein, Zahlenaffinität oder ein Studium hilft bei der Wahl der richtigen Auswertung. Es bestehen viele Ressourcen im Internet, die Lösungswege aufzeigen.

Prinzipielle Vorgehensweise

Folgende Vorgehensweise ist empfehlenswert und wird von den Systemen auch vorgegeben:

  • Datenaufbereitung programmgeführt oder programmiert
  • Kombination von Daten
  • Erstellung von Auswertungen und Berechnungen
  • Visualisierung
  • Datenvalidierung
  • Veröffentlichung

Datenaufbereitung

Die Erfahrung zeigt, dass es keine perfekten Daten gibt. Stammdaten sind im Normalfall einfacher zu verwenden als Bewegungsdaten. BI Tools sind alle so aufgebaut, dass zuerst die Daten aufbereitet werden. Folgende Reihenfolge bietet sich an:

  • Definition des richtigen Datenformats: Datum wird zu Datum, Zahl zu zahl
  • Entfernen von Doubletten
  • Entscheidungen treffen über fehlende Daten: Ausschließen, erzeugen, oder so codieren, dass sie bei jeder Auswertung auffallen
  • Definition von eindeutigen Daten zur Verknüpfung mit anderen
  • Grenzbetrachtung am Nulldurchgang oder an Zahlengrenzen

Programmierkenntnisse zur Datenaufbereitung

Die am Markt vorhandenen Programme versprechen viel intuitive Vorgehensweise. Dies reicht für einfache Auswertungen, jedoch reicht es bei mehreren zu verknüpfenden Datenquellen mit inkonsistenten Daten nicht aus. Hinter der Analyse stehen Skripte, die bei jeder Datenaktualisierung durchlaufen werden. Die Programmierung erfolgt zunächst menügeführt, Änderungen oder Berechnungen erfordern häufig die Arbeit im Skript. Programmiert wird zum Beispiel mit Python oder M bei PowerBi von Microsoft. Im Weiteren werden Beispiele von PowerBi verwendet, da dies mit der Affinität zu Excel für viele erlernbar ist.

Datenkombination aus verschiedenen Quellen

Daten aus verschiedenen Quellen können an besten verarbeitet werden, wenn sie eindeutig zuordenbare Daten haben. In Unternehmen sind das Auftragsnummern, Artikelnummer, Produktbezeichnungen. Über diese Referenzen werden die einzelnen Datenquellen grafisch interaktiv kombiniert.

Viele Auswertungen habe ein Datum als Basis. In den verschiedenen Datenquellen sind nicht alle Datumseinträge identisch. Deshalb schafft man eine Datumsleiste, auf die die einzelnen Datenquellen referenzieren können. Um alle Datumsfelder aus den Datenquellen abzubilden kann die Datumsleiste großzügig gewählt werden oder Start- und Endtermin aus den frühesten und spätesten Datumseinträgen der Datenquellen berechnet werden. Hört sich schwierig an, ist aber mit Templates aus dem Internet machbar. Vielleicht macht das Bild das Thema verständlicher.

Zuordnung von Datumseinträgen aus verschiedenen Datenquellen zu einer gemeinsamen Zeitleiste

Berechnungen

Zweiter Schritt sind Berechnungen auf Basis der vorhandenen Daten. In den Visualisierungen können nur Daten dargestellt werden, die entweder in den Datenquellen vorhanden oder aufbereitet sind. Es werden klare und eindeutige Kennzahlen benötigt. Hinter den Kennzahlen muss definiert sein, was diese steuern sollen. Die Berechnung erfolgt z.B. mit der aus Excel bekannten Sprache DAX. In Excel müssen die Formeln verknüpft werden, per Drag and Drop vervielfältigt werden. Das ist in BI-Tools nicht notwendig. Spaltenweise werden die Daten berechnet. Die Daten können dann weiter gefiltert werden. Die Datenaufbereitung über Berechnungen in den Tabellen direkt ist nur die zweite Wahl. Entsprechend den Kenntnissen sollten die Daten direkt im Datenimport und der folgenden Programmierung strukturiert und berechnet werden. Das System erkennt dann Abweichungen in den Daten beim Import von neuen aktuellen Datensets, die als Fehler gemeldet werden.

Darstellung

Spätestens seit der Corona-Pandemie kennt jeder die Dashboards, die mit einem BI-Tool wie PowerBi oder Tableau erstellt wurden. Ist die Datenaufbereitung erfolgt und die Berechnungen definiert, ist die Darstellung der Daten über Tabellen oder Grafiken der Teil der Analyse mit dem geringsten Zeitanteil für den Inhalt. Der optische Anspruch bestimmt den Zeitaufwand. Die Darstellung erfolgt mit Tabellen, Matrizen, Grafiken oder Landkarten. Sind die Daten „richtig“ aufbereitet und berechnet, ist die Darstellung für Personen mit unterschiedlicher Fachaffinität meist einfach.

Die Kunst ist, in den ersten zwei Schritten die Daten so aufzubauen, dass die Aussage in Form eines Diagramms oder Tabelle dargestellt werden kann. Hilfreich bei der Aufbereitung sind die Quellen im Internet direkt bei den Anbietern der Systeme, Blogs oder Videos.

Datenvalidierung

Die Aussagen müssen richtig sein! BI-Tools werden verwendet, um Massendaten zu verarbeiten, die aus Systemen wie ERP, CRM, CAQ stammen. Dort gibt es Datenleichen, unvollständige oder falsche Daten. Diese Daten müssen erkannt und richtiggestellt, gefiltert oder gelöscht werden.

Verschiedene Zustände erschweren dies: ERP-Systeme verarbeiten häufig über Nacht Daten. Das bedeutet, dass Daten während des Tages unvollständig sind und über Nacht verändert werden. Batch-Läufe über Nacht bringen die einzelnen Datenbanken erst in den Zustand, dass Daten konsistent sind. Im einem System sind beispielsweise Auftragsdaten vorhanden, im nächsten nicht. Das Modell in einem BI-Tool findet dann die Verknüpfungen zwischen den Daten aus den unterschiedlichen Systemen nicht.

Es gibt in Systemen, die als Quelle dienen, Datenfelder als optionale oder notwendige Eingabe. Datensätze können bei optionalen Eingaben unvollständig sein. Es ist zu prüfen, ob für alle Dateneinträge alle Daten vorhanden sind. Bei fehlenden Daten sind die Aussagen unvollständig und damit die Auswertung fehlerhaft oder verzerrt.

Um zu prüfen ob das Datenmodel auch auf andere Datensätze übertragen werden kann werden zwei verschiedene Datensätze zur Überprüfung der Analyse verwendet. Die Inkonsistenzen müssen untersucht werden. Es sind Entscheidungen notwendig, welche Daten in der Datenaufbereitung gefiltert oder geändert werden müssen.

Die Datenvalidierung ist der zeitintensivste Teil bei der Arbeit mit einem BI-Tool. Daraus ergeben sich oft Änderungen in den ersten zwei Schritten der Datenanalyse.

Bewertung

Mit BI-Tools werden Daten immer wieder nach den ähnlichen Regeln aufbereitet. Diese Regeln zu definieren und zu programmieren erfordert Kenntnisse in Zahlenanalyse, Programmierung und Visualisierung. Häufig kommen auch schon sehr gute Excel-User zu guten Ergebnissen in kurzerer Zeit. Sind die Regeln definiert, können die Ergebnisse immer wieder mit neuen, aktuellen Daten gleich dargestellt werden ohne zusätzlichen Eingriff. Web-Portale ermöglichen die Veröffentlichung unternehmensweit im Intranet oder bei öffentlichen Daten auch im Internet.