
Klassifizierung von Einkaufsdaten

Um Einkaufsdaten klassifizieren bzw. kategorisieren zu können, muss in einem ersten Schritt ein entsprechendes Schema definiert werden. Als Basis wird normalerweise der Kategorisierungs-Standard eCl@ss, wahlweise auch UNSPSC verwendet...
Die Schlüsseltechnologie für effiziente Spend- und Preisanalysen
Die Projekterfahrung hat gezeigt, dass die Kategorisierungs-Standards nicht 1:1 verwendet werden sollten. Der Standard eCl@ss umfasst beispielsweise 39.000 Kategorien, von denen nur ein Bruchteil relevant ist. Hinzu kommt, dass Unternehmen ihre Materialien etc. oft nicht unter den Standard-Bezeichnungen oder an einer für sie nachvollziehbaren Stelle im Hierarchiebaum finden.
Hintergrund
Klassifizierung bedeutet in diesem Fall, Einkaufsdaten Klassen oder Kategorien zuzuordnen. Das können z. B. Materialien oder Lieferanten sein. Alle Kategorien können sich dabei auch in Hierarchien einfügen.
Vorgehen
Es gibt unterschiedliche Verfahren zur Klassifizierung bzw. Kategorisierung von Einkaufsdaten. Hier ein Beispiel:
- In einem ersten Schritt werden die notwendigen Kategorien identifiziert - erfahrungsgemäß zwischen 1.000 und 2.000.
- Die Kategorien werden anschließend um individuelle Spezialeinträge ergänzt, sodass ein auf das Unternehmen maßgeschneiderter Warengruppenkatalog entsteht.
- Die Daten aus Rechnungen und Bestellungen werden automatisch den Kategorien zugeordnet.
Klassifzierung im Detail
Ausgangspunkt von Schritt 3 (siehe oben) sind die extrahierten Rechnungsdaten, angereichert um Informationen aus den Bestellungen.
Für die Kategorisierung stehen im Idealfall folgende Attribute zur Verfügung:
- Lieferant
- Sachkonto
- Material
- Materialgruppe
- Bestelltext
- Rechnungstext
Bei indirektem Spend sind oft nur Lieferant und Sachkonto ausgefüllt. Rechnungstexte werden von der Buchführung nur sehr selten eingegeben.
Die Orpheus-Software zur Klassifizierung von Einkaufsdaten verwendet dafür z. B. explizite und implizite Regeln, die auf statistischen Verfahren sowie Methoden der künstlichen Intelligenz basieren.

Explizite Klassifizierung
Eine explizite Regel besteht aus einem Wenn-Teil und einem Dann-Teil, in dem die Klassifizierung bzw. Kategorisierung festgelegt wird. Der Wenn-Teil umfasst entweder nur ein Attribut oder eine Kombination aus mehreren Attributen. Auf diese Weise können bei Bedarf Regeln in einer sehr feinen Granularität erzeugt werden.
Die verfügbaren Informationen in den Rechnungs- und Bestelldaten haben einen unterschiedlichen Wert für die Klassifizierung. Material ist z. B. wesentlich genauer als Lieferant oder Sachkonto. Deshalb ist es wichtig, die Regeln in einer entsprechenden Reihenfolge anzuwenden, um immer die am besten passende Kategorie zuzuweisen.
Die explizit klassifizierten Daten bilden wiederum die Basis für die implizite Klassifizierung.
Implizite Klassifizierung
Hierzu werden alle Texte eines Datensatzes in einzelne Wörter aufgespaltet und diesen die jeweilige Kategorie zugeordnet. Auf diese Weise entsteht eine riesige Matrix aus Wörtern und potenziellen Kategorien.
Unter Verwendung von statistischen Methoden analysiert die implizite Klassifizierung bzw. Kategorisierung erneut alle Datensätze auf Wortübereinstimmungen und errechnet daraus gewichtete Vorschläge für eine Kategorie.
Letzter Schritt
Liegen Vorschläge für die Kategorisierung eines Datensatzes aus expliziter oder impliziter Klassifizierungs-Methode vor, kann ein intelligenter Auswahlprozess entscheiden, welcher Vorschlag genommen wird.
Ist keine eindeutige Entscheidung möglich, kann in wichtigen Fällen auch eine manuelle Kategorie-Zuweisung vorgenommen werden. Durchschnittlich können zwischen 5 und 10% der Datensätze aufgrund unzureichender Daten nicht kategorisiert werden.
Nach dem Kategorisierungslauf kann die Algorithmik mit einem automatischen Lernprozess verbessert werden.
Die Ergebnisse der impliziten Kategorisierung können als Feedback zur Verbesserung des expliziten Regelwerks verwendet werden. Die endgültige Kategorisierung kann wiederum als neue Trainingsstufe für zukünftige implizite Läufe genutzt werden.
Auf diese Weise wird die Kategorisierungsqualität nachhaltig sichergestellt.

Kombination ermöglicht fast voll-automatische Kategorisierung
Auch wenn beide Kategorisierungsverfahren separat angewendet werden können, empfiehlt es sich, beide in Kombination einzusetzen, um ein optimales Ergebnis bei minimalem manuellen Aufwand zu erzielen.

Aus unserer Erfahrung können mit expliziten Regeln 20% der Rechnungen erfasst werden, die aber 80% des Spends ausmachen.
Um die restlichen 80% abzudecken, müsste eine zu große Anzahl feinstgranularer Regeln definiert werden. Dieser Aufwand lohnt sich nicht. Hier kommt die implizite Methode zum Einsatz, mit deren Hilfe wir in der Regel dann einen zu 95% kategorisierten Spend erreichen.
Hinweis: Die Qualität einer reinen expliziten Kategorisierung nimmt über die Zeit ab, wenn das Regelwerk nicht kontinuierlich gepflegt wird.

Der Kategorisierungsgrad nimmt über die Zeit erst schleichend und dann stark ab, bevor er sich auf einem relativ niedrigen Wert einpendelt. Dies liegt an der Tatsache, dass ständig neue Stammdaten hinzukommen, für die kontinuierlich neue Regeln angelegt werden müssen.
Unsere Erfahrung zeigt, dass diese sich zum Glück meist nur unwesentlich von den bisherigen Stammdaten unterscheiden. Wurde z. B. für ein Material ein Lieferant gewechselt, so wird dafür oft ein neuer Stammdatensatz angelegt. Die Bezeichnung stimmt dann stark überein, sie weicht nur in technischen Bezeichnungen ab.
Die explizite Kategorisierung würde diesen neuen Datensatz erst erfassen, wenn eine neue Regel angelegt ist. Die implizite Methode dagegen kann aufgrund von Wortübereinstimmungen sofort die richtige Kategorie zuweisen.
Bei einer kombinierten Anwendung beider Verfahren bleibt der Kategorisierungsgrad selbst bei minimalem Aufwand für die Pflege der Regeln wesentlich länger auf einem sehr hohen Niveau.
Blog durchusuchen
Orpheus Blog
In diesem Blog finden Sie Expertenwissen rund um Maßnahmen-Management und Projektleitung im Strategischen Einkauf. InitiativeTracker ist eine Software zum Planen und Überwachen Ihrer Sourcing-Initiativen, Steuern Ihrer Einkaufsorganisation und Messen Ihrer Einkaufsperformance.
Neueste Beiträge
- Die Kennzahl Materialpreisveränderung (MPV) zur Messung von Einsparungen durch Substitutionen
- Die Kennzahl Materialpreisveränderung zur Planung und Messung von Einsparungen im Einkauf
- Einkaufsstrategien faktenbasiert formulieren und erfolgreich steuern
- Balanced Scorecard, Beschaffungsplanung und Maßnahmenmanagement im Strategischen Einkauf