Ein starkes Team: PIM und KI für die Klassifizierung von Produkten im E-Commerce

Künstliche Intelligenz (KI) im E-Commerce – das ist keine Zukunftsmusik mehr. Im Zusammenspiel mit Product-Information-Management-Systemen (PIM) entfaltet eine KI ihre Stärke insbesondere bei der Klassifizierung verschiedenster Artikel. Worauf es dabei ankommt, zeigen die sechs Tipps von Adrian Gasch, Manager PIM Technical Solutions bei Arvato Systems, einem Subunternehmen des Bertelsmann Konzerns.

1. Tipp: Vertrauen Sie auf die Macht der Bilder.

Ein Bild sagt mehr als tausend Worte. Methoden der KI-basierten und damit automatisierten Bilderkennung haben im E-Commerce großes Potenzial. Denn bei einem gut fotografierten Bild ist nicht nur sofort ersichtlich, ob es sich um Fashion-Artikel, um Konsumgüter oder um industrielle Produkte handelt. Erkennbar ist zudem das Farbprofil der Artikel. Auch über solche Anwendungsfälle hinaus sind KI-basierte neuronale Netze in der Lage, zwischen Artikeln derselben Warengruppe zu unterscheiden.

2. Tipp: Trainieren Sie die KI.

Mit dem richtigen Training liefert ein neuronales Netz treffsichere Ergebnisse (Deep Learning). Hierfür müssen Sie ihm zunächst beibringen, Artikel eigenständig zu klassifizieren. Als Übungsmaterial dient eine Vielzahl an Produktbildern, die in Ihrem PIM-System gespeichert und mit aussagekräftigen Metadaten versehen sind (Big Data). Richtig trainiert, erkennt das KI-basierte System zum Beispiel ein Kleidungsstück oder eine Maschine, selbst wenn sie verdreht, teilweise verdeckt oder in ungünstigen Lichtverhältnissen aufgenommen wurde. Damit entlastet es Sie von zeitaufwendigen repetitiven Aufgaben.

3. Tipp: Legen Sie verschiedene Komplexitätsstufen fest.

Für das Training der KI sollten Sie verschiedene Komplexitätsstufen festlegen:

  • 1. Art des Artikels
  • 2. Farbe des Artikels
  • 3. Marke des Artikels
  • 4. Größe des Artikels
  • 5. Auffälligkeiten (z. B. Muster)
  • 6. Material des Artikels

Dabei sollten Sie beachten: Auf den ersten beiden Stufen liefert eine KI sehr überzeugende Ergebnisse. Ab Stufe drei, spätestens vier stößt ein neuronales Netz momentan noch an seine Grenzen. Sofern die Formgebung eindeutig oder ein Logo erkennbar ist, kann es Marken unterscheiden und Fälschungen erkennen. So können Markenrechtsverletzungen wirksam vorgebeugt werden. Um einen Artikel noch weitergehend zu klassifizieren, ist die Bildqualität häufig nicht ausreichend. Auch braucht eine KI für derart komplexe Aufgaben sehr viel Training.

4. Tipp: Definieren Sie Schwellenwerte für die Bilderkennung.

Dank ihrer herausragenden Fähigkeiten beim Abstrahieren und Klassifizieren können künstliche neuronale Netze Bilder in Millisekunden auswerten und Produkte in Echtzeit kategorisieren – unabhängig von Lichtverhältnissen, Blickwinkel und Hintergrund. Dabei müssen sie nicht hundertprozentig mit dem Referenzobjekt übereinstimmen. Es genügt eine ausreichend hohe Wahrscheinlichkeit. Darum sollten Sie die Schwellenwerte mit Bedacht festlegen: Die KI erkennt einen Artikel als eben diesen, wenn ein vorab definierter Schwellenwert erreicht ist, zum Beispiel „90 Prozent Übereinstimmung mit dem Referenzobjekt“. Ist eine eindeutige Klassifizierung nicht möglich, können Sie aus automatisch generierten Vorschlägen das passende Produkt manuell auswählen.

5. Tipp: Kontrollieren Sie die Ergebnisse.

Insbesondere zu Beginn der Trainingsphase ist kontinuierlich zu überprüfen, ob die KI die gewünschten Ergebnisse liefert. Ist das der Fall, können Sie mit dem KI-basierten System arbeiten. Ein Bild fließt ins PIM-System, wo die KI den abgebildeten Artikel automatisch klassifiziert und mit Wahrscheinlichkeiten versieht: Beispielsweise zeigt das Foto zu 95 Prozent einen Schuh oder ein Haushaltsgerät, zu 100 Prozent seitlich. In solch eindeutigen Fällen ist es ratsam die vorgeschlagene Klassifizierung samt passenden Schlagwörtern (Tags) zu übernehmen und das Produktbild im PIM-System abzulegen. Ebenso können Sie festlegen, dass jenes Produktfoto automatisch als erstes Bild im Online-Shop erscheint. Ohne die manuelle Auswahl kann es passieren, dass das System ein weniger aussagekräftiges Bild, etwa die Sohle eines Schuhs oder die Rückseite eines Geräts, auswählt. Um das zu vermeiden, ist es essenziell die Reihenfolge der Produktbilder selbst zu bestimmen.

Falls das System keine ausreichend große Übereinstimmung erkennt – etwa, wenn die Wahrscheinlichkeit unterhalb eines zuvor festgelegten Schwellenwerts von 80 Prozent Übereinstimmung mit dem Referenzobjekt liegt –, sind Sie gut beraten, die Vorklassifizierung zu überprüfen und die vorgeschlagenen Tags anzupassen.

6. Tipp: Wählen Sie den richtigen Dienstleister.

Die Technologie hat das Potenzial, manuelle Prozesse in der Produktdatenpflege zu einem hohen Grad zu automatisieren – sofern die Metadaten im PIM-System gepflegt sind, denn nur so kann eine optimale Grundlage für aussagekräftige Tags gebildet werden. Diese sind wiederum für das Training der KI unentbehrlich. Damit eine KI ihre Arbeit erledigen kann macht es Sinn einen kompetenten Dienstleister ins Boot zu holen, der Use Cases auf ihre Machbarkeit hin überprüft und technologische Grenzen aufzeigt. Zudem analysiert er, ob die benötigten Metadaten im PIM-System verfügbar sind und wie ein bestimmter Anwendungsfall zu designen ist. Nicht zuletzt zählt das Trainieren des neuronalen Netzes zu seinen Aufgaben. Aufgrund seines großen Verständnisses für Daten und Schnittstellen ist ein solcher Dienstleister in der Lage, Vorhaben im Bereich der KI-gestützten Bilderkennung auf professionelle Art und Wiese zum Erfolg zu führen.

Autorenprofil

Als Manager PIM Technical Solutions leitet Adrian Gasch das Team Softwareentwicklung im Bereich Product Experience Management bei Arvato Systems. Er ist seit rund 20 Jahren bei Arvato Systems beziehungsweise im Bertelsmann Konzern beschäftigt. Seine fachlichen Schwerpunkte liegen im Bereich Product Information Management sowie dem damit zusammenhängenden Cloud-Ökosystem, darunter Machine Learning und DevOps.

Kommentar verfassen