Umgang mit Qualitätsproblemen in Ihren kundenbezogenen Daten

Wenn Sie in Ihre Kundendaten eingreifen, um Marketingkampagnen zu erstellen oder zu suchen Für Einblicke in Ihren Kundenstamm werden Sie zwangsläufig mit einer schlechten Datenqualität konfrontiert sein, die manchmal als schmutzige Daten bezeichnet wird. Ihre Kundendatenbank basiert auf Datenfeeds aus verschiedenen Quellen, einschließlich firmeninterner Systeme sowie Datenanbieter von Drittanbietern. Die Daten dieser Systeme unterscheiden sich in Qualität, Frische und Konsistenz.

Namen und Adressen können in verschiedenen Systemen unterschiedlich formatiert werden. Und sie verändern sich im Laufe der Zeit. Deshalb ist es wichtig, sie auf dem Laufenden zu halten.

Diese Art von Datenvariationen ist jedoch nicht auf Kundenkontaktinformationen beschränkt. Ihre Datenbank ist voller potentieller Datenqualitätslandminen. Indem Sie kritisch über die Daten nachdenken, die Sie analysieren, können Sie eine falsche oder irreführende Interpretation Ihrer Kundendaten vermeiden.

Entfernen Sie den (Daten-) Müll

Der ideale Ansatz besteht darin, Ihre Daten gründlich zu analysieren, bevor sie in Ihre Datenbank geladen werden. Auf diese Weise können Sie einige Probleme korrigieren, bevor sie Ihre Analyse durcheinander bringen können. In einigen Fällen müssen Sie möglicherweise Daten aus Ihrer Datenbank ablehnen, wenn diese bestimmte Qualitätsstandards nicht erfüllen.

Sie müssen jedes einzelne Datenelement sorgfältig analysieren. Vergewissern Sie sich, dass es im richtigen Format ist. Überprüfen Sie aber auch, ob jeder Wert sinnvoll ist. Diese Formate und sinnvollen Werte sind für jedes Datenelement unterschiedlich.

Zum Beispiel gibt es eindeutig ein Problem, wenn Sie eine ganze Reihe von Kunden haben, deren Alter als 99 aufgeführt ist. Dies ist wahrscheinlich ein Hinweis darauf, dass das Kundenalter nicht verfügbar war, und 99 war ein Standardwert. das Quellsystem. Solche Dinge passieren häufig bei Kassendaten, die sich auf Alkoholkäufe beziehen. Kassierer sind gezwungen, ein Geburtsdatum einzugeben, um die Transaktion abzuschließen, aber sie stellen die Frage oft nicht einmal. Sie geben einfach einen Standardwert ein.

Alter ist etwas, das Sie verwenden können, um Durchschnittswerte zu ermitteln oder andere Berechnungen durchzuführen. Die Tatsache, dass dieser Standardwert oberflächlich wie ein tatsächliches Alter aussieht, bedeutet, dass er diese Berechnungen vermasseln kann. In diesem Fall ist es eine bessere Idee, den Standardwert durch einen fehlenden Wert oder den Wert null zu ersetzen. Nahezu alle Datenbank-Engines erlauben diese Art von Wert.

Die meisten Reporting-Engines und einige statistische Modellierungstechniken sind sehr geschickt im Umgang mit diesen Nullwerten. Bei einigen statistischen Verfahren müssen Sie jedoch diese fehlenden Werte durch einen Durchschnittswert ersetzen oder die Datensätze vollständig ausschließen.In jedem Fall ist es besser, den Wert zu kennen, als zu vermuten, dass der Wert sinnvoll ist.

Seien Sie vorsichtig bei veralteten Daten

Das Kundenalter ist ein gutes Beispiel für ein anderes Problem, auf das Sie stoßen könnten. Die Zeit läuft weiter, wie das Sprichwort sagt. Wenn Sie vor 5 Jahren einen Kundendatensatz geladen haben, der den Kunden als 35 Jahre alt angezeigt hat, sind diese Informationen nicht mehr korrekt. Ihre erste Neuerung könnte darin bestehen, das Problem zu lösen, indem Sie jedes Jahr einen Prozess zur Aktualisierung der Kundenalter erstellen. Das funktioniert theoretisch, aber in der Praxis kann es ziemlich schwierig werden. Jedes Mal, wenn Sie das Alter aktualisieren, müssen Sie sich ansehen, woher die Daten stammen und wann.

Ein besserer Ansatz besteht darin, die Daten so zu speichern, dass das Problem verschwindet. Sie können das Alter einfach in ein Geburtsjahr konvertieren, wenn Sie den Datensatz zum ersten Mal laden. Sie legen dann ein weiteres Datenelement an, das im Wesentlichen den Wert aktuelles Jahr minus Geburtsjahr enthält. Voilá - keine Wartung notwendig. Das Datenbankmodul weiß immer, welches Jahr es ist, daher muss dieser Alterswert nie aktualisiert werden.

Wenn Sie kritisch über Ihre Daten nachdenken, bevor sie in Ihre Datenbank geladen werden, können Sie viele Datenqualitätsprobleme vermeiden. Aber sei nicht selbstgefällig. Quellsysteme ändern sich mit der Zeit, und diese Änderungen verursachen nachgelagerte Änderungen in der Art und Weise, wie Daten an Ihre Kundendatenbank übergeben werden. Es ist eine gute Idee, Ihre Daten gelegentlich proaktiv zu überprüfen, um nach verdächtigen Daten zu suchen.

Teilen Sie Mit Ihren Freunden
Vorheriger Artikel
Nächster Artikel