Data Dictionary: Vorgehensweisen und Best Practices

Ein Datenwörterbuch ist eine Liste von Schlüsselbegriffen und Metriken mit Definitionen, ein Geschäftsglossar. Während es einfach, fast trivial klingt, kann seine Fähigkeit, das Geschäft auszurichten und Verwirrung zu beseitigen, tiefgreifend sein. Tatsächlich ist ein Datenwörterbuch möglicherweise eines der wertvollsten Artefakte, die ein Datenteam für das Unternehmen bereitstellen kann.

Die meisten Unternehmen haben mindestens ein Konzept, einen Begriff oder eine Metrik, die von Team zu Team unterschiedlich verwendet oder interpretiert werden. Wenn dies geschieht, herrscht Verwirrung. Entscheidungsträger sind sich möglicherweise nicht einig, was die Daten anzeigen und welche Maßnahmen sie ergreifen sollen. In Berichten zwischen Teams werden aufgrund inkonsistenter Geschäftslogik möglicherweise unterschiedliche Zahlen für dieselbe Metrik aus derselben Datenquelle angezeigt. Teams können sich sogar über die richtige Definition streiten und ihren Rasen verteidigen, vielleicht weil ihre Zahlen durch ihre Definition besser aussehen. Das ist nicht gut fürs Geschäft.

Sobald Sie ein Datenwörterbuch haben, ist es ein Dokument, auf das alle Mitarbeiter verweisen können und auf der gleichen Seite sind. Dies erleichtert die Einarbeitung neuer Mitarbeiter, und das Business Intelligence-Team (BI) hat kristallklare Anforderungen für die Implementierung dieser Metriken.

Aus Gründen der Klarheit wird hier nicht die Dokumentation einer unformatierten Datenbanktabelle in Betracht gezogen, obwohl dies ebenfalls wichtig ist, sondern eine übergeordnete Liste von Geschäftsbegriffen und Metriken. Wie denkt das gesamte Unternehmen über "Benutzer", "Umsatz" oder "Anschaffungskosten"? Hat jeder das gleiche Verständnis oder "Verkaufsgebiet", "durchschnittliche Schiffszeit" oder "Sitzung"? Das Ziel sollte sein, dass ein junger, nicht technischer Mitarbeiter wie ein Kundendienstmitarbeiter in der Lage ist, den Abschnitt für seinen Teil des Geschäfts zu lesen und die relevanten Begriffe zu verstehen, aber ausreichend detailliert und genau, um die Geschäftslogik zu erfassen dieser Metriken.

In diesem Beitrag werde ich einige bewährte Methoden im Zusammenhang mit Datenwörterbüchern und einen Prozess zum Erstellen von Wörterbüchern beschreiben. Dies ist keineswegs der einzige Prozess, der funktionieren wird, aber er hat zumindest für mich funktioniert. Hier gehe ich davon aus, dass das BI-Team diesen Prozess vorantreibt. Meiner Ansicht nach sollten sie Eigentümer des Datenwörterbuchs und der Implementierung von Metriken in BI-Tools sein.

1. Begriffe sammeln

Der erste Schritt besteht darin, eine Liste von Begriffen zu erstellen. Das heißt, das BI-Team sollte eine Tabelle mit einer Liste der Namen der Geschäftskonzepte und -metriken (Kennzahlen) und der Art und Weise erstellen, in der Daten aufgeschnitten und aufgeschnitten werden (Dimensionen). Während dies entmutigend klingt, besteht ein Ansatz darin, ein Geschäftsteam für ein Geschäftsteam zusammenzustellen und eine Stichprobe aller ihrer Standardberichte und Dashboards zu untersuchen. Listen Sie alle Achsenbeschriftungen aus Diagrammen, Spaltenüberschriften aus Berichtstabellen und die Dimensionen der Datenausrichtung auf. Ein Bericht, in dem die Einnahmen nach Gebieten (für einen bestimmten Zeitraum) aufgeführt sind, liefert daher zwei Schlüsselbegriffe: "Einnahmen" und "Gebiet". In dieser Phase erstellen Sie lediglich eine Liste von Termnamen, nicht deren Definitionen.

Die Ausgabe ist eine Liste mit Teamnamen, Termnamen, Datentyp, einem oder zwei Beispielwerten und möglicherweise einem Link zu einem Beispielbericht, der diesen Term verwendet. Zusätzliche Spalten, die hinzugefügt werden können, sind eine Spalte, in der angegeben wird, ob es sich um eine Dimension oder eine Kennzahl handelt (bei Dimensionen besteht im Allgemeinen eine größere Übereinstimmung als bei Kennzahlen), und eine Spalte, in der die Quelle der Wahrheit angegeben wird.

Schritt 1: Eine Liste von Begriffen ohne Definitionen

Organisieren und gruppieren Sie die Liste nach Geschäftsfunktionen, z. B. Finanzkennzahlen, Marketingkennzahlen, Kundendienstkennzahlen usw. Möglicherweise möchten Sie auch allgemeine Dimensionen aufteilen ("Jahr", "Produkt-ID", "Land" usw.), die sich über viele Bereiche erstrecken Teams zu ihrer eigenen Sektion.

Die Liste ist wahrscheinlich nicht so lang wie erwartet. Dies liegt daran, dass Teams in der Regel über relativ wenige Kennzahlen verfügen, die sie mit relativ wenigen Hebeln nachverfolgen und optimieren möchten. Beispielsweise konzentriert sich das Online-Marketing möglicherweise auf einige wichtige Aspekte wie Kampagne, Kanal, ausgeben und segmentieren.

Bitten Sie das Business-Team, einen Blick auf die Liste zu werfen, insbesondere auf deren Abschnitt, und fehlende Begriffe hinzuzufügen. Wenn sie über eine solide Sammlung von Dashboards und Berichten verfügen, verfügen Sie wahrscheinlich über eine umfassende Liste. Ist dies nicht der Fall, werden zusätzliche Konzepte bereitgestellt, deren Erfassung wertvoll ist.

2. Begriffe definieren

Das BI-Team sollte nun einen ersten Versuch unternehmen, Definitionen zu sammeln oder zu erstellen.

Ziehen Sie zunächst alle Definitionen aus einer vorhandenen Dokumentation. Dies kann aus einem Wiki, Jahresberichten oder aus tatsächlichem Code wie SQL-Abfragen oder Excel-Makros stammen. Definitionen sollten klar und eindeutig sein. Wenn es klarer ist, eine einfache Formel (wie z. B. ARPU = total_revenue / number_subscribers) anzuzeigen, als eine Definition zu schreiben, zeigen Sie dies. Die meisten Mitarbeiter sollten in der Lage sein, die Definition zu verstehen, auch wenn sie auf einige Begriffe verweisen müssen.

Zweitens setzen Sie sich nacheinander mit den Teams zusammen und bitten Sie sie um Hilfe, um fehlende Definitionen festzulegen oder die Definitionen zu verfeinern. (Sie erzielen bessere Fortschritte, wenn Sie mit einer Definition beginnen, auch wenn diese falsch ist, als mit einer leeren Zelle.) Dies kann ein Hin und Her erfordern, bis Sie innerhalb dieses Teams eine Einigung erzielen. Möglicherweise müssen Sie auch nachforschen, wie eine Metrik derzeit berechnet wird.

Fragen Sie nicht "Was ist die aktuelle Definition?", Sondern "Wie sollte diese definiert werden?". Wenn die aktuelle Implementierung nicht die ideale Definition ist, ist dies die perfekte Gelegenheit für das Business-Team, ihren Idealzustand darzulegen. Dies ist beispielsweise eine Gelegenheit zur Vereinfachung, wenn Sie eine zu komplexe Definition geerbt haben. Sobald diese ideale Definition erfasst ist, besteht für das Datenteam, das Technologieteam oder andere Teile des Unternehmens ein zusätzlicher Druck, die definierte Metrik umzusetzen.

3. Identifizieren Sie Konflikte

Dies ist ein wichtiger Schritt: Beseitigen Sie alle Begriffe, deren Definition in den einzelnen Teams unterschiedlich ist.

4. Holen Sie sich die Ausrichtung

Bringen Sie für die Begriffe, die zwischen den Teams unterschiedlich sind, die entsprechenden Teams in denselben Raum (und schließen Sie die Tür ab). Lassen Sie sie diskutieren, wie und warum sie sich unterscheiden.

Für dieses Treffen sollte es eine Einigung mit nur 2 Ergebnissen geben:

* Ein Team erklärt sich damit einverstanden, die Definition des anderen Teams zu übernehmen.

* Sie haben berechtigte Gründe, warum sie sich unterscheiden. In diesem Fall vereinbaren Sie einen neuen Namen für einen oder beide Begriffe.

(Eine dritte Option, bei der beide Teams vereinbaren, ihre Definition in eine gemeinsame Definition umzuwandeln, ist möglich, aber weniger wahrscheinlich.)

Namen sollten so lang wie nötig sein, um Mehrdeutigkeiten oder Verwirrung zu vermeiden. Wenn „community_adjusted_editba“ ein passenderer und passenderer Begriff ist, der es von regulärem „ebitda“ unterscheidet, verwenden Sie diesen längeren, aussagekräftigeren Begriff. Das Ziel ist es, Verwirrung zu beseitigen, um nicht knapp zu werden.

5. Holen Sie sich abmelden

Lassen Sie die Teamleiter abmelden. Das ist entscheidend. Sie möchten nicht, dass das BI-Team einen Begriff definiert und das Business-Team dies heimlich ablehnt. In diesem Fall wird das Unternehmen einfach eine eigene Logik in Excel implementieren, und Sie kehren zum ersten Schritt zurück. Als Domain-Experten und als Personen, die auf der Grundlage dieser Kennzahlen Geschäftsentscheidungen treffen, müssen diese Geschäftsinhaber voll an Bord sein.

Bei Warby Parker haben wir die Hilfe der Co-CEOs genutzt, um zu fordern, dass sich die Teamleiter abmelden und dies bis zu einem bestimmten Datum tun. Die Teamleiter sind beschäftigt und ein Datenwörterbuch scheint nicht die höchste Priorität zu haben, auch wenn sie den Wert sehen können. Daher hat sich diese Unterstützung von oben nach unten als sehr wertvoll erwiesen.

6. Veröffentlichen

Veröffentlichen Sie das Datenwörterbuch als einseitiges Dokument, auf das das gesamte Unternehmen zugreifen kann - also nicht nur in einem BI-Tool. Diese Definitionen sollten nicht nur von Führungskräften, Analysten und Entscheidungsträgern, sondern von allen Mitarbeitern umfassend verstanden und übernommen werden. Daher ist die Sichtbarkeit von entscheidender Bedeutung. Wenn das Unternehmen ein Wiki stark nutzt, veröffentlichen sie dort. Es sollte dort sein, wo die Leute es erwarten.

Diese Begriffe sind konzeptionell unabhängig von einem einzelnen System oder einer Datenquelle und daher nicht an ein BI-Tool gebunden. Die einzelnen Definitionen sollten jedoch nach Möglichkeit auch in die BI-Tools eingebunden werden. Wenn das Tool dies unterstützt und Sie mit der Maus über eine Dimension oder Kennzahl fahren, sollten die Definition und das Beispiel angezeigt werden.

Angesichts der Tatsache, dass diese Definitionen an mehreren Stellen auftreten können, sollte das Datenteam versuchen, das Datenwörterbuch automatisch aus einer einzigen Quelle wie einer Datenbanktabelle oder einem Code-Repository zu generieren, anstatt eine statische Tabelle manuell zu verwalten. Beispielsweise wurde bei Warby Parker unser Datenwörterbuch aus einem Jenkins-Auftrag generiert. Wenn das Repository geändert wurde, wurde unsere Dokumentation neu generiert (eine dedizierte interne Website oder ein „Datenbuch“ für die gesamte Datendokumentation).

7. Pflegen

Während wichtige Metriken relativ stabil sein sollten, kann es legitime geschäftliche Gründe geben, warum sich die Definition einer Metrik ändern muss. Diese Änderung und neue Definition sollte vom Geschäftsteam kommen. Es ist jedoch die Hilfe des Datenteams erforderlich, um die Änderung zu implementieren und zu kommunizieren.

Das BI-Team sollte die Auswirkungen der Änderung bewerten, bevor sie eingeführt wird. Erstellen Sie beispielsweise ein Diagramm, in dem die Metrik mit der alten und der neuen Definition der Metrik dargestellt wird, um die Erwartungen hinsichtlich der möglichen Änderung der Zahlen festzulegen.

Behandeln Sie diese Definitionsänderung wie eine Produktversion: Kommunizieren Sie die Definitionsänderung im Voraus, teilen Sie den Mitarbeitern mit, was sie zu erwarten haben, und dokumentieren Sie die Änderung im Datenwörterbuch, z. B. mit einem Änderungsprotokoll am Ende des Dokuments.

Lassen Sie nicht zu, dass verschiedene Systeme nicht mehr synchron sind. Daher ist die automatische Generierung von Dokumentation von großem Wert.

Das Erstellen eines Datenwörterbuchs nach dem oben beschriebenen Verfahren ist kein geringer Aufwand. Es wird wahrscheinlich einige Monate dauern, da Gespräche und Koordination zwischen vielen Mitarbeitern erforderlich sind. Es handelt sich um eine große Teamleistung, die vom BI-Team gesteuert und koordiniert wird, die jedoch ein umfassendes Buy-In, eine umfassende Zusammenarbeit und Anstrengungen sowie eine gewisse Verstärkung von oben nach unten erfordert.

Ich schlage nicht vor, den Prozess stückweise einzunehmen. Erstellen Sie beispielsweise kein vollständig gebackenes Marketing-Datenwörterbuch mit der Erwartung, dass Sie das Datenwörterbuch zu einem späteren Zeitpunkt finanzieren können. Dadurch wird es schwieriger, zu den Ausrichtungsdiskussionen (Schritt 4) zwischen den Teams zu gelangen, und hier erfolgt die eigentliche Auszahlung. Außerdem ist es aufgrund der Abfolge einfacher, Dampf zu verlieren. Sie benötigen die gleichzeitigen Diskussionen zwischen Teams mit einem gemeinsamen Abmeldetermin, um das Ziel zu erreichen.