So überprüfen Sie Ihre Datenpolitik

Wir sind uns der (problematischen) Datenpolitik sehr bewusst, wenn wir an große datengetriebene Unternehmen wie Facebook oder Google denken oder an zwielichtige Datenbroker, die außerhalb unseres Sichtfelds tätig sind. Aber Data Science ist für ein weitaus breiteres Spektrum von Unternehmen zu einer gängigen Geschäftspraxis geworden als für einige ausgewählte Technologie-Giganten.

Welche Politik von welchen Daten?

Wir verarbeiten Kundendaten, Benutzerdaten, soziale Daten, Finanzdaten, Forschungsdaten und viele andere Arten von Daten, große oder kleine. Ich denke an jede Art von Daten, mit denen wir im Rahmen unserer Geschäftstätigkeit unsere Algorithmen sammeln, aufzeichnen, erfassen, speichern, verarbeiten, analysieren oder füttern. Als Faustregel gilt: Je mehr Menschen von den fraglichen Daten betroffen sind, desto wichtiger wird es, die Politik dieser Daten sorgfältig zu überdenken. Datenpolitik ist nicht auf das beschränkt, was wir als "Big Data" betrachten, sondern gilt für alle Daten.

In der Datenpolitik geht es um Macht und Wissen, um alte Machtverhältnisse, die dazu beitragen, wie Daten erzeugt, gesammelt und genutzt werden, und um neue Machtverhältnisse, die Daten erzeugen können.

Beginnen Sie, indem Sie sich ein paar Fragen stellen.

Fragen Sie, was und wer in den Daten vertreten ist?

Wer ist in der Lage, Daten zu erheben und zu verarbeiten?

Wie wurde es gesammelt?

Wer stellt die Fragen, für deren Beantwortung die Daten verwendet werden?

Welche anderen Fragen bleiben unbeantwortet?

Welche Regionen werden von den Daten abgedeckt und warum?

Was sind seine potenziellen toten Winkel?

Wurden Ihre Daten "bereinigt"? Wie und von wem?

Was wurde weggeräumt und warum?

Was oder wer ist dadurch nicht in den Daten?

Wie können sich die Antworten auf diese Fragen auf Ihre Ergebnisse, Ihren Service und Ihr Produkt auswirken?

Denken Sie bei der Beantwortung dieser Fragen an Geschlecht, Rasse, Sexualität, Behinderung und andere Merkmale der Vielfalt, die für Ihren Kontext relevant sein könnten. Wie umfassend sind Ihre Daten? Wie unterschiedlich sind die Teams, die Ihre Daten erstellen und damit arbeiten?

Wie objektiv können Daten sein?

Angesichts der Tatsache, dass „gefälschte Nachrichten“ an der Spitze hitziger öffentlicher Debatten stehen, ist es riskant, vor Objektivität und Neutralität zu warnen. Es ist wichtig, Fakten zu überprüfen, Fehlinformationen abzurufen und nicht durch Daten irrezuführen. Ein evidenzbasierter Ansatz und die Verwendung von Daten zur Untermauerung eines Arguments sind aus dieser Sicht sowohl notwendig als auch lobenswert.

Es ist jedoch zu bedenken, dass unser heutiges Verständnis von Objektivität historisch auf ganz bestimmten Sichtweisen auf die Welt beruht. Ihre lange Geschichte geht auf das europäische Aufklärungsdenken und die wissenschaftliche Revolution zurück. Zwei historische Entwicklungen, die den Aufstieg zum universellen Kanon zum Ziel hatten, was eine relativ kleine Anzahl weißer europäischer Wissenschaftler und Philosophen dachte. Dabei gewannen die wissenschaftliche Methode, die Messbarkeit und die Datenerhebung an Bedeutung, oft im Dienst der institutionellen Ordnung der Zeit. Und das wiederum diente oft einer kolonialistischen, rassistischen und von Männern dominierten Weltanschauung. Wie wir Fakten und Daten heute bewerten (und bewerten), ist nicht von dieser Geschichte getrennt.

Unsere Tendenz, Daten vor anderen Beweismitteln zu bewerten, deutet auch auf einen allgegenwärtigen Mythos hin: Diese Daten (je größer, desto besser) sind irgendwie genauer und objektiver und daher weniger diskriminierend als andere Arten von Wissen. Was vermittelt mehr „gültiges“ Wissen, einen großen Datensatz, der einer Inferenzstatistik oder einer algorithmischen Analyse unterzogen werden kann, oder einen detaillierten persönlichen Bericht darüber, wie jemand beispielsweise Diskriminierung am Arbeitsplatz erlebt hat? Wenn wir unsere Datenpolitik überprüfen, können wir beide als gleichermaßen gültig betrachten, um zu unserem Verständnis einer Situation beizutragen, anstatt Daten als objektive Wahrheit und eine persönliche Geschichte als subjektives Beispiel zu behandeln.

Objektivität, wie wir sie kennen, ist ein Konzept mit Gepäck und Daten sind niemals nur ein neutraler Schatz an Informationen. Infolgedessen sind datengetriebene Erkenntnisse und Entscheidungen immer nur so gut wie unser Verständnis der Politik hinter den Daten, auf denen sie basieren.

Lernen, mit (einigen) Vorurteilen zu leben

Bowkers Worte, dass "Rohdaten ein Oxymoron sind und mit Sorgfalt zubereitet werden sollten", wurden in Debatten über Big Data häufig aufgegriffen, gelten jedoch auch für kleinere Datensätze, die wir in unserer täglichen Arbeit verwenden könnten. "Cooking" -Daten in dieser Metapher beziehen sich darauf, wie alle Daten von jemandem gesammelt werden, einige Datensätze einschließen, andere ausschließen, irgendwo (und von jemandem) gespeichert und verarbeitet werden, von jemandem analysiert und interpretiert werden usw. Wie und zu welchem ​​Zweck Daten erstellt, gesammelt und verwendet werden, ist nicht nur eine Tendenz, die wir versuchen (und scheitern) können, um nur einen Teil der Daten an und für sich zu entfernen.

Daten werden von Menschen erstellt und gesammelt, genau wie die Tools und Methoden, mit denen sie analysiert werden. Die Fragen, auf die die Daten antworten sollen, werden auch von Personen gestellt, und nicht alle Personen würden die gleichen Fragen stellen. Menschen und ihre sozialen Kontexte sind mit allen Arten von Verzerrungen behaftet, und diese Verzerrungen wirken sich auch auf ihre Datenpraktiken aus.

Nichts davon bedeutet, dass wir unsere Entscheidungen nicht auf Daten stützen oder auf Daten zurückgreifen sollten, um komplexe Probleme besser zu verstehen. Wir müssen uns jedoch daran erinnern, dass Daten niemals neutral sind, sondern sich in bestimmten Kontexten und Schöpfungsgeschichten befinden, und dass (die meisten) Daten entgegen der landläufigen Meinung voreingenommen sind. Mit anderen Worten, wir müssen lernen, mit (einigen) Vorurteilen zu leben, anstatt sie als den Feind der Objektivität zu betrachten, der um jeden Preis beseitigt werden muss.

Stattdessen sollten wir alles tun, um uns dessen bewusst zu werden, es anzuerkennen und unsere Arbeit entsprechend zu qualifizieren. Wenn Sie dies bei jedem Schritt tun, können Sie einige der oben aufgeführten Fragen beantworten. Die Beantwortung dieser Fragen hilft wiederum dabei, die Vorurteile zu erkennen und dagegen vorzugehen, mit denen wir nicht leben können, beispielsweise rassistische und sexistische Vorurteile.

Gesichtserkennungstechnologie, die keine weißen Gesichter erkennt, oder saugende Milchpumpen (mehr als nur buchstäblich) sind nur zwei herausragende Beispiele dafür, was schief gehen kann, wenn sie ignoriert werden.

So überprüfen Sie Ihre Datenpolitik

Die Einhaltung der DSGVO und anderer Datenschutzgesetze kann uns nicht davon abhalten, unsere Datenpraktiken kritisch zu hinterfragen und herauszufinden, wie sich ihre Ergebnisse auf verschiedene Personengruppen unterschiedlich auswirken können.

Wenn Sie die folgenden Hinweise berücksichtigen und (falls erforderlich) einhalten, können Sie Ihre Daten in einen Kontext stellen und Ihre Datenpraktiken inklusiver gestalten.

Lassen Sie Daten nicht für sich selbst sprechen - sie können es nicht

Der Kontext ist der Schlüssel. Daten können Sie nicht in die Lage versetzen, „alles aus dem Nichts zu sehen“. Daten sind Geschichtenerzählen, Sie erzählen Geschichten mit Daten, und diese Geschichten beinhalten die (Hi) Geschichte der Datenerstellung / -kuration und -verarbeitung. Daten liegen und haben immer einen Standpunkt.

Untersuchen Sie die Machtverhältnisse hinter den Daten

Die Verteilung, wer Daten über wen sammelt / analysiert, wer Zugriff auf Daten hat und auf die Ergebnisse Ihrer Analyse, ist nicht neutral. Stellen Sie sicher, dass Ihre Daten (und die Datenverarbeiter) für die Population repräsentativ sind, für die Sie Produkte recherchieren oder herstellen.

Prozess bestätigen

Machen Sie in diesem Zusammenhang die Arbeit, die sich hinter den Kulissen abspielt, deutlich und sichtbar. Bestätigen Sie die Zusammenarbeit und Teilnahme, und zeigen Sie, wie (und von wem) Daten kuratiert, bereinigt, verarbeitet und analysiert wurden.

Umfassen Sie die Einschränkungen Ihrer Daten

Machen Sie auch die Einschränkungen Ihrer Daten explizit oder sichtbar. Überlegen Sie, was Macken, Ausreißer, „Lärm“ und fehlende Daten über blinde Flecken und mögliche Diskriminierungen aussagen können. Überlegen Sie, was Ihre Daten nicht aussagen und welche Geschichten sie daher nicht erzählen können.

Akzeptieren Sie die Einwilligung, die über das Ankreuzen gesetzlicher Kästchen hinausgeht

Verstecken Sie sich nicht hinter undurchsichtigen Richtliniendokumenten, die niemand liest, und verwechseln Sie nicht die Anonymisierung von Daten oder die Verwendung von öffentlich zugänglichen Daten mit der Zustimmung zu deren Verwendung. Welche Beweise haben Sie dafür, dass die in den Daten dargestellten Personen mit Ihrer besonderen Verwendung dieser Daten einverstanden sind?

Daten schützen, Privatsphäre schützen

Wie sensibel sind Ihre Daten und wie schützen Sie sie? Gehen Sie nicht davon aus, dass alle Daten außerhalb der gesetzlich festgelegten Kategorien geschützter Daten nicht sensibel genug sind, um Schaden zu verursachen oder Diskriminierung zu verursachen. Auch hier ist der Kontext von zentraler Bedeutung und nicht alle Datenpraktiken wirken sich auf alle Personengruppen gleichermaßen aus.

Alle Bilder #WOCinTech Chat (CC-BY 2.0).

________________________________________

Nicole Shephard ist eine unabhängige Forscherin, Beraterin und freiberufliche Autorin, die einen Doktortitel in Gender Studies mit einem Jahrzehnt Erfahrung in den Bereichen Technik und Personalwesen kombiniert. Sie schreibt über die geschlechtsspezifische Politik von Daten und Technologien sowie über Vielfalt und Inklusion am Arbeitsplatz.

Twitter: @kilolo_