Bewertungen im Internet sind kaputt. Sie sind zu einem manipulierbaren und manipulierten Marketinginstrument verkommen, das nur noch selten die Wirklichkeit abbildet. Dabei könnte man es besser machen.

Bewertungen findet man im Internet heute an jeder Straßenecke: Hotelvergleiche fragen nach Übernachtungserfahrungen, in App Stores soll die Qualität von Apps bewertet werden und (News-)Artikel sollen hinsichtlich ihrer Informationsgehaltes oder Unterhaltungswertes benotet werden. Das kennt man.

Diese Bewertungen sind dabei ein wichtiges Marketinginstrument. Es gilt die Faustformel: Je besser eine Bewertung, umso besser ist ein Produkt oder eine Dienstleistung augenscheinlich. Google übernimmt Bewertungen daher in den Suchergebnissen, iTunes leitet App Empfehlungen und Rankings aus Bewertungen ab und Hotels werden dann gebucht, wenn sie besonders gut bewertet sind (PDF).

Das Problem dabei: Bewertungen lassen sich manipulieren, sie werden manipuliert und sie bilden fast nie die Realität ab.

Bestes Beispiel: Das Waldorf Astoria New York hat bei Tripadvisor durchschnittlich 4 Sterne. Erklären lässt sich dieses Video damit nicht.

Ein ähnliches Bild gibt es bei App Store Bewertungen. Sei es im iTunes App Store oder bei Google Play, sie vereinen gleich verschiedene Probleme.

So bildet Google beispielsweise ein arithmetisches Mittel durch alle Bewertungen, die jemals abgegeben wurden und vernachlässigt dabei vollkommen die Entwicklungen und Qualitätsschwankungen, die eine App möglicherweise macht.

Bewertun Facebook Messenger iTunes App Store
Bewertung des Facebook Messengers im iTunes App Store nach einem wichtigen Update. Nutzer_innen sind über die Trennung von Facebook App und Messenger unzufrieden. Aussage über die Qualität des Softwareprodukts: 0. Quelle des Bildes: hothardware.com

Apple macht das anders, aber nicht unbedingt besser: Hier ist nach jedem Update eine App jedes Mal auf’s Neue zu bewerten. Wer seine Nutzer_innen nicht überzeugen oder motivieren kann, das zutun, wird sich möglicherweise entscheiden, die Updatefrequenz zu verlangsamen. Da hilft es wenig, dass iTunes auch einen Mittelwert für vergangene Versionen anzeigt.

Insgesamt erscheint die Art, wie Apps und App Stores um das Feedback von Nutzer_innen bitten, doch sehr hölzern.

Ich kann mich an eine Zeit erinnern, als iTunes nach dem Löschen einer App um Feedback bat; Keine gute Idee, wenn man bedenkt, dass es für die Löschung einer App ziemlich wahrscheinlich einen Grund gab. Heutige Mechanismen sind aber nicht besser: Entweder nervt mich eine App pro Benutzung einmal mit einer alles-unterbrechenden Dialognachricht oder ich kann einen weiteren Teil der App erst dann nutzen, wenn ich den Button zum Bewerten gedrückt habe. Eine richtig kluge Art, Nutzerfeedback abzufragen, habe ich noch nicht gesehen.

Noch schwieriger wird es, wenn sich verschiedene Leistungen eines Produkts oder eine Dienstleistung vermischen. Wenn z. B. die App von H&M oder Amazon richtig schlecht programmiert ist, aber die Leistung des Unternehmens als solches gut: Welcher Teil dieser insgesamt erbrachten Leistung ist dann im App Store zu bewerten?

Ein nicht außer Acht zulassendes Problem ist auch das der Manipulation. Schätzungen gehen davon aus, dass etwa 15% aller Bewertungen auf Reiseportalen und sogar bis zu 30% der Bewertungen von Onlineshops gefälscht sind.

Das gleiche Phänomen gibt es bei den App Stores. Und zwar in beide Richtungen. Denn während viele 5-Sterne-Bewertungen das eigene Produkt nach oben jubeln, kann man den Mitbewerber mit vielen 1-Sterne-Bewertungen auf Distanz halten.

Doch ist das nicht nur unredlich, sondern häufig auch strafbar. Das Vertrauensinstrument Bewertung wird damit in jedem Fall ad absurdum geführt.

Zwar geloben Reiseportale Besserung und machen das Bewerten schwieriger, um Betrüger auszusortieren. Und die App Stores bemühen sich, gefälschte Bewertungen auszusortieren. Die grundlegende Ursache für dieses Problem liegt meines Erachtens aber in etwas ganz anderem begründet: Der Frage, wie Menschen überhaupt zur Abgabe einer Bewertung motiviert werden.

Woher kommt die Motivation?

Denn mit der Frage nach der Motivation lassen sich gleich alle von mir beschriebenen Probleme betrachten.

Wirtschaftswissenschafler und Marketingmenschen kennen das sog. C/D-Paradigma. Es beschreibt, wie bei Menschen nach oder bei der Nutzung eines Produkts oder einer Dienstleistung Zufriedenheit oder Unzufriedenheit entsteht.

Es wird dabei angenommen, dass es vor einem Kauf oder einer Nutzung eine Erwartungshaltung (Soll-Leistung) gibt, die mit der durch Nutzung wahrgenommen Leistung (Ist-Leistung) verglichen wird. Aus diesem Vergleich können drei Zustände entstehen:

  1. negative Nicht-Bestätigung: Ist < Soll
    Die wahrgenommene Leistung ist geringer, als die erwartete. Es stellt sich Unzufriedenheit ein.
  2. Bestätigung, Ist = Soll
    Die wahrgenommene entspricht der erwarteten Leistung. Es stellt sich ein Zustand schwacher Zufriedenheit ein.
  3. positive Nicht-Bestätigung: Ist > Soll
    Die wahrgenommen Leistung ist höher als die erwartete. Es stellt sich eine hohe Zufriedenheit ein.

Diese Zustände lassen sich leicht mit eigener Erfahrung überprüfen: Kann die App das, was versprochen wurde, ist man zufrieden. Ist der Haarschnitt nicht so, wie erwartet, ist man unzufrieden. Ist das Hotel deutlich besser, als angepriesen, ist auch der ganze Urlaub gleich besser.

Dieses sehr vereinfachte Modell zur Entstehung von Kundenzufriedenheit hat im Laufe der Jahre viele Erweiterungen erfahren. Ohne zu sehr ins Detail gehen zu wollen (bei Interesse einmal mit Prospekttheorie und KANO Modell auseinandersetzen): Unzufriedenheit wird in der Regel stärker als Zufriedenheit wahrgenommen.

Für bestehende Mechanismen zur Bewertung von Produkten und Dienstleistungen hat das entscheidende Auswirkungen, wenn man sich der Motivation zur Abgabe einer Bewertung annimmt. Den oben genannten Theorien folgend kann nämlich festgehalten werden: Bei Unzufriedenheit ist eine Bewertung schneller abgegeben, als bei Zufriedenheit.

Das ist ein Problem.

Denn während negative Bewertungen häufig aus einer intrinsischen Motivation (das Produkt ist schlecht, meine Unzufriedenheit lasse ich den Anbieter wissen) heraus abgegeben werden, müssen für positive Erfahrungen häufig erst Reize, bzw. extrinsische Motivationen gesetzt werden. Das können beispielsweise die oben genannten Aufforderungen zur Abgabe einer Bewertung in Apps sein, das können aber auch nervige „after sales“-E-Mails nach einer Hotelübernachtung sein.

Die Lösung kann einfacher sein: Zufriedenheit abfragen

Dabei gäbe es eine einfache Möglichkeit, Bewertungen objektiver zu machen. Nämlich in dem Unternehmen nicht eine Bewertung der erbrachten Leistung einfordern, sondern um die Abgabe der erfahrenen Zufriedenheit bitten.

Die Frage „Wie zufrieden bist du mit unserem Service?“ ist von anderer Qualität als die Frage „Wie viele Sterne auf einer Skala von 1 bis 5 gibst du uns?
Sie ermöglicht einerseits eine echte Reaktion des Unternehmens, in dem es Kundenzufriedenheit oder -unzufriedenheit nicht nur quantitativ, sondern auch qualitativ erfragen und zudem individuell beantworten kann.
An eine tatsächlich erbrachte Leistung geknüpft, würde gleichzeitig den Betrug mit Bewertungen eindämmen können.

Und andererseits wird damit der Mangel behoben, dass Kundinnen und Kunden selbst eine Skalen-Einordnung vornehmen müssen: „Ist eine sehr gute Leistung 4 oder 5 Sterne wert? Und wenn ich unzufrieden bin, gebe ich dann 1 oder 2 Sterne?“ Eine solche Einordnung in Randbereichen ist – so zumindest meine Erfahrung – nur selten möglich: Wer sehr zufrieden ist, gibt 5 Sterne. Wer zufrieden ist, gibt 3 Sterne. Und Unzufriedenheit wird durch 1 Stern ausgedrückt. Begründbare Abweichungen hiervon nehmen nur die Wenigsten vor.

Leider nutzen jedoch nur wenige Bewertungsportale, Internetshops und m. W. kein App Store eine solche Möglichkeit. Und das, obwohl sich im Zweifel ja immer noch ein vereinfachter, gemittelter Wert aus Un-/Zufriedenheitsbekundungen ermitteln ließe.

Dabei macht z. B. discogs.com vor, wie’s gehen kann. Dem oben genannten Beispiel zur Bewertung einer Leistung folgend, erfragt discogs.com erst nach einem Kauf, wie zufrieden man insgesamt war. Ein Daumen nach oben heißt „alles gut“, ein Daumen nach unten signalisiert Probleme. Und wer weder so richtig zufrieden, aber auch nicht unzufrieden ist, der wählt einen indifferenten Daumen. Jede Bewertung kann noch mit einem Kommentar versehen werden, auf der ein Verkäufer reagieren kann.

Aus diesen Bewertungen ermittelt discogs.com dann einen Durchschnittswert, der auch wieder auf einer Skala von 1 bis 5 Sterne basiert.

Freilich ist das System nicht neu. Und es besteht auch keine Trennung hinsichtlich der Zufriedenheit mit Plattform oder Anbieter. Aber die Bewertungen sind – so scheint mir – insgesamt nachvollziehbarer.

Meine Hoffnung ist jedoch, dass sich das in den nächsten Jahren ändert. Das jetzige System ist hoch anfällig und wenig hilfreich.
Meine Hoffnung ist, dass es es in Zukunft häufiger heißt „98% aller Kunden sind mit diesem Hotel zufrieden„, anstatt mich mit 4 1/2 Sternen begnügen zu müssen.

Das setzt dann aber auch echtes Interesse an der Zufriedenheit der eigenen Kundinnen und Kunden voraus.

Bild: Kristian Niemi, Lizenz: CC BY-NC-ND 2.0

Jetzt kommentieren

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.