BLOG
July 3rd 2026

Herberts Welt #22

Wir präsentieren die Ausgabe No. 22 der Mafo.de-Kolumne "Herberts Welt"!
Unser CEO Herbert Höckel spricht über die Relevanz von Primärdaten, die Zukunft der Online-Panels und warum es unbedingt "AI in the Loop" statt "Human in the Loop" heißen muss. Viel Spaß beim Lesen!

Herberts Welt:
Primärdaten in Zeiten von KI - Gold oder Staub? Über den schwindenden Wert von Primärdaten in Zeiten synthetischer Daten und Künstlicher Intelligenz

Ich muss euch - liebe Leser - etwas gestehen. Während ich kürzlich für den ESOMAR Community Circle Belgien meinen Vortrag über KI in der Marktforschung vorbereitet habe, saß ich vor einem Paradoxon, das mich seither nicht mehr loslässt. Es ist eines dieser unbequemen Probleme, die man nicht ungesehen machen kann, obwohl man am liebsten wegschauen würde.

Aber als Branche können wir uns das nicht leisten. Hier der besagte Widerspruch kurz und knapp:

Primärdaten sind heute wertvoller denn je zuvor.

Ihr wahrgenommener Wert sinkt gerade ins Bodenlose.

Beide Sätze sind gleichzeitig wahr - und darin begründet liegt mein Problem.

Der eigentliche Wert von Primärdaten steigt

Warum sind Primärdaten kostbarer geworden? Weil im Vergleich dazu alle anderen Daten fragwürdiger geworden sind. Je mehr synthetischer Output, generierte Personas und KI-Simulationen die Cloud fluten, desto strahlender wird das Original. Wenn jeder behaupten kann, Konsumentenantworten zu liefern - ohne je einen echten Konsumenten gefragt zu haben - dann ist die Tatsache, dass man wirklich gefragt hat, plötzlich ein Alleinstellungsmerkmal.

Jon Puleston, Chief Methodologist bei Ipsos, hat das in seinem Theorem über synthetisches Sample-Boosting präziser formuliert, als ich es je könnte: Wenn du eine Teilgruppe künstlich aufblähst und dabei davon ausgehst, mögliche Abweichungen vom Gros sei nur statistisches Rauschen, dann hast du gerade vielleicht den interessantesten Insight der ganzen Studie weg-gebügelt. Das Schrödinger-Katzen-Dilemma des Forschers sozusagen.

Echte Daten öffnen die Box und ermöglichen den Blick hinein! Lebt die Katze nun oder ist sie doch schon tot? Synthetische Daten simulieren dagegen nur, wie die echten aussehen könnten, öffnen aber die Box nicht. Das ist kein kleiner Unterschied, das ist der Unterschied zwischen Wissen und Glauben.

Bildnachweis: Herbert Höckel

Und gleichzeitig. Der am Markt wahrgenommene Preis fällt

Trotzdem - hier kommt mein persönlicher Schmerz - erodiert der Preis von Primärdaten immer weiter. Nicht weil Primärdaten schlechter geworden sind, sondern weil die Frage, die Kunden sich stellen, eine andere geworden ist: Brauche ich das überhaupt noch?

Das Beispiel von PepsiCo und Zappi macht es greifbar: Was früher als aufwändiger, teurer Pretest galt, liefert nun ADA - ein KI-System, das auf zehn Jahren standardisierter PepsiCo-Daten trainiert wurde - in einem Bruchteil der Zeit und zu einem Zehntel der ursprünglichen Kosten. Nicht weil ADA zaubern kann, sondern weil das Unternehmen seine eigenen Daten über Jahre systematisch strukturiert, standardisiert und validiert hat.

Wenn also automatisierte Prozesse die Erwartungen an Geschwindigkeit und wahrgenommenen Wert auf die Spitze treibt bzw. in den Keller drückt - wer zahlt dann noch den guten, alten Preis für die guten, neuen Daten?

Die Online-Panels: Problem oder Chance?

Das Vertrauen in Online-Panels steht derzeit unter massivem Druck und das durchaus zu Recht. Ihr struktureller Charakter macht sie nun mal zum potentiellen Opfer von Betrügern. Das ist nicht neu, sondern hinlänglich bekannt und alarmierend zugleich. Ich weiß, wovon ich rede - und das gilt sicherlich genauso für alle meine geschätzten Mitbewerber-Kollegen im In- und Ausland.

Wir, bei moweb research, betreiben inzwischen seit über zwei Jahrzehnten eigene Onlinepanels und mussten im Grunde von Anfang an massiv in den Erhalt der Datenqualität investieren: In betrugssichere Verifizierung, robuste Panel-Hygiene, konsequente Fraud-Detection und fortlaufende Validierung. Das tun wir aber ganz bestimmt NICHT, weil es so einfach oder günstig ist, sondern nun mal der einzige Weg, der langfristig trägt.

Wer seinen Kunden nicht beweisen kann, dass hinter den Zahlen echte

Menschen stecken, hat in einer Welt synthetischer Alternativen

schlicht kein Argument mehr.

Wirklich erschreckend für uns alle: Eine Untersuchung von CASE4Quality über acht große Sample-Anbieter im englischsprachigen Raum ergab, dass 30 bis 40 Prozent der Befragten Daten minderer Qualität lieferten. Etwa zehn Prozent wurden von Fraud-Detection-Tools erkannt - die restlichen 20 bis 30 Prozent wurden erst durch manuelle Prüfungen von offenen Nennungen und Trap Questions identifiziert. Noch konkreter: Drei Prozent der Geräte generieren 19 Prozent aller Survey-Abschlüsse - und 40 Prozent dieser Geräte nehmen täglich an über 100 Umfragen teil, bestehen dabei aber alle gängigen Qualitätsprüfungen!

Diese Qualitätskrise bewirkt nun leider auch noch einen Teufelskreis, denn: Sinkende Datenqualität zwingt Forscher, immer mehr Daten wegzuwerfen. Wer mehr wegwirft, braucht größere Stichproben. Größere Stichproben kosten mehr Geld, also sucht man günstigere Anbieter. Günstigere Anbieter liefern dann in der Regel schwächere Qualität, d.h. diese sinkt noch weiter. Und die Preisbereitschaft sinkt nun gleich mit, weil sich die Frage stellt: Ist dieser Output noch sein Geld wert? Letztendlich passiert dann das Schlimmste: Die guten Anbieter - die, die in Qualität investieren - werden verdrängt. Nicht weil sie schlechter sind, sondern weil sie besser sind. Die Schlechteren gewinnen und der Markt unterliegt dem Race-to-the-Bottom.

Die berühmte kaiserliche Unterlippe ist zurück – als Habsburger KI

Es gibt noch eine weitere Bedrohung für die Erhebung von Primärdaten und die ist besonders heimtückisch, weil sie so verlockend daherkommt. Die Unmengen an vermeintlich „frei" verfügbaren Daten (z.B. aus Social-Media) erlauben es, zu fast allen Fragen rasend schnell ein erstes Insight zu generieren. Statt der lästigen kosten- und zeitaufwendigen Forschung am lebenden Objekt. Ich verstehe die Versuchung zwar, teile sie aber überhaupt nicht.

Denn spätestens mit der Flut KI-generierter Inhalte im Netz wird die Datengrundlage zu einem undurchsichtigen, kaum noch zu kontrollierenden Wirrwarr. Man erhält zwar Antworten - aber weiß nicht mehr, von wem. Ob überhaupt noch von echten Menschen oder nur von deren Simulation? Die Tech-Welt spricht dabei von Daten-Autophagie bzw. -Kannibalismus - ich persönlich bevorzuge den von Jathan Sadowski geprägten Begriff „Habsburg-AI“:

Habsburg AI - ein System, das so stark mit dem Output andere

generativer KIs trainiert wurde, dass es zu einem inzestuösen Mutanten

wird, am Ende mit übertriebenen, grotesken Zügen.

Klar ist: Synthetische Modelle funktionieren nur so lange, wie die Fragestellungen nah am originalen Erhebungskontext mit ursprünglichen Kundendaten bleiben. Entfernt man sich zu weit davon - oder versäumt es, die Daten fortlaufend mit einer kritischen Menge zu aktualisieren - verliert das Modell schlicht den Boden unter den Füßen.

#GIGO - Garbage in, garbage out.

Jetzt auch sofort, überall und am besten noch kostenlos.

Was also ist die Lösung?

Ich bin nach über 30 Berufsjahren nicht mehr naiv genug zu glauben, dass „besser werden" als Antwort taugt. Deshalb lasse ich das und sage lieber ganz direkt, was ich denke. Und ich meine alle vier folgenden Appelle ernst:

Erstens: Qualität muss beweisbar werden - nicht nur behauptet. Methodische Transparenz, Validierungsstandards, klare Dokumentation. Genau das, was ADM, BVM, ASI und DGOF im KI-Leitfaden von Januar 2026 fordern. Wer zeigt, dass seine Daten wirklich sauber sind, hat einen Beweis in der Hand, den kein synthetisches System liefern kann.

Zweitens: Panel-Qualität ist das Produkt.
Nicht die Befragung, nicht der Fragebogen, nicht das Dashboard. Die entscheidende Differenzierungsfrage der nächsten fünf Jahre lautet: Stehen hinter diesen Daten wirklich echte Menschen? Wer das zweifelsfrei bestätigen kann, gewinnt. Wer dazu nicht in der Lage ist, verliert - und verdient es auch, zu verlieren.

Drittens: Primärforschung muss angemessen bezahlt werden.
Das ist kein Wunschdenken. Das ist eine Marktnotwendigkeit. Wer echte Daten will - objektiv erhoben, methodisch valide, inhaltlich reliabel - der muss dafür bezahlen, was es kostet, echte Menschen zu befragen. Panel-Hygiene kostet. Fraud-Detection kostet. Qualifizierte Forscher, die die richtigen Fragen stellen, kosten.

Viertens - und hier werde ich sehr explizit, weil mich dieses Thema wirklich aufregt:
Wir müssen aufhören, vom „Human-in-the-Loop" zu sprechen. Denn dieses Konzept an dieser Stelle ist falsch. Es ist nicht nur ungenau, es ist zudem brandgefährlich, denn es positioniert uns, die Forscher, als Korrektiv des Algorithmus, quasi als Qualitätskontrolleure auf dem Nebengleis. Also als die, die nochmal drüber schauen, bevor der Output rausgeht.

Das ist nicht unsere Rolle! Das ist eine Degradierung!

Die richtige Formulierung lautet: „AI-in-the-Loop“ denn die KI ist das Werkzeug und wir sind die Experten. Wir bestimmen, welche Fragen gestellt werden. Wir definieren, was gute Daten sind. Wir entscheiden, was eine valide Erkenntnis ist und was Rauschen. Nicht der Algorithmus, nicht das Dashboard und nicht das nächste tolle Tech-Tool.

Wir brauchen den Mut, klar zu sagen: Die Fachleute hier sind WIR. Die KI darf rechnen. Wir werden denken!

Übrigens ist auch nicht jeder Auftraggeber in der Lage, seinen Informationsbedarf oder die Forschungshypothese vorab konkret zu benennen - auch nicht gegenüber einer LLM-basierten Wortwürfelmaschine.

Genau hier liegt für mich die Zukunft des Researchers: Nicht im Datenproduzieren, sondern im Fragenformulieren. Das ist der wertvollste und unverzichtbarste Teil unserer Arbeit - und den kann kein Algorithmus übernehmen.

Deshalb stelle ich Euch - liebe Leser - zum Abschluss eine Frage:

Wenn Euer Auftraggeber seine wertvolle Marke, seine langfristige Strategie oder sein ganzes Geschäftsjahr auf Eure Ergebnisse stützt - könnt Ihr dann mit gutem Gewissen sagen, dass diese Daten auch wirklich der Wahrheit entsprechen?

Wenn ja: Gut gemacht. Falls aber nicht, rate ich dringend zu einem Schritt zurück, um zu prüfen, ob der schönen neuen Technik inzwischen zu viel Macht über die Prozesse zugestanden wurden. Denn …

A fool with a tool is still a fool.

Ein guter Forscher mit objektiven, validen und reliablen Daten - und der Fähigkeit, die richtigen Fragen zu stellen? Der ist unersetzlich - jetzt mehr denn je!

Quellen:
https://www.linkedin.com/pulse/boosting-small-samples-schr%C3%B6dinger-cat-dilemma-jon-puleston-adjff/

Steve Phillips et al „The Consumer Insights Revolution“
https://www.amazon.de/-/en/Consumer-Insights-Revolution-Transforming-competitive/dp/1781338698

Case4Quality
https://nielseniq.com/global/en/insights/education/2023/does-everybody-lie-the-resiliency-of-survey-research-done-right/

https://www.greenbook.org/insights/data-quality-privacy-and-ethics/truth-to-be-told-five-realities-about-online-sample-that-compromise-data-quality

https://makingsciencepublic.com/2026/04/10/habsburg-ai-portrait-of-a-metaphor-and-its-family/

ADM/BVM/ASI/DGOF: KI-Leitfaden
https://www.adm-ev.de/standards-richtlinien/#ki-leitfaden

Herbert Höckel is a managing partner here at moweb research GmbH. He has been a market researcher for more than 25 years. In 2004 he founded moweb GmbH, which he is still the owner today. moweb from Düsseldorf operates internationally and is one of the first German market research institutes specializing in digital processes.

You are welcome to purchase his book "Customer Centricity Mindset ® - Really Understand Customers, Master Disruption Successfully" here.

Your success, our goal!

Appointment Quote

BLOGJuly 3rd 2026

Herberts Welt #22

BLOG
July 3rd 2026