Question 1

Wie funktioniert A/B Testing?

Accepted Answer

Beim A/B Testing wird der Traffic einer Seite per Zufallsprinzip auf zwei (oder mehr) Varianten aufgeteilt: Variante A ist die Kontrolle, Variante B die geänderte Version. Beide laufen gleichzeitig im selben Zeitraum. Gemessen wird ein klar definiertes Conversion-Ziel — etwa Käufe, Anmeldungen oder Leads. Nach Erreichen der vorab berechneten Stichprobengröße wird statistisch geprüft, ob der Unterschied zwischen den Varianten signifikant ist (Branchenstandard: 95 % Konfidenz). Erst dann gilt der Test als entschieden und die Gewinner-Variante wird ausgerollt.

Question 2

Wie macht man A/B Testing? — Schritt für Schritt

Accepted Answer

Sieben Schritte: 1) Hypothese formulieren — was glauben wir, warum, mit welcher erwarteten Wirkung. 2) Conversion-Ziel definieren (Käufe, Leads, Klicks). 3) Test-Tool wählen (VWO, AB Tasty, Kameleoon, GrowthBook). 4) Stichprobengröße & MDE vorab berechnen, daraus die nötige Laufzeit ableiten. 5) Variante B bauen, technisch QA-en, auf Mobile & Desktop testen. 6) Test live schalten — ohne Peeking, ohne vorzeitiges Stoppen. 7) Nach Erreichen der Stichprobe statistisch auswerten und nur bei ≥ 95 % Konfidenz ausrollen. Wer einen dieser Schritte überspringt — vor allem 4 und 7 — produziert Pseudo-Ergebnisse.

Question 3

Wie viele Besucher braucht ein A/B Test?

Accepted Answer

Faustregel: bei einer Ausgangs-Conversion-Rate von 2–3 % und einer angestrebten relativen Verbesserung (MDE) von 10 % sind rund 20.000–40.000 Sessions pro Variante nötig, um auf 95 % Konfidenz zu kommen. Je kleiner der erwartete Uplift, desto größer die Stichprobe — wir berechnen die nötige Größe vor dem Start, damit am Ende kein „nicht aussagekräftig" steht.

Question 4

Wie lange dauert ein A/B Test?

Accepted Answer

Mindestens zwei volle Wochen, um Wochentag- und Saisoneffekte abzudecken. Die tatsächliche Laufzeit ergibt sich aus der nötigen Stichprobengröße geteilt durch den realen Tages-Traffic. Tests vorzeitig zu stoppen, weil eine Variante früh führt, ist der häufigste Fehler — die Konfidenz ist dann nicht erreicht und das Ergebnis statistisch wertlos.

Question 5

Was bedeutet statistische Signifikanz beim A/B Testing?

Accepted Answer

Statistische Signifikanz beschreibt die Wahrscheinlichkeit, dass der gemessene Unterschied zwischen Variante A und B nicht zufällig ist. Branchenstandard sind 95 % Konfidenz: das heißt, in höchstens 5 von 100 Fällen wäre der gleiche Effekt auch ohne echten Unterschied messbar. Erst ab 95 % gilt ein Test bei uns als gewonnen — alles darunter ist Hypothese, kein Beweis.

Question 6

Was kostet professionelles A/B Testing?

Accepted Answer

Ein einzelner, sauber aufgesetzter Test (Hypothese, Implementierung, statistische Auswertung, Dokumentation) liegt typischerweise zwischen 2.500 und 6.000 € — abhängig von technischer Komplexität und Tooling. Sinnvoll wird A/B Testing aber erst als laufendes Programm: 6–8 Tests pro Jahr in einem Retainer von 3.500–7.000 € monatlich, inklusive vorgelagerter Conversion-Analyse.

Question 7

Was ist Google Optimize?

Accepted Answer

Google Optimize war das kostenlose A/B-Testing- und Personalisierungs-Tool von Google, eng integriert in Google Analytics. Es wurde 2017 als Teil der Google-Marketing-Platform eingeführt und richtete sich vor allem an kleine und mittlere Websites, die ohne Budget einsteigen wollten. Am 30. September 2023 hat Google das Tool eingestellt — sowohl die kostenlose Variante (Optimize) als auch die Enterprise-Version (Optimize 360). Bestehende Tests wurden an dem Datum automatisch beendet.

Question 8

Was macht Google Optimize?

Accepted Answer

Google Optimize bot vier Test-Typen: A/B-Tests (zwei Varianten gegeneinander), Multivariate Tests (mehrere Elemente in Kombination), Redirect-Tests (komplette URL-Wechsel) und Personalisierungen (dauerhafte Anpassungen für bestimmte Zielgruppen). Die Bedienung lief über einen visuellen WYSIWYG-Editor direkt im Browser, die Auswertung kam aus Google Analytics — inklusive Bayes-Statistik und Targeting-Optionen wie Geo, Device oder Custom-Audiences. Da das Tool seit September 2023 abgeschaltet ist, übernehmen heute Lösungen wie VWO, AB Tasty, Kameleoon oder GrowthBook diese Funktionen.

Question 9

Welche Alternativen gibt es zu Google Optimize?

Accepted Answer

Google Optimize wurde im September 2023 eingestellt. Sinnvolle Alternativen für den Mittelstand: VWO (gutes Preis-Leistungs-Verhältnis, server-side möglich), AB Tasty (DSGVO-konform, EU-Hosting, starkes Personalisierungs-Modul), Kameleoon (Fokus auf KI-gestützte Personalisierung), Convert (datenschutzfreundlich, transparente Preise) oder GrowthBook (Open Source, self-hosted für maximale Datenkontrolle). Für reine Server-Side-Tests ohne UI-Tooling: LaunchDarkly oder Statsig. Welches Tool passt, hängt an Traffic-Volumen, Tracking-Setup und Datenschutz-Anforderungen — wir wählen das Tool im Erstgespräch passend zur Infrastruktur aus.

Question 10

A/B Test oder multivariater Test — was ist sinnvoller?

Accepted Answer

Für 90 % der Fälle im Mittelstand: A/B Test. Multivariate Tests (MVT) testen mehrere Elemente gleichzeitig in allen Kombinationen — das vervielfacht den Traffic-Bedarf und ist nur bei sehr hohem Volumen aussagekräftig. A/B Tests beantworten eine klare Hypothese sauber, schnell und intern verteidigbar.

Question 11

Brauche ich für A/B Testing einen Cookie-Banner?

Accepted Answer

Für die reine Test-Persistenz reicht ein technisch notwendiger First-Party-Cookie ohne Consent. Sobald aber personenbezogene Auswertung (z.B. via GA4 oder Marketing-Pixel) dazukommt, greift die DSGVO und ein Consent-Layer ist Pflicht. Wir setzen Tests so auf, dass die statistische Auswertung auch ohne Tracking-Consent funktioniert.

Aus Hypothese wird Beweis. A/B Testing, das skaliert.

Beweisen, was wirkt — bevor es teuer wird.

Vier Schritte zum sauberen Test

Klare Ziele definieren

Testdauer richtig setzen

Genug Daten sammeln

Testideen aus Siteclinics

Wenn der Blick eines Models +47 % Conversion bringt.

Holen Sie sich die komplette Gelbe-Seiten-Case als PDF.

Wann A/B-Testing wirklich Sinn macht.

Solide Grundprozesse

Ressourcen für die Umsetzung

Hypothesen aus der Analyse

Was wir bei den meisten Tests sehen.

Unklare Botschaften

Zu viele Formularfelder

Fehlende oder schwache CTAs

Inkonsistenz Ad → Landingpage

Langsame Ladezeiten

Schwache Mobile-Optimierung

Stichprobengröße, MDE und statistische Signifikanz.

Stichprobengröße

MDE (Minimum Detectable Effect)

Statistische Signifikanz

A/B Testing — die Fragen, die wir am häufigsten hören.

Lassen Sie uns Ihre erste Hypothese
im Erstgespräch entwickeln.