Google Ads Experiments i Drafts: testy A/B 2026

Około 60 procent „zwycięskich" zmian, które reklamodawcy wdrażają w Google Ads w 2026, nigdy nie zostało naprawdę udowodnionych — oceniono je, porównując ten miesiąc z poprzednim, gdzie sezonowość, konkurenci i tuzin innych edycji poruszyły się wszystkie naraz. Experiment usuwa to zamieszanie, prowadząc starą i nową wersję obok siebie, w tych samych aukcjach, w tym samym czasie, tak że jedyną rzeczą, która się różni, jest jedna zmiana, którą testujesz.

Ten przewodnik prowadzi przez drafts i experiments od początku do końca — co testować, jak dzielić ruch, ile danych potrzebujesz i jak czytać wynik, nie oszukując samego siebie — by Twoja następna „wygrana" była prawdziwa. Aby zobaczyć, które części Twojego konta najbardziej warto przetestować najpierw, uruchom nasz darmowy 5-osiowy audyt Google Ads.

Zaktualizowano 2026-05-17 o bieżące zachowanie drafts i experiments, okna uczenia Smart Bidding oraz praktykę istotności zaobserwowane na kontach z USA, Wielkiej Brytanii i Europy.

TL;DR — testowanie w Google Ads bez oszukiwania siebie :

Najpierw draft, potem experiment — draft to bezpieczna piaskownica; experiment dzieli prawdziwy ruch. 2. Jedna zmienna na test — zmień strategię stawek albo stronę docelową, nigdy obie. 3. Prowadź ramiona jednocześnie — oba mierzą się z tą samą sezonowością, więc czas przestaje być czynnikiem zakłócającym. 4. Zwymiaruj próbę przed spojrzeniem — celuj w ponad 100 konwersji na ramię i 2 do 4 pełnych tygodni. 5. 95 procent to brama, nie linia mety — wynik nieistotny jest nieudowodniony, nie remisowy.

Czym są drafts i experiments w Google Ads?

Drafts i experiments to dwie połowy tego samego przepływu pracy, a zrozumienie tego podziału jest podstawą każdego testu poniżej. Draft to kopia przygotowawcza; experiment to porównanie na żywo, które ta kopia umożliwia.

Drafts — Draft to piaskownicowy duplikat kampanii na żywo, w którym wprowadzasz proponowaną zmianę bez dotykania oryginału. Nic w drafcie nie wydaje pieniędzy ani nie wyświetla reklam; to po prostu bezpieczne miejsce, by przygotować jedną edycję — nową strategię stawek, inną stronę docelową, przepisaną RSA — i przejrzeć ją, zanim jakikolwiek ruch ją zobaczy.

Experiments — Promowanie draftu do experimentu jest tym, co czyni porównanie realnym. Google rozdziela kwalifikujące się aukcje kampanii między oryginał (kontrolę) i draft (wariant), tak że oba działają w tym samym czasie wobec tej samej konkurencji i sezonowości. Ta jednoczesność to cały sens: usuwa czas jako zmienną zakłócającą.

Dlaczego to bije przed-i-po — Gdy zmieniasz kampanię na żywo i porównujesz zeszły tydzień z tym tygodniem, każda inna ruchoma część — konkurenci, popyt, Twoje inne edycje — jest wpieczona w wynik. Ponieważ experiment prowadzi oba ramiona razem, różnica, którą mierzysz, jest znacznie bliższa prawdziwemu efektowi Twojej jednej zmiany. Po przyczynową logikę za tym sięgnij do naszego przewodnika po teście inkrementalności.

Co naprawdę powinieneś przetestować najpierw?

Nie każda zmiana zasługuje na experiment, a te, które zasługują, powinny być uszeregowane według tego, jak bardzo mogą ruszyć CPA. Wydaj swój ograniczony ruch na nieliczne testy z prawdziwą dźwignią, nie na kosmetyczne poprawki.

Strategia stawek — To zwykle test o największej dźwigni, bo algorytm stawek decyduje, ile płacisz za każde kliknięcie. Porównanie Maximize Conversions kontra Target CPA, albo jednego Target CPA kontra ciaśniejszemu, może ruszyć koszt konwersji istotnie. Nasz przewodnik Maximize kontra Target CPA rozkłada, kiedy każdy wygrywa.

Strony docelowe — Skierowanie ramienia wariantu na inny URL to jeden z najczystszych testów platformy, bo zmiana strony jest w pełni odizolowana od reklamy. Szybsza strona, ciaśniejszy nagłówek lub krótszy formularz często ruszają współczynnik konwersji bardziej niż jakakolwiek poprawka stawki. Zobacz nasz przewodnik po konwersji stron docelowych.

Tekst reklamy i RSA — Testowanie nowej RSA lub innej mieszanki zasobów mówi Ci, którą wiadomość aukcja faktycznie nagradza. Metoda ma tu znaczenie: nasza metoda pisania RSA pokazuje, jak budować warianty warte przetestowania.

Jedna zmienna naraz — Cokolwiek wybierzesz, zmień dokładnie jedną rzecz. Połącz nową strategię stawek z nową stroną docelową, a zwycięski wynik nie mówi Ci niczego wielokrotnego użytku, bo nie możesz przypisać wzrostu żadnej z dwóch zmian.

Jak skonfigurować poprawny experiment 50/50?

Poprawny experiment to przede wszystkim kwestia dyscypliny przy konfiguracji. Trafisz w podział, czas i izolację, a odczyt na końcu jest wiarygodny; pomyl je, a żadna analiza nie uratuje wyniku.

Podział 50/50 — Zacznij od równego podziału ruchu, by oba ramiona gromadziły dane w tym samym tempie i osiągnęły istotność razem. Nierówny podział — powiedzmy 10/90 — chroni oryginał, ale głodzi wariant z danych, więc udowodnienie czegokolwiek trwa znacznie dłużej.

Przypisanie oparte na plikach cookie — Użyj podziału opartego na plikach cookie zamiast opartego na wyszukiwaniu, by powracający użytkownik zawsze widział to samo ramię. Inaczej ta sama osoba może wylądować zarówno w kontroli, jak i w wariancie, zamazując porównanie i pompując szum.

Wszystko inne równe — Draft musi odpowiadać oryginałowi pod względem budżetu, targetowania, harmonogramu i struktury. Jedyną dozwoloną różnicą jest Twoja zmienna testowa. Jeśli wariant ma też wyższy budżet lub inną geografię, nie mierzysz już tego, co myślisz, że mierzysz.

Wyczuć czas startu — Wystartuj na początku tygodnia i zaplanuj prowadzenie przez pełne tygodnie. Start w środku tygodnia obciąża jedno ramię większym ruchem weekendowym niż drugie na początku, co dodaje uniknionego szumu do pierwszego odczytu.

Ile ruchu i czasu potrzebujesz do istotności?

To tu większość experimentów idzie źle: są zatrzymywane zbyt wcześnie, na zbyt małej liczbie danych, bo panel wyglądał ekscytująco. Istotność jest funkcją konwersji i wielkości efektu, nie tego, ile dni minęło.

Konwersje, nie kliknięcia — Istotność napędzają konwersje na ramię, nie wyświetlenia czy kliknięcia. Przybliżona robocza podłoga to 100 konwersji na ramię; mniej niż 30 na ramię prawie nigdy nie jest rozstrzygające. Kliknięcia gromadzą się szybko i kuszą do wczesnego czytania, ale to liczba konwersji faktycznie decyduje o teście.

Wielkość efektu ustala koszt — Im mniejsza prawdziwa różnica, tym więcej danych potrzeba, by ją zobaczyć. Wykrycie wahania o 30 procent może wymagać kilkuset konwersji na ramię; wykrycie wahania o 5 procent może wymagać tysięcy. Zdecyduj z góry, jak duży efekt wart jest wykrycia, i zwymiaruj test pod to.

Większość testów potrzebuje 2 do 4 tygodni — W praktyce gromadzenie wystarczająco wielu konwersji przez pełne tygodnie umieszcza większość experimentów w oknie 2 do 4 tygodni. Jeśli Twoje konto produkuje tylko 20 do 40 konwersji tygodniowo, zaakceptuj, że możesz wiarygodnie wykryć tylko duże efekty, i projektuj śmiałe testy odpowiednio.

Nie obniżaj progu dla szybkości — Gdy wolumen jest skąpy, wydłuż okno zamiast ogłaszać zwycięzcę wcześnie. Szybki odczyt na małej próbie zwykle jest odczytem fałszywym, a działanie na nim kosztuje więcej niż czekanie.

Jak czytać wyniki, nie oszukując samego siebie?

Najtrudniejsza część testowania to nie konfiguracja — to opieranie się historiom, które Twój własny mózg opowiada o wczesnych danych. Większość fałszywych zwycięzców jest samozadana, stworzona przez czytanie zbyt wcześnie i zatrzymywanie się zbyt skwapliwie.

Zaglądanie tworzy fałszywych zwycięzców — Na początku każde ramię ma tak mało konwersji, że jeden szczęśliwy dzień może wysunąć wariant 40 procent do przodu. Jeśli sprawdzasz codziennie i zatrzymujesz się, gdy tylko wygląda dobrze, zablokujesz szum, jakby był sygnałem. Zdecyduj najpierw o wielkości próby, a potem ignoruj panel aż do jej osiągnięcia.

Regresja do średniej — Ramię, które wystrzeliwuje wcześnie, prawie zawsze dryfuje z powrotem ku prawdziwej wartości, gdy dane się gromadzą. Dramatyczna wczesna różnica to najmniej wiarygodna liczba w całym teście, a jednak to ona kusi ludzi do zatrzymania. Poczekaj, aż różnica się ustabilizuje.

95 procent to brama, nie cel — Traktuj wskaźnik pewności 95 procent jako minimalną poprzeczkę do przekroczenia, nie cel do świętowania. Przekroczenie go oznacza, że różnica jest prawdopodobnie prawdziwa; nieprzekroczenie oznacza, że wynik jest nieudowodniony, co nie jest tym samym co remis.

Oceniaj według właściwej metryki — Porównuj ramiona według kosztu konwersji i wartości konwersji, nie kliknięć czy CTR. Wariant może wygrać na zaangażowaniu i wciąż przegrać na metryce pieniężnej, która naprawdę się liczy, więc zawsze zakotwicz decyzję w wynikach.

Jak wdrożyć lub wycofać zwycięski experiment?

Czysty wynik jest użyteczny tylko, jeśli zastosujesz go czysto. Krok wdrożenia to miejsce, gdzie zespoły po cichu wprowadzają szum z powrotem, albo cofając się zbyt szybko, albo resetując uczenie, za które właśnie zapłaciły.

Zastosuj, nie odbudowuj — Gdy wariant wygrywa, zastosuj experiment, by zaktualizować oryginalną kampanię, zamiast odtwarzać ją od zera. Zastosowanie zachowuje historię i sygnał, gdzie to możliwe; odbudowa wyrzuca uczenie i wymusza świeży, kosztowny rozbieg.

Spodziewaj się krótkiego spadku ponownego uczenia — Zastosowanie zmiany, zwłaszcza zmiany stawek, może wywołać krótki okres uczenia, gdy algorytm się restabilizuje. Zaplanuj kilka spokojnych dni, zanim wygrana w pełni pokaże się w ustabilizowanych liczbach, i nie edytuj w panice w ich trakcie.

Odrzuć czysto przy przegranej — Jeśli wariant przegra lub zremisuje, zakończ experiment i zachowaj kontrolę nietkniętą. Remis to prawdziwy wynik: mówi Ci, że zmiana nie pomogła, co oszczędza Ci wdrażania nie-poprawy na całe konto.

Udokumentuj każdy wynik — Zapisz, co testowałeś, wielkość próby i rezultat, wygraną czy przegraną. To powstrzymuje Twój zespół przed ponownym uruchamianiem tego samego nierozstrzygającego testu za trzy miesiące i buduje bibliotekę tego, na co Twoje konto faktycznie reaguje. Aby przeliczyć surowe różnice współczynników na oczekiwany wpływ na przychód, zanim się zobowiążesz, użyj naszego darmowego 5-osiowego audytu obok kalkulatora współczynnika konwersji.

Tabela decyzyjna projektowania experimentu

Użyj tej tabeli, by wybrać właściwy test, właściwy podział i właściwy odczyt dla sytuacji przed Tobą. Jest uszeregowana z grubsza od decyzji konfiguracyjnych do dyscypliny czytania wyników.

Nie zatrzymuj experimentu pierwszego dnia, gdy wygląda jak zwycięzca :

Na początku testu każde ramię ma tylko garstkę konwersji, więc pojedynczy szczęśliwy dzień może wysunąć wariant 30 do 40 procent do przodu, zanim regresja do średniej go cofnie. Zatrzymanie tam blokuje szum, jakby był wynikiem, i wdraża zmianę, która naprawdę nie pomaga. Zdecyduj o wielkości próby i minimalnym czasie trwania przed startem, a potem ignoruj panel aż do ich osiągnięcia. Wynik, który nie przekroczył pewności 95 procent, jest nieudowodniony, nie jest wygraną.

Jak złożyć to wszystko razem

Dyscyplina testowania się kumuluje: każdy czysty experiment czyni następną decyzję tańszą i pewniejszą. Konta, które poprawiają się najszybciej, to nie te, które zmieniają najwięcej, ale te, które dowodzą najwięcej.

Testuj wielkie dźwignie — Wydaj swój ograniczony ruch na experiments stawek i stron docelowych, gdzie dźwignia jest prawdziwa, i pomiń kosmetyczne poprawki, które i tak nie potrafią ruszyć CPA na tyle, by osiągnąć istotność. Śmiałe testy na skąpym wolumenie biją subtelne testy, których nigdy nie udowodnisz.

Chroń odczyt — Zwymiaruj próbę przed startem, prowadź przez pełne tygodnie, pozwól Smart Bidding wyjść z uczenia i trzymaj poprzeczkę 95 procent nawet, gdy wczesna różnica Cię kusi. Cała wartość experimentu jest niszczona w chwili, gdy zaglądasz i zatrzymujesz się wcześnie.

Zbuduj nawyk — Udokumentuj każdy test, wygrany czy przegrany, by Twoje konto gromadziło bibliotekę udowodnionych zmian zamiast stosu nieudowodnionych przeczuć. W ciągu roku zespół, który uruchamia jeden czysty experiment co dwa tygodnie, uczy się więcej niż taki, który wdraża dziesięć ślepych edycji tygodniowo.

Aby znaleźć testy o największej dźwigni na swoim własnym koncie, zanim spędzisz tydzień na ich dowodzeniu, uruchom darmowy 5-osiowy audyt SteerAds, a potem zwymiaruj oczekiwany wpływ każdej zmiany współczynnika naszym kalkulatorem współczynnika konwersji.

Sources

Oficjalne źródła zasięgnięte na potrzeby tego przewodnika:

FAQ

Jak naprawdę działają experiments w Google Ads?

Experiment dzieli ruch jednej kampanii na dwa ramiona, które działają w tym samym czasie. Najpierw tworzysz draft, czyli piaskownicową kopię oryginalnej kampanii, w której wprowadzasz jedną zmianę, a potem promujesz ten draft do experimentu z podziałem ruchu, zwykle 50/50. Od tego momentu Google losowo przydziela każdą kwalifikującą się aukcję do kontroli lub wariantu, więc oba ramiona mierzą się z tą samą sezonowością, konkurencją i odbiorcami. Ponieważ oba ramiona działają jednocześnie, a nie przed-i-po, izolujesz efekt swojej zmiany od szumu związanego z czasem. Panel pokazuje następnie metryki każdego ramienia obok siebie ze wskaźnikami pewności.

Jak długo powinien działać experiment w Google Ads?

Niech działa, aż osiągniesz istotność statystyczną, nie do ustalonej daty, i nigdy nie zatrzymuj go pierwszego dobrze wyglądającego dnia. W praktyce większość experimentów potrzebuje 2 do 4 tygodni, bo potrzebujesz wystarczająco wielu konwersji na ramię, nie tylko wystarczająco wielu kliknięć. Przybliżona podłoga to około 100 konwersji na ramię, zanim zaufasz wynikowi, a mniej niż 30 na ramię prawie nigdy nie jest rozstrzygające. Zawsze prowadź przez pełne tygodnie, by oba ramiona widziały te same wzorce dni roboczych i weekendu. Jeśli wolumen jest bardzo niski, wydłuż okno zamiast obniżać próg, bo szybki odczyt na skąpych danych zwykle jest odczytem fałszywym.

Co tak naprawdę mogę testować w A/B w Google Ads?

Najczystsze testy zmieniają dokładnie jedną zmienną, by wynik był interpretowalny. Cztery testy o największej wartości to strategia ustalania stawek, jak Maximize Conversions kontra Target CPA; strona docelowa, kierując ramię wariantu na inny URL; tekst reklamy i zasoby RSA; oraz zmiany odbiorców lub targetowania. Testy stawek i stron docelowych zwykle ruszają CPA najbardziej, dlatego warte są czekania. Unikaj łączenia kilku zmian w jednym experimencie — jeśli zmienisz strategię stawek i stronę docelową razem, a CPA się poprawi, nie możesz powiedzieć, która to sprawiła, więc nie uczysz się niczego wielokrotnego użytku.

Ile konwersji potrzebuję na poprawny wynik?

Zależy to od wielkości efektu, który chcesz wykryć, ale praktyczna reguła to co najmniej 100 konwersji na ramię dla umiarkowanego efektu i znacznie więcej, by uchwycić mały. Wykrycie zmiany o 5 procent w sposób wiarygodny może wymagać tysięcy konwersji na ramię, podczas gdy zmiana o 30 procent pojawia się przy kilkuset. Im mniejsza prawdziwa różnica, tym więcej danych potrzeba, by oddzielić ją od losowego szumu. Jeśli Twoje konto produkuje tylko 20 do 40 konwersji tygodniowo łącznie, zaakceptuj, że możesz wykryć tylko duże efekty, i projektuj śmiałe testy zamiast subtelnych poprawek.

Dlaczego experiments często pokazują fałszywego zwycięzcę wcześnie?

Na początku experimentu każde ramię ma bardzo mało konwersji, więc losowa zmienność gwałtownie kołysze liczbami — jeden szczęśliwy dzień może wysunąć wariant 40 procent do przodu, zanim regresja do średniej go cofnie. Dlatego zaglądanie do wyników codziennie i zatrzymywanie się, gdy tylko ramię wygląda dobrze, tak często produkuje fałszywych zwycięzców. Lekarstwem jest ustalenie wielkości próby i czasu trwania przed startem, a potem ignorowanie panelu aż do ich osiągnięcia. Traktuj wskaźnik pewności 95 procent jako minimalną bramę, nie linię mety, i pamiętaj, że wynik nieistotny to nie remis — jest po prostu nieudowodniony.

Experiment kontra bezpośrednia zmiana kampanii — co lepsze?

Experiment to porównanie kontrolowane; bezpośrednia zmiana to zakład w ciemno. Jeśli po prostu edytujesz kampanię na żywo, a CPA poprawi się w następnym tygodniu, nie możesz udowodnić, że to edycja go spowodowała, bo pogoda, konkurenci, sezonowość i Twoje inne zmiany poruszyły się w tym samym czasie. Experiment utrzymuje to stałe, prowadząc obie wersje jednocześnie. Kompromisem jest to, że experiments dzielą Twój wolumen, więc każde ramię dostaje połowę danych, a istotność trwa dłużej. Używaj experimentów do każdej zmiany dość dużej, by się liczyła, i dość odwracalnej, by ją przetestować — a drobne, oczywiście poprawne poprawki wdrażaj bezpośrednio.

Czy mogę uruchomić experiment w Google Ads na Smart Bidding?

Tak, a experiments stawek należą do najcenniejszych, bo strategia stawek napędza tak dużą część Twojego CPA. Możesz porównać dwie strategie — na przykład Maximize Conversions kontra Target CPA — albo tę samą strategię przy dwóch różnych celach. Jedyną ostrożnością jest okres uczenia: każde ramię potrzebuje czasu, by wyjść z uczenia, zanim jego liczby coś znaczą, więc dodaj około jednego do dwóch tygodni do swojego normalnego okna istotności. Nie oceniaj experimentu stawek, dopóki któreś ramię wciąż się uczy, i unikaj dużych edycji w trakcie lotu, które resetują to uczenie i zanieczyszczają porównanie.