Experiments y Drafts de Google Ads: test A/B 2026

Cerca del 60 por ciento de los cambios «ganadores» que los anunciantes despliegan en Google Ads en 2026 nunca se probaron realmente — se juzgaron comparando este mes con el anterior, donde la estacionalidad, los competidores y una docena de otras ediciones se movieron todos a la vez. Un experiment elimina esa confusión corriendo la versión vieja y la nueva lado a lado, en las mismas subastas, al mismo tiempo, de modo que lo único que difiere sea el único cambio que estás probando.

Esta guía recorre los drafts y los experiments de principio a fin — qué probar, cómo dividir el tráfico, cuántos datos necesitas y cómo leer el resultado sin engañarte — para que tu próxima «victoria» sea real. Para ver qué partes de tu cuenta vale más la pena probar primero, lanza nuestra auditoría gratuita de Google Ads de 5 ejes.

Actualizado el 2026-05-17 con el comportamiento actual de drafts y experiments, las ventanas de aprendizaje del Smart Bidding y la práctica de significancia observados en cuentas de EE. UU., Reino Unido y Europa.

TL;DR — probar en Google Ads sin engañarte :

Draft primero, luego experiment — un draft es un entorno seguro; el experiment divide el tráfico real. 2. Una variable por prueba — cambia la estrategia de puja o la página de destino, nunca ambas. 3. Corre los brazos simultáneamente — ambos enfrentan la misma estacionalidad, así que el tiempo deja de ser un factor de confusión. 4. Dimensiona la muestra antes de mirar — apunta a más de 100 conversiones por brazo y de 2 a 4 semanas completas. 5. El 95 por ciento es una puerta, no una línea de meta — un resultado no significativo no está probado, no es un empate.

¿Qué son los drafts y los experiments en Google Ads?

Los drafts y los experiments son dos mitades del mismo flujo de trabajo, y comprender esa separación es la base de cada prueba siguiente. Un draft es una copia de preparación; un experiment es la comparación en vivo que esa copia hace posible.

Drafts — Un draft es un duplicado aislado de una campaña en vivo donde haces tu cambio propuesto sin tocar el original. Nada en un draft gasta dinero ni publica anuncios; es simplemente un lugar seguro para preparar una sola edición — una nueva estrategia de puja, otra página de destino, una RSA reescrita — y revisarla antes de que ningún tráfico la vea.

Experiments — Promover un draft a experiment es lo que hace real la comparación. Google reparte las subastas elegibles de la campaña entre el original (el control) y el draft (la variante), de modo que ambos corren al mismo tiempo frente a la misma competencia y estacionalidad. Esa simultaneidad es todo el sentido: elimina el tiempo como variable de confusión.

Por qué esto supera a un antes-y-después — Cuando cambias una campaña en vivo y comparas la semana pasada con esta semana, cada otra pieza en movimiento — competidores, demanda, tus otras ediciones — queda horneada en el resultado. Como un experiment corre ambos brazos juntos, la diferencia que mides está mucho más cerca del verdadero efecto de tu único cambio. Para la lógica causal detrás de esto, consulta nuestra guía de pruebas de incrementalidad.

¿Qué deberías probar realmente primero?

No todo cambio merece un experiment, y los que lo merecen deberían ordenarse según cuánto pueden mover el CPA. Gasta tu tráfico limitado en las pocas pruebas con palanca real, no en ajustes cosméticos.

Estrategia de puja — Suele ser la prueba de mayor palanca porque el algoritmo de puja decide lo que pagas por cada clic. Comparar Maximize Conversions frente a Target CPA, o un Target CPA frente a uno más ajustado, puede mover el coste por conversión de forma notable. Nuestra guía Maximize frente a Target CPA detalla cuándo gana cada una.

Páginas de destino — Enviar el brazo variante a otra URL es una de las pruebas más limpias de la plataforma, porque el cambio de página está totalmente aislado del anuncio. Una página más rápida, un titular más ajustado o un formulario más corto a menudo mueven la tasa de conversión más que cualquier ajuste de puja. Consulta nuestra guía de conversión de páginas de destino.

Texto del anuncio y RSA — Probar una nueva RSA o una mezcla de assets distinta te dice qué mensaje recompensa realmente la subasta. El método importa aquí: nuestro método de redacción de RSA muestra cómo construir variantes que valgan la pena probar.

Una variable a la vez — Elijas lo que elijas, cambia exactamente una cosa. Agrupa una nueva estrategia de puja con una nueva página de destino y un resultado ganador no te dice nada reutilizable, porque no puedes atribuir la mejora a ninguno de los dos cambios.

¿Cómo configurar un experiment 50/50 válido?

Un experiment válido es sobre todo cuestión de disciplina en la configuración. Acierta la división, el momento y el aislamiento, y la lectura final es fiable; fállalos y ningún análisis salva el resultado.

La división 50/50 — Empieza con una división de tráfico pareja para que ambos brazos acumulen datos al mismo ritmo y alcancen la significancia juntos. Una división despareja — digamos 10/90 — protege el original pero priva de datos a la variante, así que probar cualquier cosa tarda mucho más.

Asignación basada en cookies — Usa una división basada en cookies en vez de una basada en búsqueda para que un usuario que vuelve vea siempre el mismo brazo. De lo contrario, la misma persona puede caer tanto en el control como en la variante, difuminando la comparación e inflando el ruido.

Todo lo demás igual — El draft debe coincidir con el original en presupuesto, segmentación, calendario y estructura. La única diferencia permitida es tu variable de prueba. Si la variante también tiene un presupuesto mayor o una geografía distinta, ya no estás midiendo lo que crees medir.

Cronometra el inicio — Lanza a comienzo de semana y planea correr semanas completas. Empezar a mitad de semana carga a un brazo con más tráfico de fin de semana que al otro al principio, lo que añade ruido evitable a la primera lectura.

¿Cuánto tráfico y tiempo necesitas para la significancia?

Aquí es donde la mayoría de los experiments fallan: se detienen demasiado pronto, con muy pocos datos, porque el panel se veía emocionante. La significancia es función de las conversiones y del tamaño del efecto, no de cuántos días han pasado.

Conversiones, no clics — La significancia la impulsan las conversiones por brazo, no las impresiones ni los clics. Un piso de trabajo aproximado son 100 conversiones por brazo; menos de 30 por brazo casi nunca es concluyente. Los clics se acumulan rápido y tientan a leer pronto, pero el conteo de conversiones es lo que realmente decide la prueba.

El tamaño del efecto fija el coste — Cuanto menor es la diferencia real, más datos necesitas para verla. Detectar un cambio del 30 por ciento puede requerir unos cientos de conversiones por brazo; detectar un cambio del 5 por ciento puede requerir miles. Decide de antemano qué tamaño de efecto vale la pena detectar y dimensiona la prueba para ello.

La mayoría de las pruebas necesitan de 2 a 4 semanas — En la práctica, acumular suficientes conversiones a lo largo de semanas completas sitúa a la mayoría de los experiments en una ventana de 2 a 4 semanas. Si tu cuenta solo produce de 20 a 40 conversiones por semana, acepta que solo puedes detectar de forma fiable efectos grandes, y diseña pruebas audaces en consecuencia.

No bajes el umbral por velocidad — Cuando el volumen es escaso, extiende la ventana en vez de declarar un ganador pronto. Una lectura rápida sobre una muestra pequeña suele ser una lectura falsa, y actuar sobre ella cuesta más que la espera.

¿Cómo leer los resultados sin engañarte a ti mismo?

La parte más difícil de probar no es la configuración — es resistir las historias que tu propio cerebro cuenta sobre los primeros datos. La mayoría de los falsos ganadores son autoinfligidos, creados por leer demasiado pronto y detener con demasiado entusiasmo.

Mirar crea falsos ganadores — Al principio, cada brazo tiene tan pocas conversiones que un día con suerte puede poner la variante 40 por ciento por delante. Si revisas a diario y detienes en cuanto se ve bien, fijarás el ruido como si fuera señal. Decide primero el tamaño de muestra, y luego ignora el panel hasta alcanzarlo.

Regresión a la media — Un brazo que se dispara pronto casi siempre deriva de vuelta hacia el valor verdadero a medida que se acumulan datos. La brecha dramática del principio es el número menos fiable de toda la prueba, y sin embargo es el que tienta a la gente a detenerse. Espera a que la brecha se estabilice.

El 95 por ciento es una puerta, no una meta — Trata el indicador de confianza del 95 por ciento como la barra mínima a superar, no un objetivo a celebrar. Superarlo significa que la diferencia es probablemente real; no superarlo significa que el resultado no está probado, lo cual no es lo mismo que un empate.

Juzga por la métrica correcta — Compara los brazos por coste por conversión y valor de conversión, no por clics ni CTR. Una variante puede ganar en interacción y aun así perder en la métrica de dinero que de verdad importa, así que ancla siempre la decisión en los resultados.

¿Cómo desplegar o revertir un experiment ganador?

Un resultado limpio solo es útil si lo aplicas con limpieza. El paso de despliegue es donde los equipos reintroducen ruido en silencio, ya sea revirtiendo demasiado rápido o reiniciando el aprendizaje que acaban de pagar.

Aplicar, no reconstruir — Cuando la variante gana, aplica el experiment para actualizar la campaña original en vez de recrearla desde cero. Aplicar conserva el historial y la señal cuando es posible; reconstruir tira el aprendizaje y fuerza un nuevo y costoso arranque.

Espera una breve caída de reaprendizaje — Aplicar un cambio, sobre todo de puja, puede disparar un breve periodo de aprendizaje mientras el algoritmo se reestabiliza. Planifica unos días tranquilos antes de que la victoria se muestre del todo en los números estables, y no edites en pánico durante ellos.

Descarta con limpieza en una derrota — Si la variante pierde o empata, termina el experiment y conserva el control intacto. Un empate es un resultado real: te dice que el cambio no ayudó, lo que te ahorra desplegar una no-mejora a toda tu cuenta.

Documenta cada resultado — Registra qué probaste, el tamaño de muestra y el resultado, ganado o perdido. Esto evita que tu equipo repita la misma prueba no concluyente dentro de tres meses y construye una biblioteca de a qué responde realmente tu cuenta. Para convertir diferencias de tasa brutas en impacto esperado sobre el ingreso antes de comprometerte, usa nuestra auditoría gratuita de 5 ejes junto con la calculadora de tasa de conversión.

La tabla de decisión de diseño de experiment

Usa esta tabla para elegir la prueba correcta, la división correcta y la lectura correcta para la situación que tienes delante. Está ordenada aproximadamente desde las decisiones de configuración hasta la disciplina de lectura de resultados.

No detengas un experiment el primer día que parece un ganador :

Al principio de una prueba cada brazo tiene solo un puñado de conversiones, así que un único día con suerte puede poner la variante 30 a 40 por ciento por delante antes de que la regresión a la media la arrastre de vuelta. Detener ahí fija el ruido como si fuera un resultado y despliega un cambio que no ayuda de verdad. Decide tu tamaño de muestra y duración mínima antes del lanzamiento, y luego ignora el panel hasta alcanzarlos. Un resultado que no ha superado la confianza del 95 por ciento no está probado, no es una victoria.

Cómo juntarlo todo

La disciplina de probar se compone: cada experiment limpio hace la siguiente decisión más barata y más segura. Las cuentas que mejoran más rápido no son las que más cambian, sino las que más prueban.

Prueba las grandes palancas — Gasta tu tráfico limitado en experiments de puja y de página de destino donde la palanca es real, y salta los ajustes cosméticos que de todos modos no pueden mover el CPA lo suficiente como para alcanzar la significancia. Pruebas audaces sobre poco volumen superan a pruebas sutiles que nunca podrás probar.

Protege la lectura — Dimensiona la muestra antes de empezar, corre semanas completas, deja que el Smart Bidding salga del aprendizaje, y sostén la barra del 95 por ciento incluso cuando una brecha temprana te tiente. Todo el valor de un experiment se destruye en el instante en que miras y detienes pronto.

Construye un hábito — Documenta cada prueba, ganada o perdida, para que tu cuenta acumule una biblioteca de cambios probados en vez de un montón de corazonadas no probadas. A lo largo de un año, un equipo que corre un experiment limpio cada quince días aprende más que uno que despliega diez ediciones a ciegas por semana.

Para encontrar las pruebas de mayor palanca en tu propia cuenta antes de pasar una semana probándolas, lanza la auditoría gratuita de 5 ejes de SteerAds, y luego dimensiona el impacto esperado de cualquier cambio de tasa con nuestra calculadora de tasa de conversión.

Sources

Fuentes oficiales consultadas para esta guía:

FAQ

¿Cómo funcionan realmente los experiments de Google Ads?

Un experiment divide el tráfico de una sola campaña en dos brazos que se ejecutan al mismo tiempo. Primero creas un draft, una copia aislada de la campaña original donde haces un único cambio, y luego promueves ese draft a un experiment con una división de tráfico, normalmente 50/50. A partir de ahí Google asigna aleatoriamente cada subasta elegible al control o a la variante, de modo que ambos brazos enfrentan la misma estacionalidad, competencia y audiencia. Como los dos brazos corren simultáneamente en vez de antes-y-después, aíslas el efecto de tu cambio del ruido ligado al tiempo. El panel del experiment muestra después las métricas de cada brazo lado a lado con indicadores de confianza.

¿Cuánto tiempo debe correr un experiment de Google Ads?

Déjalo correr hasta alcanzar la significancia estadística, no hasta una fecha fija, y nunca lo detengas el primer día con buen aspecto. En la práctica la mayoría de los experiments necesitan de 2 a 4 semanas porque necesitas suficientes conversiones por brazo, no solo suficientes clics. Un piso aproximado son unas 100 conversiones por brazo antes de confiar en un resultado, y menos de 30 por brazo casi nunca es concluyente. Corre siempre por semanas completas para que ambos brazos vean los mismos patrones de entre semana y fin de semana. Si el volumen es muy bajo, extiende la ventana en vez de bajar tu umbral, porque una lectura rápida sobre pocos datos suele ser una lectura falsa.

¿Qué puedo probar realmente en A/B dentro de Google Ads?

Las pruebas más limpias cambian exactamente una variable para que el resultado sea interpretable. Las cuatro pruebas de mayor valor son la estrategia de puja, como Maximize Conversions frente a Target CPA; la página de destino, enviando el brazo variante a otra URL; el texto del anuncio y los assets de RSA; y los cambios de audiencia o segmentación. Las pruebas de puja y de página de destino suelen mover más el CPA, por eso valen la espera. Evita agrupar varios cambios en un solo experiment — si cambias la estrategia de puja y la página de destino juntas y el CPA mejora, no puedes decir cuál lo hizo, así que no aprendes nada reutilizable.

¿Cuántas conversiones necesito para un resultado válido?

Depende del tamaño del efecto que quieras detectar, pero una regla práctica son al menos 100 conversiones por brazo para un efecto moderado y muchas más para captar uno pequeño. Detectar de forma fiable un cambio del 5 por ciento puede requerir miles de conversiones por brazo, mientras que un cambio del 30 por ciento aparece con unos cientos. Cuanto menor es la diferencia real, más datos necesitas para separarla del ruido aleatorio. Si tu cuenta solo produce de 20 a 40 conversiones por semana en total, acepta que solo puedes detectar efectos grandes, y diseña pruebas audaces en vez de ajustes sutiles.

¿Por qué los experiments muestran a menudo un falso ganador temprano?

Al principio de un experiment cada brazo tiene muy pocas conversiones, así que la variación aleatoria mueve los números bruscamente — un día con suerte puede poner la variante 40 por ciento por delante antes de que la regresión a la media la devuelva. Por eso mirar los resultados a diario y detener en cuanto un brazo se ve bien produce tan a menudo falsos ganadores. La solución es decidir tu tamaño de muestra y duración antes de empezar, y luego ignorar el panel hasta alcanzarlo. Trata el indicador de confianza del 95 por ciento como una puerta mínima, no una línea de meta, y recuerda que un resultado no significativo no es un empate — simplemente no está probado.

Experiment frente a cambiar directamente la campaña — ¿cuál es mejor?

Un experiment es una comparación controlada; un cambio directo es una apuesta a ciegas. Si simplemente editas la campaña en vivo y el CPA mejora la semana siguiente, no puedes probar que la edición lo causó, porque el clima, los competidores, la estacionalidad y tus otros cambios se movieron todos a la vez. El experiment mantiene esos elementos constantes corriendo ambas versiones simultáneamente. La contrapartida es que los experiments dividen tu volumen, así que cada brazo recibe la mitad de los datos y la significancia tarda más. Usa experiments para cualquier cambio lo bastante grande como para importar y lo bastante reversible como para probarlo — y despliega directamente las correcciones pequeñas y obviamente correctas.

¿Puedo correr un experiment de Google Ads sobre Smart Bidding?

Sí, y los experiments de puja están entre los más valiosos porque la estrategia de puja impulsa gran parte de tu CPA. Puedes comparar dos estrategias — por ejemplo Maximize Conversions frente a Target CPA — o la misma estrategia con dos objetivos distintos. La única precaución es el periodo de aprendizaje: cada brazo necesita tiempo para salir del aprendizaje antes de que sus números signifiquen algo, así que suma alrededor de una a dos semanas sobre tu ventana de significancia normal. No juzgues un experiment de puja mientras algún brazo siga aprendiendo, y evita grandes ediciones a mitad de vuelo que reinicien ese aprendizaje y contaminen la comparación.