Tres momentos de las encuestas: muestreo, consistencia y ponderación

Por Federico Irazabal

Durante una campaña electoral se elaboran y comercializan una infinidad de productos: gorros, camisetas, pasacalles, volantes, globos, y también encuestas. Estas últimas tienen una lógica de consumo diferente del resto de los productos, ya que muchas veces son manejadas internamente, aunque se distribuyen con la misma intensidad que el resto del merchandising político. También, el público en general las consume de manera entusiasta, y muchas veces, al igual que los políticos, con el mismo error de apreciación sobre su verdadera utilidad.

La encuesta es una de las técnicas que se utilizan en la investigación electoral, y no posee un objetivo predictivo, sino de diagnóstico. Es una fotografía del estado de la opinión pública respecto de un tema en un momento particular. Ello supone que si las condiciones en las que la información es recogida cambian, pueda cambiar la apreciación de la opinión pública sobre el asunto. Sin embargo, la visión que prevalece sobre su aplicación en el ámbito electoral es similar a la de una carrera de caballos. Ciudadanos, medios de comunicación y políticos, presentan sus resultados como simulaciones de ubicación dentro de la oferta, haciendo una suerte de pronóstico sobre quién gana y quién pierde.

Como herramienta de diagnóstico, la principal fortaleza que presentan las encuestas es la representatividad. Y más que en la representatividad (porque cualquier técnica de investigación representa efectivamente a una población), la fortaleza reside en la capacidad de trasladar resultados obtenidos en una muestra a un universo, con un cálculo respecto de cuán alejados están los resultados de la muestra de los que se encuentran en el universo.

Esa transposición es posible solo si en la elaboración y aplicación de la encuesta se toman recaudos en tres momentos clave: al definir quiénes serán los sujetos de investigación, y dentro de ellos seleccionarlos adecuadamente; al elaborar el instrumento, generalmente un formulario; y al procesar los resultados, corrigiendo posibles sesgos de la muestra.

Vayamos entonces al primer momento. Como se dijo antes, una encuesta representa a través de una porción del universo denominada muestra, al total de ese universo. Así como cuando a una persona se le extrae sangre para conocer su estado de salud no se le extrae la totalidad de sangre de su cuerpo, cuando queremos conocer la opinión de un determinado público no es necesario recoger la opinión de todos los individuos que integran ese público. Pero a diferencia de nuestra sangre, que posee una estructura homogénea y todas las gotas son idénticas, las personas poseen diferentes características que otorgan un carácter heterogéneo al universo. Por ello, es necesario definir, en primer lugar, el número de casos que van a conformar nuestra muestra, y en segundo orden, si vamos a confiar en el azar para conformar esa muestra, o si vamos a definir cuotas de participación para los diferentes segmentos que se establezcan. Definir una muestra requiere una serie de procedimientos estadísticos, pero antes que nada debemos conocer el tamaño de ese universo para definir cuántos individuos compondrán esa muestra, también de acuerdo al margen de error que estemos dispuestos a aceptar (es decir, que si todo sale bien en la selección, cuántos puntos por encima o por debajo de lo que sucede en el universo, pueden estar los resultados de nuestra encuesta para tomarlos como válidos).

Cuanto más grande sea la muestra, menor será el margen de error. Pero justamente el valor de la encuesta es poder dar resultados del total, apelando al menor número de casos posible. El tamaño de la muestra dependerá de la heterogeneidad del universo, y de cuánto de esa heterogeneidad nos interese representar. Si, por ejemplo, deseo conocer el estado de la opinión pública respecto de la intención de voto a un partido o candidato, para un universo de cinco millones de habitantes, y estoy dispuesto a aceptar un margen de error de tres puntos porcentuales, con unas 1.060 encuestas voy a tener una idea cierta. Aquí, como en la novelas de Paul Auster, el azar juega un papel fundamental, ya que confiaré en un procedimiento aleatorio de selección de individuos para conformar mi muestra. Sin embargo, retomando el segundo punto planteado en el párrafo anterior, si deseo saber cómo es esa intención de voto por sexo, o por edad, o cualquier otra variable que segmente al universo, debo primero conocer la distribución de cada variable a partir de la que quiero segmentar en el universo, para definir, por ejemplo, cuántas mujeres y cuantos hombres necesito, o qué cantidad de jóvenes, adultos, o adultos mayores compondrán cada segmento de mi muestra, o cualquier otra variable en la que me interese diferenciar los resultados. El tamaño de mi muestra entonces, deberá aumentar, porque cada segmento debería tener su propia submuestra. Por eso es que cuanto más precisa sea la información que requiramos, más cara va a ser nuestra encuesta. En cualquiera de los dos casos expuestos, hay un elemento clave para la calidad de la muestra, que tiene que ver con que cada individuo del universo debe contar con la misma probabilidad de ser encuestada. Este factor es determinante en la calidad del tipo de encuesta que se utilice. Una encuesta telefónica es representativa de los individuos que tienen acceso a un teléfono, porque quienes no lo tengan, tienen una probabilidad equivalente a cero de ser encuestados. Lo mismo sucede con las redes sociales, con el agravante de que no conocemos (como sí sucede con las encuestas domiciliarias, por ejemplo), las características de aquellos que no responden.

Una vez definido el “quiénes”, es importante tener en cuenta el “qué”. La encuesta es una técnica de investigación que utiliza un formulario como instrumento de relevamiento. Ese formulario, a efectos de mantener la mayor objetividad posible de las respuestas, utiliza generalmente preguntas cerradas. Una pregunta cerrada es aquella que ya tiene una serie de opciones de respuestas predefinidas, que se le presentan o no al entrevistado. Por ello es fundamental una adecuada redacción de las preguntas que permita una correcta interpretación del entrevistado acerca de lo que se le está preguntando. Es importante no introducir juicios o términos que hagan que el entrevistado no se sienta cómodo para dar su verdadera opinión al respecto. Pero también debe existir una correspondencia entre lo que se pregunta y el resultado que se muestra. Uno de los errores más comunes es preguntar al entrevistado por la simpatía o aceptación de una determinada figura pública, y al presentar los datos, se presenta esa simpatía o aceptación como intención de voto. Un candidato puede despertar en un individuo sentimientos positivos, pero no por ello este se debe sentir inclinado a votarlo. Lamentablemente, el mencionado espíritu de la carrera de caballos hace que muchos equipos de campaña presenten de manera tendenciosa esos resultados, buscando el objetivo (nunca demostrado empíricamente) de que las encuestas muevan la voluntad del electorado. El mejor antídoto ante este problema, es buscar en la ficha técnica que debiera publicarse en cualquier encuesta seria, la o las preguntas que se hicieron para obtener determinados resultados.

Finalmente, como todo producto, las encuestas presentan defectos en su proceso. Como se señaló antes, esos defectos pueden deberse a una inadecuada selección de los participantes, que no represente debidamente al universo, o a una incorrecta correspondencia de los indicadores con los resultados buscados. Pero también, en la etapa de procesamiento hay que tener en cuenta que pueden existir errores al no dimensionar adecuadamente el peso que cada individuo tiene para representar un segmento. Como en todos los órdenes, existen en la distribución de los casos de las encuestas, “casos raros”, comúnmente llamados outliers. Son observaciones extremas que afectan la distribución. Para evitar esa sobrerrepresentación, o corregir otros errores una vez recogida la información de la muestra, se realiza un procedimiento conocido como ponderación. Esto significa intentar dar a cada caso su real valor dentro de la distribución de datos. Por ejemplo: si en el universo sé que tengo un 12% de población entre los 22 y los 30 años, pero el total de respuestas de personas en esa franja etaria no es equivalente, asigno un coeficiente de ponderación a las respuestas obtenidas en los individuos de ese segmento, para emparejar su representatividad. Los errores muestras son muy frecuentes, sobre todo cuando trabajamos con encuestas por muestreo aleatorio.

Por supuesto que cualquiera es libre de hacer y de creer en las encuestas que quiera, pero es bueno saber que no todas son lo mismo. Muchas veces, por causa de alguno de estos (o todos) estos asuntos, las encuestas son criticadas y desestimadas como herramienta de diagnóstico. Estos tres apuntes tienen como objetivo guiar a contratantes y consumidores para valorar mejor la información que dan y reciben, haciendo uso de una herramienta de investigación muy efectiva.

Federico Irazabal (Uruguay) es sociólogo; consultor en comunicación política; especialista en opinión pública, sistemas electorales y planificación de campañas. Consultor del programa Partidos Políticos y Democracia en América Latina (Konrad Adenauer Stiftung). Participó en procesos electorales y de capacitación en Uruguay, México, Chile y Panamá.
Twitter: @fede_irazabal
Instagram: @fede_irazabal

Tres momentos de las encuestas: muestreo, consistencia y ponderación

El cambio sigue en República Dominicana

Campaña digital en México: La continuidad como relato

México, las elecciones en medio de la violencia

Elecciones México 2024. Después del tsunami, ¿qué?

El cambio sigue en República Dominicana

Campaña digital en México: La continuidad como relato

México, las elecciones en medio de la violencia