El miércoles de la semana pasada Claudia Sheinbaum ganó las encuestas para ser la candidata presidencial de Morena y aliados en las elecciones de 2024. Aún así, ese ejercicio de selección sigue dando de qué hablar. El fin de semana la secretaria general de Morena, Citlalli Hernández, habló sobre los resultados y provocó una polémica. En su explicación mencionó que en el ejercicio los votos no valían lo mismo: “si la boleta la llenó un joven de la sierra de Guerrero valdría distinto a una mujer empresaria de las Lomas”. En su explicación utiliza el concepto de ponderación, con el cual da a entender de manera errónea que la opinión de una persona es más relevante que la de otra. Hay toda una teoría y muchos estudios que avalan y explican la ponderación en encuestas, pero aquí daré una explicación sencilla del concepto y de su uso en ejercicios demoscópicos.
Un ponderador es un número que se utiliza para cambiar el peso o relevancia de otra cantidad. En estadística, especialmente en muestreo, la ponderación es una herramienta que se aplica para que los resultados o estimaciones sean más confiables, ya que permite tener una muestra más sólida en aspectos de representatividad, características y de respuesta.
La ponderación sirve para corregir y ajustar los resultados de una encuesta, según diferentes tipos de ponderación requerida. Algunos de ellos son por diseño muestral, por ajuste poblacional, por el fenómeno de la no respuesta, por cobertura, etcétera.
Para explicarlo más claro, consideremos el siguiente ejemplo: si eligiéramos aleatoriamente a 100 personas mexicanas de cada estado de la república y nos dijeran su color favorito, podríamos identificar a nivel nacional qué color es el de mayor preferencia. Pero para ello debemos considerar algunos detalles que surgen en nuestro diseño de muestra.
Hay dos tipos de ponderación que son los más utilizados.
1. Ponderación por diseño muestral
Este ponderador corresponde básicamente a cuántas personas de la población representa cada persona de la muestra; depende del diseño y sus características. En nuestro ejemplo, nuestra muestra está tomada de forma equitativa entre todos los estados (100 personas por estado). La realidad, sin embargo, es que cada estado tiene un tamaño diferente de población, por lo que hay que ajustar el “peso” que tienen las personas de Aguascalientes comparado con el “peso” que tienen las del Estado de México. Cada persona representa un número diferente de personas entre estados por lo que entre la muestra hay que ajustar mediante ponderación estas proporciones de la población.
2. Post-estratificación o ponderación por ajuste poblacional
Hay algunas características de la población que son conocidas, o al menos identificadas y cuantificadas en cierto momento. Por ejemplo: la proporción de hombres y mujeres, la proporción de grupos de edad, el nivel máximo de escolaridad, entre otros. Todos estos los obtienen instituciones como el INE o el INEGI. La post-estratificación se utiliza para “asegurar” o replicar que las características de la muestra sean lo más parecidas a las de la población objetivo.
Si volvemos a nuestro ejemplo, hemos ponderado ya conforme al tamaño de cada estado, pero ahora identificamos por ejemplo que la proporción entre mujeres y hombres es del 54 % y 46 % respectivamente en nuestra muestra. Dado que a nivel nacional sabemos que la distribución de sexo es 51 % y 49 % para mujeres y hombres respectivamente, entonces requerimos otra intervención de ponderación. Además, deberíamos considerar también esta distribución vista desde cada estado y con ello tenemos un mejor ponderador. Otras variables comúnmente utilizadas son grupos de edad, nivel de escolaridad, nivel socioeconómico, acceso a internet, por ejemplo, entre otros.
Entendido así, queda claro entonces que, en un caso como el de nuestro ejemplo, no es que la opinión de una mujer en Aguascalientes valga menos que la de un hombre del Estado de México. Más bien se trata de que dadas las características de la muestra necesitamos ajustar los pesos que cada una de estas personas tienen respecto a la población estudiada.
La ponderación en una muestra siempre es considerada de diversas maneras como hemos mencionado. En algunos casos es utilizada debido a ciertas complicaciones durante el levantamiento de la encuesta y en otras solo por el diseño propio de la muestra que se utiliza, pero su propósito siempre es (o debería ser) la mejora de los resultados obtenidos.
Como he insistido en muchos casos anteriores, la transparencia metodológica es una necesidad clara en este tipo de ejercicios. Muchos de los malentendidos, de las cuestiones de incertidumbre y de las dudas que genera el uso de términos o las explicaciones posteriores se eliminan gracias a la transparencia. Si se hubiese explicado claramente cuáles eran los ponderadores que se emplearían así como el modo en el que se aplicarían, esta polémica se habría podido evitar.