Descripción general de los métodos de muestreo
El muestreo aleatorio simple selecciona unidades al azar con igual probabilidad. Es sencillo e insesgado, pero puede presentar una varianza alta en poblaciones heterogéneas y suele emplearse como referencia. El muestreo estratificado divide la población en estratos homogéneos y reduce la varianza respecto al MAS si los estratos están bien definidos, aunque requiere información previa y mayor complejidad. El muestreo sistemático selecciona unidades a intervalos regulares tras un inicio aleatorio; es fácil de aplicar y proporciona buena cobertura espacial, pero puede aumentar la varianza o introducir sesgo si existe periodicidad. El estimador por razón se usa cuando hay una variable auxiliar conocida y fuertemente correlacionada con la variable de interés; aunque es ligeramente sesgado, su esperanza es aproximadamente el valor real y su varianza es menor que la del muestreo aleatorio simple cuando la correlación entre variables es alta, siendo muy eficiente en inventarios forestales9.
Muestreo aleatorio simple (MAS), estratificado y por razón: características y ejemplos
El muestreo aleatorio simple (MAS) selecciona unidades con igual probabilidad y estima la media poblacional mediante la media muestral; su varianza depende de la varianza poblacional. Es simple e insesgado, pero poco eficiente en poblaciones heterogéneas (por ejemplo, parcelas forestales elegidas al azar). El muestreo estratificado divide la población en estratos homogéneos y estima la media como media ponderada de los estratos, reduciendo la varianza si los estratos están bien definidos; sin embargo, requiere información previa (por ejemplo, estratos por tipo de masa o edad del bosque).
El muestreo por razón emplea una variable auxiliar conocida y correlacionada, estimando la media ajustando la media muestral por una razón; tiene menor varianza que el MAS si la correlación es alta, aunque es sesgado (por ejemplo, volumen estimado a partir del diámetro). El muestreo por regresión también usa una variable auxiliar, estimando la media mediante un modelo lineal; suele ser insesgado y puede ser aún más eficiente que el muestreo por razón si la relación es lineal (por ejemplo, biomasa en función del área basimétrica).
En el MAS estrictamente aleatorio (sin reposición), el tamaño muestral necesario es menor que en el irrestrictamente aleatorio (con reposición) tanto para variables continuas como para proporciones, debido a la corrección por población finita. Ante una solicitud de muestreo con error absoluto ddd y nivel de significación α, la asignación del tamaño muestral es más eficiente en el muestreo estratificado (especialmente con la asignación óptima de Neyman) que en el MAS, ya que permite reducir la varianza total para un mismo tamaño muestral, lo cual es clave en inventarios de recursos naturales.
Muestreo por regresión y muestreo sistemático: precisión y condiciones
El muestreo de regresión utiliza una variable auxiliar fuertemente correlacionada con la variable de interés para ajustar la estimación mediante un modelo lineal. Su varianza es menor que la del MAS cuando la correlación entre variables es alta; es más eficiente cuanto mayor es el coeficiente de determinación. Si la relación es débil, no presenta ventajas frente al MAS.
El muestreo sistemático consiste en seleccionar una unidad inicial al azar y luego unidades a intervalos regulares. Ofrece buena cobertura espacial y, en términos de precisión, puede ser más preciso que el MAS cuando la población presenta una tendencia suave. La correlación intramuestral depende del orden de la población: es positiva cuando unidades cercanas son similares (lo que reduce la varianza) y negativa cuando existe una periodicidad desfavorable (lo que la aumenta); por ello, en ciertos casos puede introducir sesgo. Un ejemplo típico es la selección de parcelas forestales cada cierta distancia fija en un inventario de masas arboladas.
Poblaciones finitas y corrección por población finita
En poblaciones finitas, la varianza de la media por parcela en el muestreo sin reposición es igual a la varianza en el muestreo con reposición multiplicada por el factor de corrección por población finita (1 − n/N), lo que demuestra que el muestreo sin reposición es siempre más eficiente. Esta relación es útil en la práctica porque permite reducir el tamaño muestral necesario y mejorar la precisión; por ejemplo, en un inventario forestal donde se seleccionan parcelas sin volver a medir las mismas.
La varianza en el muestreo sistemático puede descomponerse en una componente entre conglomerados y otra dentro de conglomerados; la varianza de la media por parcela depende de la correlación intramuestral, siendo menor que la del MAS cuando dicha correlación es positiva y la población presenta una tendencia suave, e incluso mayor cuando existe periodicidad desfavorable. El coeficiente de correlación intramuestral mide la similitud entre unidades cercanas y determina la eficiencia del diseño. En comparación con el MAS, el muestreo sistemático suele ser más preciso en inventarios de recursos naturales bien distribuidos espacialmente, aunque existe el riesgo de aumento de varianza si el orden de la población no es adecuado.
Resumen de ventajas y limitaciones
- Muestreo aleatorio simple: fácil, insesgado; ineficiente en poblaciones heterogéneas.
- Muestreo estratificado: menor varianza si los estratos son adecuados; requiere información previa y mayor complejidad.
- Muestreo por razón: eficiente con alta correlación con la variable auxiliar; ligeramente sesgado.
- Muestreo por regresión: muy eficiente si la relación es lineal; suele ser insesgado.
- Muestreo sistemático: buena cobertura espacial; sensible a la periodicidad y al orden de la población.
Notas finales
La elección del diseño muestral depende del objetivo del inventario, de la heterogeneidad espacial y de la disponibilidad de información auxiliar. En inventarios forestales y de recursos naturales, la combinación adecuada de métodos (por ejemplo, estratificación con estimadores auxiliares) y la consideración de la corrección por población finita pueden mejorar considerablemente la precisión y eficiencia del muestreo.
