Bolivia - ENCUESTA TRIMESTRAL DE EMPLEO, Trimestre III-2010
ID del Estudio | IDD-BOL-INE-ETE-III-2010 |
Año | 2008 |
País | Bolivia |
Productor(es) | Unidad de Estadísticas e Indicadores Sociales - Instituto Nacional de Estadística |
Financiamiento | Baskest Fund - BF - Financiamiento de la Operación estadística |
Colección(es) | |
Metadatos | Documentación en PDF |
Creado el | Jan 07, 2015 |
Última modificación | Jan 07, 2015 |
Visitas a la página | 118286 |
Descargas | 0 |
Muestreo
Procedimiento de muestreo
DISEÑO MUESTRAL DE LA ENCUESTA TRIMESTRAL DE EMPLEO 2010
Tamaño de la Muestra: El tamaño de la muestra para la Encuesta Trimestral de Empleo es de 8.532 viviendas, equivalentes a 948 (UPM), distribuidas en los 9 departamentos del país. Los tamaños de muestra fueron calculados en base a la variable: tasa de desempleo; datos que fueron tomados de la Encuesta de Hogares MECOVI 2003 - 2004.
Distribución del Panel: Las Encuestas pueden ser puntuales cuando se desarrollan en un momento específico del tiempo (mes, año, etc.) pero también pueden ser continuos cuando el levantamiento de la información, se hace todo el tiempo (365 días del año). Asimismo, en una encuesta continua puede repetirse un porcentaje o la totalidad de la muestra a la que se llega, formando paneles de datos. La ETE es una encuesta con distribución de panel con rotación parcial y un máximo de cuatro visitas, no consecutivas, sino con un lapso de dos trimestres.
El marco muestral para la Encuesta Trimestral de Empleo se construyó en base al Censo de Nacional de Población y Vivienda de 5 de septiembre de 2001 que facilitó la construcción de un marco de áreas, integrado por mapas y planos a diferentes escalas y una base de datos con la división geográfica, política, administrativa y estadística teniendo en el marco muestral un total de 9.275 áreas geográficas, denominadas unidades primarias de muestreo (UPM).
El marco muestral está conformado por un listado de viviendas particulares: ocupadas y desocupadas de área urbana, las cuales están clasificadas mediante el orden de jerarquía de los identificadores censales.
Las Unidades Primarias de Muestreo (UPM) están conformadas, bajo los siguientes criterios:
- La UPM esta constituida generalmente por un sector censal, pero existe UPM con dos o tres sectores censales.
- Una UPM con un mínimo de 40 viviendas.
- Una UPM con un máximo de 284 viviendas
De acuerdo a los objetivos de la investigación:
- La unidad de muestreo en su última etapa es la vivienda
- La unidad de observación es el hogar (puede haber más de un hogar bajo un mismo techo)
- La unidad de análisis es la población residente en las viviendas seleccionadas
TIPO DE MUESTREO
El tipo de muestreo es probabilístico, estratificado, por conglomerado y bietápico. En cada estrato se obtendrá una muestra independiente que lo representará.
Probabilístico
Porque la probabilidad de inclusión de las unidades de muestreo, es decir las viviendas, tienen una probabilidad conocida y distinta de cero de ser seleccionadas, y por lo tanto la probabilidad de selección para cada miembro de la población es también distinta de cero.
Estratificado
Decimos que es estratificado, por que las unidades primarias de muestreo (UPM) con características geográficas y poblacionales similares, son agrupadas en estratos.
Bietápico
Esto es porque la vivienda (unidad última de muestreo) es seleccionada de una UPM, la cual fue anteriormente seleccionada de algún estrato. Por lo tanto llegamos a la unidad última de muestreo en dos etapas.
PRIMERA ETAPA: La unidad primaria de muestreo es la UPM
SEGUNDA ETAPA: La unidad secundaria de muestreo (USM) es la vivienda
Un proceso adicional que se realizó en la selección de la muestra es la adición de una etapa para las UPMs que se encuentran en zonas periurbanas, puesto que la extensión geográfica de estas son amplias y difícil de cubrir en el tiempo estipulado con la carga de trabajo dado, es por eso que en esas pocas UPMs el muestreo es trietápico.
Por conglomerados
Es un muestreo por conglomerados ya que las unidades primarias de muestreo son conjuntos de otras unidades muestrales (viviendas) delimitadas.
ESTRATIFICACIÓN
La estratificación divide las unidades de la población en mutuamente excluyentes y grupos colectivamente exhaustivos llamados también estratos, de donde se selccionan las muestras separadas de cada uno de los ellos.
Otros beneficios de estratificación incluyen:
La conveniencia administrativa y flexibilidad además de garantizar la representación de dominios más importantes y las subpoblaciones especiales.
+ ESTRATIFICACIÓN EXPLÍCITA
En muchas ocasiones, una sencilla estratificación geográfica proporciona una un medio eficaz para mejorar la eficiencia de la muestra.
En una primera etapa se tiene una estratificación geográfica (Sucre, La Paz, Cochabamba, Oruro, Potosí, Tarija, Santa Cruz, Trinidad y Cobija) teniendo así un total de 9 estratos geográficos en el marco muestral. Posteriormente si asumimos que el desempleo está correlacionado con el nivel de educación de los individuos entonces las UPMs se someten a un nuevo procedimiento de estratificación propia que emplea la variable nivel de educación de los jefes de hogar que habitan en las viviendas dentro de la UPM, la que se clasifica en dos grupos: Con educación superior y sin educación superior. Ambos criterios combinan y se logra un total de 18 estratos explícitos.
+ ESTRATIFICACIÓN IMPLÍCITA
Dentro de cada estrato explícito, una técnica conocida como la estratificación implícita se utiliza a menudo en las UPMs antes de la seleccionar la muestra, donde se ordenan las UPMs al interior de los estratos explícitos con respecto a uno o más variables que están altamente correlacionados con las variables de interés, y están disponibles para cada UPM en el estrato.
Para el caso de la encuesta Trimestral de empleo, se utiliza como estratificación implícita a los estratos por pobreza que se utilizó en la Encuesta a Hogares 2008 donde se divide el marco muestral en cinco estratos de pobreza.
En la ECH 2008 abandona el procedimiento de estratificación basada en las necesidades básicas insatisfechas (NBI) debido a las deficiencias de dicho indicador para expresar el bienestar, toda vez que los componentes de este índice atribuyen un peso arbitrario a los componentes como vivienda, educación, atención de salud y disponibilidad de servicios básicos. En reemplazo de dicho índice, el diseño construyó una variable de bienestar con la información proveniente de encuestas de hogares anteriores, específicamente las de 2000 a 2002.
Se considera que la distribución del bienestar de los hogares está expresada en el agregado de consumo de los hogares, éste se define como el gasto y las adquisiciones de alimentos, gastos en vestimenta, transporte, servicios básicos, educación, salud, recreación y otros. También incluye los servicios de la vivienda, el alquiler imputado de los propietarios por el uso de la vivienda propia y una estimación del flujo de gastos de bienes durables. La observación del agregado del consumo familiar per capita permite la construcción de un modelo predictivo, basado en variables que son observables tanto en las encuestas de hogares como también en el censo de población y vivienda de 2001."(encuesta a hogares 2008)
Una ves aplicado este método de estratificación, al final se cuentan con 5 estratos: h=1,2,3,4,5 donde la más alta severidad de pobreza corresponde al estrato 1 y así respectivamente. Pero en las ciudades capitales solamente se encuentran 4 de los cinco estratos, ya que el estrato categorizado como el más pobre está en el área rural, y no es parte de la cobertura de la encuesta.
ESQUEMA DE ROTACIÓN DE LA MUESTRA
La tasa de no respuesta de las viviendas puede reducirse mediante la rotación periódica de la muestra. Sin embargo, las unidades de rotación incrementan el costo de la encuesta debido al mantenimiento de la muestra adicional, posible capacitación adicional de entrevistadores (personal de trabajo de campo), los costos extras de la recolección inicial de la información básica y dificultades en el entrenamiento de nuevas unidades para proporcionar los datos.
La rotación parcial de unidades seleccionados a alguna tasa fija se emprende como un compromiso entre la rotación total, es decir 100% de las unidades que son muy caros y dan estimaciones pobres de cambio y ninguna rotación en absoluto (panel) producirían una distribución inaceptable de tasa de respuesta.
La ETE es una encuesta por panel con una rotación parcial, la cual se refiere a un procedimiento donde las viviendas como unidad de selección (las unidades de estudio son los individuos) en la muestra son incluidos en la encuesta varias veces, pero limitado el número de ocasiones.
La construcción del esquema de rotación es 2 - (2) - 2, esto es que ¾ de la muestra se traslapa y 1/4 de la muestra se reemplaza con nuevas viviendas en la muestra. Esto significa que cada vivienda de la muestra es incluida en la encuesta un total de cuatro veces. Este esquema de rotación permite lo siguiente:
· Se obtienen las correlaciones positivas entre los cuatro trimestres (12 meses) de la encuesta separadamente. Esto es posible a un costo dado para obtener estimaciones de diferencias (estimadores trimestrales, semestral y los cambios anuales) con la mejor precisión que habría sido en otro caso sin un sistema rotación de la muestra. El diseño muestral de ETE prioriza las estimaciones de promedios trimestrales y estimación de cambio entre los trimestres adyacentes.
· Comparaciones de valores de variables de las diferentes encuestas por ocasiones, para cada individuo en la muestra común y así la posibilidad de estimar los cambios brutos entre dos períodos puntuales.
Para este propósito fue aplicado el modelo de rotación 2 - (2) - 2. Las viviendas serán entrevistados dos trimestres consecutivos, será omitido por dos trimestres e incluido otra vez por un período de 2 trimestres.
Las ventajas más importantes de una muestra de rotación son:
a) Posibilidad de estimar cambios (entre rondas de la encuesta) con mayor precisión, utilizando la correlación entre rondas.
b) Reducción del trabajo del campo, puesto que la actualización y listado de viviendas reduce a partir de la segunda ronda.
Las desventajas son:
c) La estimación de agregados (por ejemplo un promedio o un total anual) es menos precisa a comparación de obtenerla con muestras independientes.
d) Los participantes se cansan y no permanecen en la muestra todo el tiempo previsto, lo que significa que se pierde una parte de las ventajas.
ASIGNACIÓN DE LA MUESTRA A PANELES
+ Paneles Balanceados
Para la primera ronda se selecciona una muestra de UPMs como cualquier muestra independiente. Inicialmente se selecciona las UPMs con probabilidad proporcional al tamaño en cada estrato (ppt; el tamaño es el número de viviendas en cada UPM).
Asumiendo que queremos una tasa de rotación de 25%, la muestra debe ser dividida en cuatro paneles. Por eso, cada UPM seleccionada será asignada a uno de los paneles P11,..., P14. Esto se realiza con una lista de las UPMs seleccionadas en orden de los estratos. Empezando con un panel aleatorio (por ejemplo P3), la primera UPM de la lista es asignada a P3, la segunda UPM a P4, la tercera a P1, etc. En un estrato nuevo, se continúa con la secuencia. El número del panel debe ser incluido en la lista de las UPMs de la muestra.
Para la segunda ronda, se precisa sólo el panel P15, que debe sustituir al panel P14. Los otros paneles, con todas las UPMs y viviendas que contengan, permanecen en la muestra. El número de UPMs en P15 y la distribución por estratos es completamente determinado por P14. Basta seleccionar siempre con ppt el mismo número de UPMs, en los mismos estratos.
Se precisó establecer algunas reglas de reselección. Por ejemplo, se puede estipular que la reselección de una UPM que sale con P11, sea permisible solamente después de 1 año.
No se debe permitir que una UPM entre en dos o más paneles que son usados simultáneamente. Entonces, en la selección de P15, las UPMs de P12-P14 no serían permisibles.
En esta encuesta trimestral, será conveniente seleccionar todos los paneles necesarios durante un año, a decir cuatro paneles, simultáneamente en una sola operación. En este caso se propone que todas las UPMs seleccionadas sean diferentes (sin reposición). Con esta regla, la reselección de una UPM será posible solo después de un año.
DISTRIBUCIÓN DE LA MUESTRA EN EL TIEMPO
- Las áreas seleccionadas se distribuyen a lo largo de 12 semanas del trimestre de manera que haya una cantidad similar de áreas por semana.
- Cada área tiene asignada una semana de referencia dentro del trimestre. Esta semana es la misma para todos los trimestres y también para los años.
- En cada trimestre se toma solamente 12 semanas de referencia, de modo que la semana 13 quede libre para poder realizar algunos ajustes o algunas encuestas pendientes de la semana 12.
+ Solapamiento
El solapamiento en la encuesta continua sigue el siguiente esquema:
- Entre un trimestre y el siguiente existe un 50% de muestra en común, encuestas en los mismos meses y semanas de esos trimestres.
- Entre un trimestre y el mismo del año siguiente existe un 50% de muestra en común.
- Entre un trimestre y otro separados por un trimestre intermedio, no existe muestra en común.
- Entre un trimestre y otro separados por dos trimestres intermedios, existe un 25% muestra en común.
- Entre un semestre y el siguiente existe un 37% de muestra en común.
+ Estimadores
Los estimadores a obtenerse son los estimadores lineales tales como la media, el total, proporción y tasas. Para los dos últimos se utilizarán estimadores de razón.
Para cada uno de los casos, se debe determinar su variabilidad y el correspondiente error de muestreo para facilitar la determinación del grado de significancia del indicador. El error muestral calculado es el coeficiente de variación, que permite obtener un indicador del error medido en porcentaje.
Por lo tanto, una vez que los datos estén expandidos se procederá al cálculo de los estimadores y sus respectivos errores muestrales.
+ Estimación del error muestral
El método para la estimación de la varianza que se utilizó, es la técnica de replicaciones Jacknife, la que consiste en replicar k submuestras hasta obtener la distribución de la varianza.
ACTUALIZACIÓN DEL MARCO DE VIVIENDAS
La actualización del marco muestral de la Encuesta Trimestral de Empleo ETE se actualiza constantemente debido a la continuidad de la encuesta y que los datos del marco muestral pueden estar obsoletos por tratarse del Censo de Población y Vivienda 2001.
La actualización se lleva a cabo de la siguiente manera:
+ Actualización debido a la rotación de la muestra
· Se lleva cabo cada trimestre y se actualiza solo la cuarta parte de las UPMs que corresponden a las UPMs nuevas en la muestra.
· La actualización de las UPMs consiste en un listado de viviendas que contiene en la actualidad cada una de ellas, para luego reemplazar este dato en los factores de expansión.
+ Actualización de la cartografía
La cartografía se actualiza en las siguientes situaciones:
· Se fusionan manzanas
· Existe creación de nuevas manzanas
· Aparece apertura o cierre de calles
· Se presentan cambios de rasgos físicos
Desviaciones del diseño muestral
De las unidades efectivamente encuestadas respecto de la muestra seleccionada para la ETE-2010, se miden las desviaciones de los datos con respecto a la Media Muestral. Su aplicación a la encuesta parte del cálculo de la varianza del Indicador Tasa de Desempleo (8.1%), permitiendo un error al rededor de 7.4%.
Las desviaciones importantes en el diseño muestral se deben principalmente a que el informante no siempre se encontraba disponible a la entrevista, debido a que la construcción del esquema de rotación es 2 - (2) - 2, esto es que ¾ de la muestra se traslapa y 1/4 de la muestra se reemplaza con nuevas viviendas en la muestra. Esto significa que cada vivienda de la muestra es incluida en la encuesta un total de cuatro veces y se debía revisitar a un hogar en cuatro momentos diferentes de tiempo en el periodo de un año.
Tasa de respuesta
La Tasa de No Respuesta (TNR) es el porcentaje de las unidades de información que no provee información. En la ETE la TNR se calcula siguiendo el procedimiento normal, basado en la información falante no proporcionada y manteniendo el mismo esquema de encuestas anteriores. La TNR calculada está al rededor del 16% en promedio.
Expansores / Ponderadores
PROBABILIDADES DE SELECCIÓN Y FACTORES DE EXPANSIÓN
Dentro de cada UPM cualquier vivienda particular tiene la misma probabilidad de ser seleccionada, es decir, se tendrá muestras autoponderadas al interior de cada UPM. Sin embargo, las UPM se seleccionan con probabilidad proporcional a su tamaño.
Entonces los factores de expansión para las viviendas se calculan con la inversa de la probabilidad con la que fue seleccionada cada vivienda.
Los ajustes realizados a los factores de expansión vienen dados por los siguientes:
- Ajuste por No Respuesta: Una vez obtenidos los factores de expansión, se realiza un ajuste por no respuesta. Para ver fórmula referirse al documento "Diseño Muestral Final.doc" anexo en los Materiales de Referencia Externos.
- Ajuste por Proyección de la Población: Los factores ajustados por no respuesta se corrigen, a fin de asegurar que en cada UPM se obtenga la población total determinada por la proyección de población generada por el INE referida al punto medio del levantamiento
Para mayor detalle referirse al documento "Diseño Muestral Final.doc" anexo en los Materiales de Referencia Externos.