BOLIVIA - ENCUESTA PRUEBA PILOTO DE USO DE TIEMPO DE LOS HOGARES 2010, Primera Prueba Piloto
ID del Estudio | INE-PPEUTH2010 |
Año | 2010 |
País | BOLIVIA |
Productor(es) | INSTITUTO NACIONAL DE ESTADÍSTICA - INE |
Financiamiento | UNITED NATIONS DEVELOPMENT FUND FOR WOMEN - UNIFEM - Financiamiento de la primera prueba piloto de la Encuesta de Uso de Tiempo de los Hogares |
Colección(es) | |
Metadatos | Documentación en PDF |
Creado el | Jan 09, 2015 |
Última modificación | Jan 09, 2015 |
Visitas a la página | 494405 |
Descargas | 7153 |
Procesamiento de datos
Edición de datos
El procesamiento de datos de la encuesta comprende:
1. Captura de datos
2. Digitación
3. Codificación
4. Consistencia de la información
5. Diseño base de datos
6. Validación
7. Arquitectura de la base de datos
8. Generación de cuadros de salida
9. Programación de tabulados
10. Acceso a la base de datos
1. CAPTURA DE DATOS
La captura de datos se la realizó de forma centralizada, ingresada mediante un programa inteligente que aplica criterios de consistencia y validación en línea.
El programa posee pantallas de entrada, similares a las boletas de campo, facilitando el ingreso de los datos. Además posee un módulo especial que impide la introducción de datos en variables equivocadamente.
La codificación de las variables es numérica, agrupada en tablas correspondientes a cada pregunta de la boleta, lo que permite su fácil identificación.
El ingreso de los datos se realiza por dominios, es decir, se agrupa por área urbana, por ciudades y área rural.
Durante el proceso de captura tiene lugar paralelamente el ingreso de los datos para el control de cobertura y poder generar los primeros resultados a medida que se cubre toda la totalidad de los dominios.
El programa permite además un control cuantitativo de los errores o inconsistencias más frecuentes por variable o en relación con ellas.
2. DIGITACIÓN
Se realizó la digitación de los cuestionarios y los diarios de actividades a razón de 8 cuestionarios diarios por persona y 16 formularios del diario de actividades por persona, midiéndose la producción y el avance procesado por dominio.
3. CODIFICACIÓN
La codificación se realizó una vez concluida la transcripción de datos, realizando la identificación numérica de las variables identificadas, es decir se utilizó el método de la codificación asistida, esta labor estuvo a cargo de los digitadores.
Hasta este momento no se realiza corrección alguna, pues es necesario al momento de generar la información inicial, verificar el trabajo de campo y comprobar los procesos de capacitación y levantamiento.
Los clasificadores que se utilizaron para la codificación fueron:
DESCRIPCION / CLASIFICADOR
BOLETA DE CARACTERÍSTICAS GENERALES DEL HOGAR
SECCION 4 - Parte B - Preg. 10 / CLASIFICACION DE SECTORES DE ESTUDIO
SECCION 5 - Parte A - Preg. 11a. / CLASIFICACIÓN DE OCUPACIONES DE BOLIVIA (COB - 2009)
SECCION 5 - Parte A - Preg. 13a / CLASIFICACIÓN DE ACTIVIDADES ECONÓMICAS DE BOLIVIA (CAEB - 05)
ANEXO
A1. PRODUCTOS O SERVICIOS / CLASIFICACIÓN DE PRODUCTOS POR ACTIVIDAD ECONÓMICA DE BOLIVIA (CPAEB-2005)
A1. UNIDAD DE MEDIDA / UNIDADES DE MEDIDA
A2. INSUMOS / CLASIFICACIÓN DE PRODUCTOS POR ACTIVIDAD ECONÓMICA DE BOLIVIA (CPAEB-2005)
A2. UNIDAD DE MEDIDA / UNIDADES DE MEDIDA
DIARIO DE ACTIVIDADES
ACTIVIDAD PRINCIPAL / CLASIFICACIÓN DE ACTIVIDADES DE USO DEL TIEMPO PARA BOLIVIA (CAUTBOL)
INSUMOS / CLASIFICACIÓN DE PRODUCTOS POR ACTIVIDAD ECONÓMICA DE BOLIVIA (CPAEB-2005)
ACTIVIDAD SECUNDARIA / CLASIFICACIÓN DE ACTIVIDADES DE USO DEL TIEMPO PARA BOLIVIA (CAUTBOL)
INSUMOS / CLASIFICACIÓN DE PRODUCTOS POR ACTIVIDAD ECONÓMICA DE BOLIVIA (CPAEB-2005)
LUGAR QUE SE ENCONTRABA / CLASIFICACION DE LUGARES DE COMPRA DE BOLIVIA
4. CONSISTENCIA DE LA INFORMACIÓN
La etapa más compleja y laboriosa del procesamiento de la información es sin duda la consistencia de los datos, la cual tiene como propósito garantizar la calidad de la información recolectada, mediante la revisión sistemática de cada una de las respuestas tanto de manera individual como en su relación con otras variables. Para efectuar este proceso, se deberán tomar como base las pautas de consistencia establecidas en el presente manual, a partir de las definiciones y las características intrínsecas de cada variable.
El proceso de consistencia de la información de la EUTH comprende 3 fases:
a. VERIFICACIÓN DE LA COBERTURA GEOGRÁFICA Y DE VIVIENDAS
La verificación de la cobertura geográfica y de viviendas permite establecer y reducir los problemas de delimitación geográfica o llegada a las viviendas establecidas por UPM. En función a los listados de viviendas llenados por los encuestadores (OC - 01 para área urbana y OC - 02 para área rural) y los planos de actualización cartográfica, los supervisores deben revisar en terreno que la información establecida en estos documentos corresponde a lo que efectivamente se observa en campo, validando las modificaciones en los planos y que todas las viviendas y hogares del segmento han sido capturados, sin omisiones.
b. VALIDACIÓN DE RANGOS Y ESTRUCTURA DE VARIABLES
El proceso de validación de rangos y estructura de variables, tiene como propósito establecer la validez individual de las respuestas captadas en cada pregunta. Cada pregunta tiene parámetros específicos que determinan si la información captada es válida. Estos parámetros se encuentran especificados en los cuadros de VALIDACIÓN DE RANGOS Y FORMATO DE VARIABLES del Manual de Consistencia, donde se describe el tipo de pregunta (abierta, cerrada), el tipo de variable (alfabética, numérica, alfanumérica), el rango permitido, el número de dígitos admitidos y otras observaciones adicionales.
c. RELACIONES ENTRE VARIABLES
La validación de la coherencia de variables válidas individualmente, es la tarea más compleja del proceso de consistencia de los datos de la EUTH. Para verificar la consistencia de todas las variables en conjunto, se deben verificar los flujos y las relaciones lineales. El control de los flujos permitirá verificar que las encuestas han sido aplicadas siguiendo las reglas establecidas en la fase de diseño de instrumentos. Los parámetros a seguir para esta fase se encuentran establecidos en los cuadros de NORMAS DE CONTROL DE FLUJO DE CAPTURA del Manual de Consistencia. La revisión de relaciones lineales establece la coherencia básica de las respuestas individuales, dentro de una misma sección o con variables de otras secciones. Los parámetros a seguir para este proceso se encuentran especificados en los cuadros de CONSISTENCIA DE RELACIONES LINEALES del Manual de Consistencia.
A partir de las tres fases del proceso de consistencia, se generarán listados de error con la finalidad de determinar el origen del error, distinguiendo entre errores de recolección de información sistemáticos y aleatorios y errores de transcripción. Los listados se constituirán en un soporte documental de los procesos de consistencia efectuados, permitiendo realizar una evaluación del desarrollo del trabajo de campo y de procesamiento posterior.
Una vez generados los listados de errores, los digitadores deben verificar que los errores no se deben a problemas de transcripción, comparando los archivos con las boletas físicas. Si se identifican errores de transcripción, estos deben ser reportados en un informe dirigido al supervisor del proceso de transcripción y consistencia (Supervisor de Validación), y posteriormente deben ser corregidos generando una nueva base de datos.
Es muy importante que cada fase del procesamiento de información dé lugar a una nueva base de datos, siendo obligatorio que todo cambio en los datos esté respaldado por un informe. El coordinador debe verificar a partir del informe emitido y la nueva base de datos que todos los errores de transcripción han sido subsanados, y que no existen más errores provenientes de esta fuente.
Todos los errores provenientes del trabajo de campo, deben ser señalados, especificando el encuestador y el supervisor responsables de las boletas observadas. El supervisor del proceso de transcripción y consistencia deberá generar estadísticas que reflejen situaciones recurrentes de error por parte de encuestadores o supervisores, permitiendo visibilizar y reducir al máximo el error sistemático en la información de la encuesta. Esta identificación temprana de errores recurrentes resulta fundamental, dadas las características de la EUTH como encuesta continua.
5. DISEÑO DE LA BASE DE DATOS
Se requiere un software que permita desarrollar un sistema inteligente de entrada de datos y de consistencia. Esto conllevó a pensar en la Tecnología Microsoft, que el Instituto Nacional de Estadística cuenta con un Sistema de Administración de Usuarios, Roles y Menús, y se utiliza para todos los sistemas que tiene implementados.
Las tecnologías de Software que se utilizaron fueron:
Microsoft Sql Server 2005 (Gestor de Base de Datos)
Visual Studio .NET 2010 (C# Lenguaje de programación.)
Siendo una de sus características la versatilidad que permite generar programas de entradas de datos, programas de consistencia y validación.
El software de entrada de datos está conformado por los siguientes módulos:
- Gestión de datos
Es el módulo donde tiene lugar la entrada de datos, como los archivos de control de cobertura, archivos maestros de muestra y todo lo relacionado con la digitación del cuestionario y el diario de actividades.
- Procesos administrativos
Donde se lleva el control de acceso a los usuarios, producciones y otros tipos de procesos.
- Depuración de datos
El programa cuenta con un mecanismo de validación almacenada en archivo de datos, lo que permite hacer cualquier tipo de validación en línea.
- Mantenimiento de parámetros
El programa de entrada necesita de ciertos parámetros que deben ser alimentadas por las diferentes unidades que comprende la dirección de la encuesta.
- Utilitarios
En este módulo se efectúa el manejo de diferentes opciones en caso de que ocurra un problema con el programa, por ejemplo, el respaldo de información.
6.VALIDACIÓN DE DATOS
Los datos son validados según matrices de comportamiento de variables, las imputaciones son efectuadas en variables creadas, pues el grado de imputación de la prueba piloto es bajo y solo se realiza para evaluar los resultados del comportamiento de algunas variables.
Si la respuesta no es significativa, esta se incluye en la presentación de los datos o se descarta la muestra. Todo cambio efectuado en la base de datos debe ser respaldado, dejando la base original sin alteraciones.
7. ARQUITECTURA DE LA BASE DE DATOS
La base de datos está conformada por las siguientes tablas:
- Hogares
- Personas
- Migración
- Acceso a servicios de salud
- Fecundidad
- Capacidades diferentes
- Educación
- Gastos en educación
- Condición de actividad
- Ocupación y actividad principal
- Ingresos
- Anexo
- Ingresos no laborables
- Gastos
- Equipamiento del hogar
- Diario de actividades
8. GENERACIÓN DE CUADROS DE SALIDA
Se generan cuadros de salida por dominio para observar las cifras preliminares y corregir el número de inconsistencia, buscando de esta manera tener el menor número de errores posibles, pensando en la elaboración de cuadros definitivos.
9. PROGRAMACIÓN DE TABULADOS
Para la generación de tabulados es necesario que estén integradas todas las variables para proceder a su generación en SPSS y luego se migraron a Microsoft Excel con dos propósitos:
- Validación cuantitativa de los diarios
- Presentación final de resultados
10. ACCESO A LA BASE DE DATOS
El acceso a la base de datos se encuentra temporalmente en la siguiente dirección:
Otros procesamientos
La organización y preparación del trabajo de campo inicia con la selección y capacitación del personal, para posteriormente realizar la encuesta en sí:
1. SELECCIÓN DEL PERSONAL
La selección de personal de campo para llevar adelante la Encuesta y la prueba piloto se realiza en dos etapas:
1ª etapa
El INE cuenta con un proceso de preselección curricular. El requisito principal es que los candidatos tengan un nivel de instrucción universitaria de las carreras económicas, financieras o administrativas.
2ª etapa
Los postulantes que pasaron la 1ª etapa, participan en un curso de capacitación organizado por el INE. A la conclusión de la capacitación se selecciona al personal de campo a través de evaluaciones teóricas y prácticas.
2. CAPACITACIÓN
La capacitación del personal se realiza en cascada, teniendo dos niveles:
- Instructores: Son las personas a quienes se les impartirá conceptos relacionados con el operativo de campo, el llenado de la boleta y los elementos metodológicos, para el desarrollo del curso de capacitación, y posteriormente puedan replicar los conocimientos adquiridos.
- Personas seleccionadas: Personas que califican el curso de capacitación para ser parte del personal de campo de la encuesta quienes fueron capacitadas por los instructores en forma teórica y práctica.
En la prueba piloto los instructores fueron los consultores, quienes se desplazaron a los diferentes departamentos para impartir la capacitación.
3. OPERATIVO DE CAMPO
Encuesta
***********
Para el operativo de campo se conformarán brigadas de trabajo compuestas por supervisores y encuestadores. La estrategia de trabajo a aplicarse prevé un procedimiento preliminar y otro de campo:
* Trabajos preliminares
- Ubicación de la UPM
- Preparación del material necesario
- Desplazamiento a la UPM correspondiente
- Entrevista con autoridades, portando una carta de presentación
* Fases de la estrategia:
- Combinación por semanas para la realización de la encuesta
- Realización del Listado de viviendas para la selección de Viviendas y distribución por combinación de días
- Entrevista directa a informante idóneo mayor o igual a 15 años de edad que sea integrante del hogar (Cuestionarios características generales del hogar)
- Llenado del diario de actividades por integrantes del hogar mayores a 7 años y recojo de los mismos.
Cada período de trabajo tendrá la siguiente duración:
* Área urbana: El período completo comprende 11 días, de los cuales 3 días están destinados a la realización del listado de viviendas y 8 días para el recojo de la información en hogares.
* Área rural: El período completo comprende 13 días, 2 días más que el urbano que son utilizados en el desplazamiento a las UPM designadas.
En cada fase se hace presente el supervisor o responsable departamental para garantizar que efectivamente las encuestas sean realizadas en los lugares seleccionados.
Se mantendrá permanente comunicación con las oficinas regionales quienes serán las encargadas de enviar los reportes de avance y los informes de verificación y supervisión. Asimismo consultarán a través de un banco de preguntas y respuestas los problemas técnicos que se presenten en el campo.
Prueba Piloto
****************
En la prueba piloto se conformaron brigadas compuestas por un supervisor y un encuestador para cada UPM. En el área rural la brigada se desplazó en vehículos del instituto, por lo que se contrató a un conductor.
La estrategia de trabajo fue la misma de la encuesta ya que se pretende probar su eficiencia.