{"id":43797,"date":"2017-06-16T05:00:27","date_gmt":"2017-06-16T12:00:27","guid":{"rendered":"https:\/\/www.questionpro.com\/blog\/?p=43797\/"},"modified":"2023-02-25T01:41:22","modified_gmt":"2023-02-25T01:41:22","slug":"valores-perdidos-de-una-encuesta","status":"publish","type":"post","link":"https:\/\/www.questionpro.com\/blog\/es\/valores-perdidos-de-una-encuesta\/","title":{"rendered":"\u00bfC\u00f3mo tratar los valores perdidos de una encuesta?"},"content":{"rendered":"

\u00bfQu\u00e9 sabes de los valores perdidos de una encuesta? Durante el proceso de recolecci\u00f3n de datos mediante la t\u00e9cnica de la encuesta, es muy habitual que una parte de los cuestionarios que emitimos a nuestro objetivo de estudio o target no sean completados parcial o totalmente, por lo que puede dificultar el an\u00e1lisis final y sesgar los resultados de nuestra investigaci\u00f3n. Entre las causas m\u00e1s comunes que provocan este acontecimiento podemos encontrar:<\/span><\/p>\n

– Preguntas ambiguas en el cuestionario<\/span><\/p>\n

– Desinter\u00e9s por contestar la encuesta<\/span><\/p>\n

– Preguntas comprometedoras<\/span><\/p>\n

Aunque estas causas afectan principalmente al resultado final y a la representatividad de la muestra seleccionada, existen una serie de estrategias de depuraci\u00f3n y de imputaci\u00f3n que pueden reducir el <\/span>sesgo<\/span><\/a> y optimizar el resultado final de nuestra investigaci\u00f3n de mercado.<\/span><\/p>\n

 <\/p>\n

T\u00e9cnicas para tratar valores perdidos<\/span><\/h2>\n

<\/h3>\n

T\u00e9cnicas de Depuraci\u00f3n<\/span><\/h3>\n

El proceso de Depuraci\u00f3n de Datos consiste en la evaluaci\u00f3n de la calidad de la informaci\u00f3n recogida, aumentando la calidad de \u00e9sta, con tal de evitar an\u00e1lisis poco rigurosos. Las estrategias de depuraci\u00f3n m\u00e1s usadas son:<\/span><\/p>\n

– <\/span>Listado de valores<\/b>: Se trata de buscar en la matriz de datos los valores que est\u00e1n fuera del rango de respuesta. Estos valores se pueden considerar como perdidos, o se puede estimar el valor correcto a partir de otras variables (Imputaci\u00f3n).<\/span><\/p>\n

Ejemplo: En la variable Sexo, cuyos valores son 1 = Hombre y 2 = Mujer, encontramos un 3 en la matriz de datos.<\/span><\/p>\n

– <\/span>Preguntas filtro<\/b>: Se trata de comparar el n\u00famero de respuestas de una categor\u00eda filtro y otra categor\u00eda filtrada. Si se observa alguna anomal\u00eda que no pueda tener soluci\u00f3n, se considerar\u00e1 como valor perdido.<\/span><\/p>\n

Ejemplo: La pregunta filtro A tiene 11 respuestas que conduce a la pregunta filtrada B, mientras que la que conducen a la pregunta filtrada C tiene 9 respuestas. Sin embargo, observamos que en la pregunta B se han dado 14 respuestas (2 m\u00e1s de las que estaban previstas), por lo tanto, no existe coincidencia entre la categor\u00eda filtro y la categor\u00eda filtrada.<\/span><\/p>\n

– <\/span>Consistencias L\u00f3gicas<\/b>: Se comprueban las respuestas que puedan ser consideradas contradictorias entre s\u00ed.<\/span><\/p>\n

Ejemplo: Los encuestados que respondieron sobre su estado civil \u201cSoltero\u201d no deber\u00edan haber respondido la pregunta \u201cActividad del \/ la conyugue\u201d.<\/span><\/p>\n

– <\/span>Nivel de representatividad<\/b>: Se realiza un recuento del n\u00famero de respuestas obtenidas en cada variable. Si el n\u00famero de preguntas no contestadas es muy elevado, se puede asumir igualdad entre las respuestas y las no respuestas o bien, realizar una imputaci\u00f3n de la no respuesta.<\/span><\/p>\n

Te invito a leer: <\/span>Claves para optimizar la calidad de la informaci\u00f3n en tus encuestas online<\/span><\/a>.<\/span><\/p>\n

 <\/p>\n

T\u00e9cnicas de Imputaci\u00f3n<\/span><\/h3>\n

Esta t\u00e9cnica consiste en sustituir los valores perdidos por valores o respuestas v\u00e1lidas mediante una estimaci\u00f3n de \u00e9stas. Existen tres tipos de imputaci\u00f3n:<\/span><\/p>\n

– <\/span>Imputaci\u00f3n aleatoria:<\/b> Este tipo de imputaci\u00f3n asume la falta de informaci\u00f3n a la aleatoriedad de la muestra. Para realizar la imputaci\u00f3n, se analiza la probabilidad de cada valor que aparece en la variable (v\u00e1lidos y perdidos), y se le asignar\u00e1 a cada valor perdido aquellos que tengan una probabilidad igual o menor a esa probabilidad.<\/span><\/p>\n

Ejemplo: La probabilidad de aparezca el valor A es de 0,012 (1,2%), mientras que la probabilidad del valor B es de 0,357 (35,7%). Por lo tanto los valores perdidos que tengan una probabilidad igual o menor a 0,012 se les asignar\u00e1 el valor A, mientras a las que tengan una probabilidad mayor que 0,012 y menor a 0,369 ( la suma de probabilidad A: 0,012 y la probabilidad B: 0,357), se les asignar\u00e1 el valor B.<\/span><\/p>\n

– <\/span>Imputaci\u00f3n \u201cHot Deck\u201d<\/b><\/a>: En este caso, se asume que los valores perdidos no se deben a la aleatoriedad. Para realizar la imputaci\u00f3n, se debe buscar las correlaciones entre las variables relacionadas y las variables a imputar, por lo que se usar\u00e1n valores m\u00e1s cercanos a la variable relacionada.<\/span><\/p>\n

Ejemplo:<\/span><\/p>\n

\"image\"<\/p>\n

Como en la variable \u201cValoraci\u00f3n del Producto\u201d hay un valor perdido, se substituye este valor por el valor m\u00e1s cercano, teniendo en cuenta que existe correlaci\u00f3n entre las variables \u201cValoraci\u00f3n del producto\u201d y \u201cSexo\u201d.<\/p>\n

– <\/span>Imputaci\u00f3n de la media de subclases<\/b>: Este proceso de imputaci\u00f3n guarda cierta similitud con el m\u00e9todo \u201cHot Deck\u201d, pero su uso se centra principalmente en variables continuas o de intervalo. Para poder realizar la imputaci\u00f3n, se buscan dos variables que tengan correlaci\u00f3n con la variable a imputar, y se calcula la media en cada intervalo de la variable continua, por lo que es la media la que se imputa a los valores perdidos. Sin embargo, este tipo de imputaci\u00f3n tiende a disminuir la Desviaci\u00f3n T\u00edpica o Est\u00e1ndar, por lo que afectar\u00eda a los resultados finales del an\u00e1lisis.<\/span><\/p>\n

Quiz\u00e1 te interese leer: <\/span>Razones para utilizar variables personalizadas en una encuesta online<\/span><\/a>.<\/span><\/p><\/blockquote>\n

<\/h2>\n

<\/h2>\n

Conclusiones<\/span><\/h2>\n

Aunque las distintas t\u00e9cnicas de Depuraci\u00f3n e Imputaci\u00f3n pueden ser \u00fatiles para nuestro an\u00e1lisis estad\u00edstico, puede introducir sesgos no deseados en el resultado final, ya que no reflejan los datos reales, m\u00e1s bien una estimaci\u00f3n de \u00e9stos. Es por ello que durante el <\/span>dise\u00f1o de encuestas<\/span><\/a>, te ayudar\u00e1 a evitar el riesgo  de no obtener respuestas u obtenerlas de manera parcial. La realizaci\u00f3n de una prueba piloto o pre-test antes de aplicar la encuesta puede ayudar a detectar posibles fallos y optimizar los resultados de nuestra encuesta.<\/span><\/p>\n

 <\/p>\n

Bibliograf\u00eda<\/span><\/p>\n