Continuando con las entregas sobre la calidad de los datos (La calidad de los datos en fuentes primarias), esta semana está relacionado con la calidad de datos desde la fuente secundaria.
Parte 3 de 4: La calidad de los datos en fuentes secundarias
Cuando se requieren datos para hacer ciencia con ellos no siempre es posible crear nuestros propios datos desde cero. Muchas veces se recurre a fuentes secundarias (información recolectada previamente por otras instituciones, personas o plataformas digitales). Utilizar datos secundarios puede ser una gran ventaja si se hace correctamente, pero también puede convertirse en un problema si no se verifica su calidad. Por eso, aprender a seleccionar buenas fuentes secundarias es tan importante como saber analizarlas.
El primer paso es empezar por lo simple: reconocer instituciones confiables. Existen organismos especializados en producir datos primarios de alta calidad, como los institutos nacionales de estadística, ministerios, bancos centrales y organismos internacionales. Estas entidades aplican metodologías profesionales, procesos de revisión rigurosos y tienen amplia experiencia en levantar información. Al utilizar sus bases de datos, se puede tener confianza en que los datos son confiables, actualizados y representativos.
Un segundo nivel de complejidad está en los datos provenientes de empresas privadas. Muchas compañías generan informes de consumo, estudios de mercado y reportes sectoriales. Aunque son útiles, es importante revisar su reputación, la metodología que utilizan y el objetivo con el que fueron creados. En ocasiones, los datos pueden estar diseñados para fines comerciales, lo cual no invalida su uso, pero sí obliga a analizar su contexto con mayor cuidado.
Finalmente, están los datos recolectados automáticamente a través de internet, como los generados por sensores, redes sociales, plataformas web o herramientas de seguimiento de usuarios. Estos datos pueden ser muy valiosos, pero su volumen y complejidad requieren más habilidades técnicas para analizarlos y validarlos. Además, es fundamental respetar la privacidad y el marco legal correspondiente.
A medida que se avanza en el uso de fuentes secundarias, se hace más necesario verificar aspectos como la actualización, cobertura geográfica, definición de variables y calidad técnica. Si no se analizan estos elementos, se corre el riesgo de usar datos que lleven a conclusiones erróneas.
No siempre es posible crear datos primarios, pero saber elegir buenas fuentes secundarias es clave para obtener información útil. Empezar por instituciones confiables, seguir con análisis críticos de fuentes privadas y finalmente avanzar hacia el manejo de datos automatizados, permite una evolución clara y ordenada. Así, cualquier persona puede aprender a reconocer la calidad en los datos, sin necesidad de ser experta, pero con la mirada atenta de quien quiere tomar decisiones con base sólida, de lo contrario los documentos y análisis derivados de ellos no tendrán la calidad requerida y pondrá en riesgo la reputación del investigador.
En la siguiente entrega conoceremos sobre la importancia de contar con datos de calidad.