1. El proyecto
        2. El dataset de análisis
        3. Limpieza y preparación de los datos
        4. Reporte según sexo y edad
        5. Tipos de enfermedades reportadas
        6. Pacientes con COVID únicamente
        7. Pacientes con COVID y neumonía
        8. Pacientes con COVID e hipertensión
        9. Conclusiones
        Dashboard
Veremos el desarrollo de este proceso analizando un dataset proporcionado por el gobierno de México acerca del COVID-19, del año 2020. (Puedes ver el original en este enlace -> Dataset)
Esos datos pueden ser analizados en profundidad variable por variable y llevaría a un análisis demasiado extenso.
El objetivo de este proyecto únicamente es el de mostrar algunas técnicas de análisis de datos, por lo que se reducirá al análisis específico del COVID asociado a solo 2 enfermedades y cómo influyen en la posibilidad de que el paciente termine en UCIs y que llegue a fallecer.
Un análisis más profesional requeriría la colaboración de médicos especializados.
Transformaremos los datos en bruto de esta tabla en información útil y visualmente comprensible.
La enfermedad por coronavirus (COVID-19) es una enfermedad infecciosa causada por un coronavirus descubierto recientemente. La mayoría de las personas infectadas por el virus COVID-19 experimentarán una enfermedad respiratoria de leve a moderada y se recuperarán sin necesidad de tratamiento especial. Las personas mayores y las que padecen problemas médicos subyacentes como enfermedades cardiovasculares, diabetes, enfermedades respiratorias crónicas y cáncer tienen más probabilidades de desarrollar una enfermedad grave.
Durante todo el transcurso de la pandemia, uno de los principales problemas a los que se han enfrentado los profesionales sanitarios ha sido la escasez de recursos médicos y de un plan adecuado para distribuirlos eficazmente. En estos tiempos difíciles, ser capaz de predecir qué tipo de recursos puede necesitar un individuo en el momento de dar positivo en la prueba o incluso antes será de inmensa ayuda para las autoridades, ya que podrán conseguir y organizar los recursos necesarios para salvar la vida de ese paciente.
Este conjunto de datos contiene una enorme cantidad de información anonimizada relacionada con los pacientes, incluidas las condiciones previas. El conjunto de datos en bruto consta de 21 características únicas y 1.048.576 pacientes únicos. En las características booleanas, 1 significa «sí» y 2 significa «no». Los valores 97 y 99 son datos que faltan.
• Sexo: 1 para mujer y 2 para hombre.
• Edad: del paciente.
• Clasificación: resultados de la prueba COVID. Los valores 1-3 significan que al paciente se le diagnosticó COVID en diferentes grados. 4 o superior significa que el paciente no es portador de COVID o que la prueba no es concluyente.
• Tipo de paciente: tipo de atención que recibió el paciente en la unidad. 1 para vuelta a casa y 2 para hospitalización.
• Neumonía: si el paciente ya tiene inflamación de los sacos aéreos o no.
• Embarazo: si la paciente está embarazada o no.
• Diabetes: si el paciente tiene diabetes o no.
• EPOC: indica si el paciente padece o no enfermedad pulmonar obstructiva crónica.
• Asma: si el paciente tiene asma o no.
• Inmunosuprimido: si el paciente está inmunodeprimido o no.
• Hipertensión: si el paciente tiene hipertensión o no.
• Cardiovascular: si el paciente tiene una enfermedad relacionada con el corazón o los vasos sanguíneos.
• Renal crónica: si el paciente tiene enfermedad renal crónica o no.
• Otra enfermedad: si el paciente padece o no otra enfermedad.
• Obesidad: si el paciente es obeso o no.
• Tabaco: si el paciente es consumidor de tabaco.
• USMR: indica si el paciente atendió unidades médicas de primer, segundo o tercer nivel.
• Unidad médica: tipo de institución del Sistema Nacional de Salud que proporcionó la atención.
• Intubado: indica si el paciente estaba conectado al ventilador.
• UCI: Indica si el paciente había sido ingresado en una Unidad de Cuidados Intensivos.
• Fecha fallecimiento: Si el paciente falleció indicar la fecha de defunción, y 9999-99-99 en caso contrario.
◄ 1 . El proyecto                 3. Limpieza y preparación de los datos ►
Copyright © 2025 │ Marcelo Enríquez