Nuestros alumnos del MBA en Periodismo de Datos elaboraron una serie de tutoriales como trabajo final en la disciplina Low Code: Transformando datos en pautas sin programación, impartidos por el profesor Adriano Belisário. Este mes podrás ver algunos de sus trabajos y divertirte con los tutoriales que crearon. Hoy puedes consultar el tutorial realizado por Mariana Hallal.
La vacunación contra el Covid-19 en Brasil comenzó con los grupos más vulnerables a la enfermedad o más expuestos al virus. Las personas mayores, las personas que viven en centros de atención a largo plazo, los profesionales de la salud y los indígenas encabezan la lista.
Recientemente, en mayo, se comenzó a cubrir a personas con comorbilidades. Vea cómo conocer el impacto de esta vacunación en el número de personas hospitalizadas. Para ello, exploraremos los datos de Sivep-Gripe del Ministerio de Salud en SQL y Google Sheets.
Paso a paso
1 - Descargar datos del Ministerio de Salud Para este análisis, solo usaremos datos de 2021. Haga clic aquí para descargar la hoja de cálculo . Para descargar, debe hacer clic en “SRAG” > “Explorar” > “Descargar”.
2 - Si nunca has usado SQL, necesitas descargar el programa. Usemos DB Browser para SQLite. Descargar aquí .
3 - En SQL, haga clic en "Nueva base de datos", asigne a esta base de datos el nombre "comorbilidad" y guárdela.
3 - Se abrirá una ventana pidiéndole que cree una tabla. Haga clic en cancelar porque vamos a importar los datos.
4 - Haga clic en "Archivo" > "Importar" > "Tabla desde archivo CSV"
5 - Seleccionamos el archivo que descargamos del Ministerio de Sanidad, configuramos la tabla como se muestra en la imagen y pulsamos Aceptar
7 - El nombre de la tabla contiene elementos que pueden perjudicar el análisis, como el guión (-). Cambiemos el nombre de la tabla para eliminar este problema. Haga clic derecho en el nombre de la tabla y haga clic en "Modificar tabla".
8 - Cambie el nombre de la tabla a "srag2021" y haga clic en Aceptar.
9 - Pasemos ahora al análisis. Seleccionemos las columnas que usaremos. Haga clic en "Ejecutar SQL", escriba el siguiente comando y presione el botón "reproducir".
SELECCIONE FACTOR_RISC, substr (DT_INTERNA, 4, 10) AS mes_interna
DE srag2021
DONDE CLASE_FIN = 5
La función SELECT le dice al programa qué columnas queremos. La función FROM nos dice de qué tabla queremos extraer estas columnas. La función WHERE hace un filtro. En este caso, solo queremos las líneas donde la calificación final es 5 (covid).
El término "substr" al final de la función SELECT se utiliza para cortar caracteres de una columna completa. Apliquémoslo a la columna DT_INTERNA para tener solo el mes y año de hospitalización; esto facilitará el análisis.
10 - Esta tabla es la que usaremos. Entonces, creemos una vista para poder trabajar mejor con ella. Haga clic en "Guardar vista de resultados" > "Guardar como vista". Llame a esta vista "factor de riesgo"
11 - Presione dos Enter después de la última línea y pasemos a otra oración. Nuestro objetivo final es conocer qué porcentaje de pacientes hospitalizados presentaban cada mes algún factor de riesgo. Entonces, pidámosle a SQL que cuente cuántas personas con y sin factores de riesgo fueron hospitalizadas cada mes.
SELECCIONAR *, contar (RISC_FACTOR) COMO factor total
DE factorderisco
DONDE mes_interna ME GUSTA '%2021%'
GRUPO POR mes_interno, RISC_FATOR
Con esta frase filtramos solo los meses de 2021. Aunque la hoja de cálculo, teóricamente, solo contiene datos de 2021, hay muchos errores tipográficos en el campo “fecha” que dificultan el análisis.
Después de escribir la oración, selecciónela y haga clic en "Ejecutar".
12 - Guardemos este resultado y movámoslo a Google Sheets. Haga clic en el mismo botón de guardar vista, elija "Exportar a CSV", haga clic en "guardar" y asígnele el nombre "factor de riesgo".
13 - Crea una nueva hoja de cálculo en Google Sheets. Haga clic en "Archivo" > "Importar" > "Cargar" > "Seleccione un archivo de su dispositivo". Desmarque la casilla que dice "Convertir texto a números, fechas y fórmulas" y haga clic en "Importar datos".
14 - Haga clic en "Ver" > "Congelar" > "1 fila" para marcar la primera fila como encabezado.
15 - Seleccione la columna "factor total", haga clic en el botón "123" y seleccione la opción "0" o "número".
16 - Creemos una tabla dinámica. Haga clic en "Datos" > "Tabla dinámica" > "Crear". Haga clic en "Agregar" junto a "Filas" en el menú de la izquierda y seleccione "mes_interna".
Haga clic en "Agregar" junto a "Valores" y seleccione "factor total". En la pestaña "Resumir por", seleccione "SUM".
Copie el resultado y pegue solo los valores (CTRL + SHIFT + V) en la celda F1 de la pestaña principal.
17 - En la celda D1 de la primera pestaña, escriba "total_per_month". En la celda D2, escriba la siguiente fórmula: =BUSCARV(B:B;F:G;2;FALSO).
18 - Haga doble clic en el pequeño punto azul en la esquina de la celda D2 para aplicar esta información a toda la columna.
19 - En la celda E1, escriba "porcentaje". En la celda E2, escriba la siguiente fórmula: =C2/D2. Haga clic en el cuadrado azul en la esquina de la celda para aplicar la fórmula a toda la columna. Seleccione toda la columna E, haga clic en “123” y seleccione porcentaje.
20 - ¡Listo! Este es el resultado. En la columna FACTOR_RISC, el número 1 significa “sí, el paciente tiene un factor de riesgo” y el número 2 significa “el paciente no tiene ningún factor de riesgo”. Esta información está en el diccionario de datos .
Pudimos observar que en enero el 65,6% de las muertes ocurrieron entre personas con factores de riesgo. En junio, el porcentaje ya cayó al 52,37%. Recuerda siempre hablar con un experto antes de sacar conclusiones sobre una base de datos.
La vacunación de personas con comorbilidades comenzó en mayo en la mayoría de los estados. Por lo tanto, hasta ahora, la mayoría de estas personas solo han recibido la primera dosis de la vacuna. En las próximas semanas, las personas con factores de riesgo deberían representar un grupo aún más pequeño entre los hospitalizados. Para filtrar por UF, puede poner la UF deseada en la cláusula WHERE de la primera frase de SQL.
Por favor publique sus comentarios y reseñas