Hojas de cálculo de Google: Cómo limpiar datos
Prepare sus datos para análisis y visualización.
Descripción general de la lección
Aprenda a limpiar datos en la preparación para visualización.
En la lección anterior, Hojas de cálculo de Google: Cómo extraer datos de Internet, aprendimos a importar una tabla de Internet utilizando importHTML. En esta lección, aprendemos a eliminar los datos para que estén listos para su análisis y visualización.
- Cómo hacer que los datos sean editables.
- Cómo editar los datos.
- Edición en lotes con la función Buscar y reemplazar.
Para acceder a más lecciones sobre Periodismo de datos, visite:
newsinitiative.withgoogle.com/training/course/data-journalism
Cómo hacer que los datos sean editables.
"Limpiar datos" significa hacer que sea posible trabajar con ellos: asegurarse de que una tabla tenga integridad, que no tenga contradicciones y que esté estructurada de forma comprensible para la computadora. Esto significa que se eliminarán las filas duplicadas y los caracteres no deseados, y que se garantizará que las columnas contienen solo un tipo de dato, por ejemplo, números o texto, pero no ambos. Primero, tenemos que hacer que los datos sean editables.
En esta tabla se muestra el resultado de importHTML. En esta forma, cualquier cambio en la fuente de los datos (la página de Wikipedia) se reflejará automáticamente aquí, y se actualiza al menos una vez cada hora. Sin embargo, no podemos editar los valores en las celdas para eliminar caracteres no deseados. Utilizaremos pegado especial en Hojas de cálculo de Google para crear una instantánea estática de los datos. Con esto, perderemos la capacidad de actualizar la tabla automáticamente a través de importHTML, pero podremos editarla.
Seleccione todos los datos haciendo clic con el botón izquierdo del mouse en el rectángulo situado en la esquina superior izquierda de la hoja. Cuando las celdas estén seleccionadas, haga clic en Editar > Copiar. Seleccione Editar > Pegado especial > Pegar solo los valores. Ahora ya podemos editar la tabla.
Para que editar los datos sea más fácil, inmovilizaremos la fila con los nombres de las columnas. Pase el cursor sobre la línea que hay justo encima de la fila 1 sobre la barra gris. Verá que el cursor se convierte en un guante. Arrastre la barra al final de la fila 1 y déjela ahí. Ahora la fila superior está inmovilizada.
Cómo editar los datos.
importHTML importará los caracteres restantes de la tabla de Wikipedia que son útiles para los humanos, pero no para las computadoras. ¡Vamos a eliminarlos para que nuestra tabla quede más limpia!
Como no necesitamos la columna F para este ejercicio, haga clic con el botón derecho en la letra F en la parte superior de la columna y seleccione Eliminar columna.
Hay una letra "F" junto al número 14 en la fila A15, y un "TS3" junto al número 4 en la celda B29. Eliminaremos estos caracteres para que solo queden los números 13 y 4.
Elimine las letras que sobran en las celdas B40, B41 y B49, para que solo queden los números 2, 19 y 8. Haga lo mismo con la celda D18 para eliminar el "F8$" adelante de la cifra.
Edición en lotes con la función Buscar y reemplazar.
Ahora, vamos a la columna C. Eliminemos los caracteres del principio y el final* de un lote, en lugar de ir fila por fila, utilizando la función Buscar y reemplazar.
Seleccione la columna C haciendo clic con el botón izquierdo en la letra C en la parte superior de la columna. Seleccione Editar > Buscar y reemplazar.
En el primer cuadro de texto, escriba el símbolo del asterisco: * (ese es el carácter que queremos encontrar en la columna C). Deje vacío el cuadro de texto Remplazar con para que el asterisco se reemplace con nada, lo que significa que será eliminado.
Asegúrese de que la opción Buscar diga Rango específico y que el rango refleje la columna que ha seleccionado. No marque ninguna casilla de verificación.
Seleccione Reemplazar todos.Verá que Hojas de cálculo de Google le confirma que Se reemplazaron 100 instancias de * por (nada). ¡Esto significa que ha eliminado con éxito 100 caracteres en 50 filas con tan solo unos clics!
Haga clic en Finalizado. Nuestra tabla ya está limpia y lista para que trabajemos con ella. En la próxima lección, produciremos visualizaciones y obtendremos información de los datos.
¡Felicitaciones!
Ha completado la lección "Hojas de cálculo de Google: Cómo limpiar datos".
Para seguir desarrollando sus habilidades de periodismo digital y obtener la certificación de la Google News Initiative, visite el sitio web del Centro de formación y apúntese para otra lección:
Para acceder a más lecciones sobre Periodismo de datos, visite:
newsinitiative.withgoogle.com/training/course/data-journalism
-
-
Introducción a Google Earth Engine
LecciónUse una biblioteca multipetabyte de datos e imágenes satelitales para detectar cambios, mapear tendencias y cuantificar las diferencias en la superficie de la Tierra. -