Hojas de cálculo de Google: cómo eliminar datos
Prepara tus datos para su análisis y visualización.
Descripción general de la lección
Aprende a eliminar datos en preparación para la visualización.
En la lección anterior, Hojas de cálculo de Google: cómo extraer datos de Internet, aprendimos a importar una tabla de Internet utilizando importHTML. En esta lección, aprendemos a eliminar los datos para que estén listos para su análisis y visualización.
- Cómo hacer que los datos sean editables.
- Cómo editar los datos.
- Edición en lotes con la función Buscar y reemplazar.
Para acceder a más lecciones sobre Periodismo de datos, visita:
newsinitiative.withgoogle.com/training/course/data-journalism
Cómo hacer que los datos sean editables.
“Eliminar datos” significa hacer que sea posible trabajar con ellos: asegurarse de que una tabla tiene integridad, no tiene contradicciones y está estructurada de forma comprensible para el ordenador. Esto significa que se eliminarán las filas duplicadas y los caracteres no deseados, y que se garantizará que las columnas contienen solo un tipo de dato, por ejemplo números o texto, pero no ambos. Primero, tenemos que hacer que los datos sean editables.
Esta tabla muestra el resultado de importHTML. En este formato, cualquier cambio en la fuente de los datos (la página de Wikipedia) se reflejará automáticamente aquí, y se actualiza al menos una vez cada hora. Sin embargo, no podemos editar los valores en las celdas para eliminar caracteres no deseados. Utilizaremos pegado especial en Hojas de cálculo de Google para crear una imagen estática de los datos. Con esto, perderemos la capacidad de actualizar la tabla automáticamente a través de importHTML, pero podremos editarla.
Selecciona todos los datos haciendo clic con el botón izquierdo del ratón en el rectángulo situado en la esquina superior izquierda de la hoja. Cuando las celdas estén seleccionadas, haz clic en Editar > Copiar. Selecciona Editar > Pegado especial > Pegar solo los valores. Ahora ya podemos editar la tabla.
Para que editar los datos sea más fácil, inmovilizaremos la fila con los nombres de las columnas. Pasa el cursor sobre la línea que hay justo encima de la fila 1 sobre la barra gris. Verás que el cursor se convierte en un guante. Arrastra la barra al final de la fila 1 y déjala ahí. Ahora la fila superior está inmovilizada.
Cómo editar los datos.
importHTML importará los caracteres restantes de la tabla de Wikipedia que son útiles para los humanos, pero no para los ordenadores. Vamos a eliminarlos para que nuestra tabla quede limpia.
Como no necesitamos la columna F para este ejercicio, haz clic con el botón derecho del ratón sobre la letra F en la parte superior de la columna y selecciona Eliminar.
Hay una letra “F” junto al número 13 en la fila A14, y un “TS3” junto al número 4 en la celda B27. Eliminaremos estos caracteres para que solo queden los números 13 y 4.
Elimina las letras que sobran en las celdas B40 y B48, para que solo queden los números 19 y 8. Haz lo mismo en la celda D17 para eliminar la “F8” del principio.
Edición en lotes con la función Buscar y reemplazar.
Ahora, vamos a la columna C. Eliminemos los caracteres * al principio y el final de un lote, en lugar de ir fila por fila, utilizando la función Buscar y sustituir.
Selecciona la columna C haciendo clic con el botón izquierdo del ratón en la letra C en la parte superior de la columna. Selecciona Editar > Buscar y sustituir.
En el primer cuadro de texto, escribe el símbolo del asterisco: * (este es el carácter que queremos buscar en la columna C). Deja vacío el cuadro de texto Sustituir por para que el asterisco se reemplace con nada, lo que significa que será eliminado.
Asegúrate de que la opción Buscar dice Intervalo específico y que el intervalo refleja la columna que acabas de seleccionar. No marques ninguna casilla de verificación.
Selecciona Sustituir todos.Verás que Hojas de cálculo de Google te confirma que ha Se han sustituido 100 instancias de * por (nada). ¡Esto significa que has eliminado con éxito 100 caracteres en 50 filas con tan solo unos clics!
Selecciona Listo. Nuestra tabla ya está limpia y lista para que trabajemos con ella. En la próxima lección, produciremos visualizaciones y obtendremos información de los datos.
¡Enhorabuena!
Has completado la lección “Hojas de cálculo de Google: cómo eliminar datos”.
Para seguir desarrollando tus habilidades de periodismo digital y obtener la certificación de Google News Initiative, visita el sitio web del Centro de formación y apúntate a otra lección:
Para acceder a más lecciones sobre Periodismo de datos, visita:
newsinitiative.withgoogle.com/training/course/data-journalism
-
-
¿Qué es el aprendizaje automático?
LecciónAprendizaje automático para periodistas. ¿Qué aprenderá en este curso? -