Visualizar los datos

DAT-2.D.2, DAT-2.D.6 bullet 4

Tablas, diagramas, texto, cuadros, gráficos y otras herramientas visuales ayudan a extraer, modificar y comunicar información de los datos.

En esta página, crearás una visualización que te ayudará a analizar y comunicar la información de tu base de datos.

Agrupar los datos

: Clasificar los datos
DAT-2.E.3 solamente clasificando

Clasificar los datos (classifying data) es extraer grupos de datos con una característica en común.

Otra cosa que se hace con frecuencia en la ciencia de los datos es agrupar (o clasificar) los datos. Por ejemplo, aquí están los datos de los carros agrupados por la marca de vehículo (columna 12):

Agrupar (datos de la tabla (carros)) por (campo (12) del registro 'ranura de entrada de lista vacía') generando una tabla con tres columnas; la columna A contiene cada marca de automóvil del conjunto de datos original; la columna B muestra el número total de automóviles en el conjunto de datos original que son de esa marca; la columna C muestra una imagen de una lista en cada fila de la tabla.

La entrada por intervalos de del bloque agrupar tabla debe dejarse vacía cuando, como en este ejemplo, el campo en el que estás agrupando es texto en lugar de números. Más adelante en esta página, verás cómo usar intervalos para realizar gráficos.

  1. Abre tu proyecto U5L4-ProcesamientoDeDatos si aún no lo tienes abierto.
  2. Habla con tu compañero Determina una pregunta que puedas responder al agrupar tus datos, y crea el código para responderla.
    Haz clic aquí para ver ejemplos de preguntas que requieren ser agrupadas para responderse.
    • ¿Cuántos carros Toyota hay en la base de datos?
    • ¿Cuántos de los carros son híbridos en la base de datos?
    • ¿Cuántos carros Hyundai modelo hay en la base de datos? (Es necesario buscar dentro de una de las listas de la columna C, necesitarás dos funciones de mantener.)

    Tubería puede ser útil para las preguntas que requieren buscar dentro de las listas internas de los datos agrupados (en columna C).

Graficar los datos

image needs alt/title text. --MF, 6/27/19
La función de histograma funciona como la función agrupar, pero con características especiales para datos numéricos: te permite seleccionar los límites superiores e inferiores de los datos; puedes tener un rango de valores en una sola estructura de datos (en inglés, bucket), como valores 6-10, valores 11-15, etc.; y clasifica los grupos. Por ejemplo, aquí están los datos de los carros agrupados por las MPG de la ciudad (columna 9):
histograma de la tabla (datos de la tabla de carros) agrupada por campo: (9) desde: (5) hasta: (50) intervalo: (5) generando una tabla con tres columnas y 10 filas; los valores en la primera columna son múltiplos de 5 desde 5 hasta 50; los valores en la segunda columna son 0, 311, 1554, 2057, 879, 267, 6, 2, 0, 0; los valores en la tercera columna son cada un ícono de lista que indica que una sublista está almacenada en ese campo.

El número de la columna A es el valor más grande incluido en cada grupo. Si los valores no son todos números enteros, el próximo grupo incluye cualquier valor mayor. Por ejemplo, el grupo numerado 15 incluye valores desde 10.0001 (o cualquier valor mayor de 10) hasta exactamente 15.

Puedes hacer gráficas de los datos desde histograma para visualizarlos:
gráfico de barras (gráfico de barras de tabla) (carros)) agrupados por campo: (9) desde: (5) hasta: (50) intervalo: (5)) barras en x: (-200) y: (-100) ancho: (400) alto: (200) Gráfico de barras que se extiende desde 0 hasta 50 en el eje horizontal y desde 0 hasta 2050 en el eje vertical, con barras que indican 0 entre 0 y 5, alrededor de 300 entre 5 y 10, alrededor de 1500 entre 10 y 15, alrededor de 2000 entre 15 y 30, alrededor de 800 entre 20 y 25, alrededor de 200 entre 25 y 30, y 0 más allá de 30

  1. Raliza varios gráficos de barras de algunos campos de tu conjunto de datos y realiza al menos una nueva observación sobre tus datos.
  2. : Modo

    El modo (mode) de un conjunto de datos es el valor que aparece con más frecuencia.

    Aquí tienes un gráfico de barras del campo 11 del conjunto de datos de carros (MPG en carretera) con valores de MPG de 5 a 50, utilizando un intervalo de 3. Identifica el modo. (Será un rango de valores como 13-15 o 16-18).
    [instrucciones para el mismo gráfico de barras que se mencionó anteriormente, pero agrupado por campo: (11) e intervalo: (3)] gráfico de barras (gráfico de barras de tabla (datos de tabla(carros))) agrupados por campo: (11) desde: (5) hasta: (50) intervalo: (3)) barras en x: (-200) y: (-100) ancho: (400) alto: (200) gráfico de barrras que va desde 0 hasta 51 en el eje horizontal y de 0 hasta 1050 en el vertical con las barras que indican 0 para menos de 9, alrededor de 30 entre 9 y 12, alrededor de 220 entre 12 y 15, alrededor de 550 entre 15 y 18, alrededor de 900 entre 18 y 21, alrededor de 900 entre 21 y 24, alrededor de 1000 entre 24 y 27, alrededor de 550 entre 27 y 30, alrededor de 300 entre 30 y 33, alrededor de 250 entre 33  y 36, alrededor de 20 entre 36 y 39, alrededor de 20 entre 39 y 42, y 0 por encima de 42
  3. Aquí tienes otro gráfico de barras con todas las entradas iguales que antes, pero con un intervalo de 6. Identifica el modo.
    [misma instrucción para graficar un gráfico de barras que se mencionó anteriormente, pero con agrupación por campo: (11) e intervalo: (6). gráfico de barras (gráfico de barras de una tabla (datos de una tabla (carros)) agrupados por campo: (11) desde: (5) hasta: (50) intervalo: (6)) barras en x: (-200) y: (-100) ancho: (400) altura: (200) gráfico de barras que se extiende desde 0 hasta 54 en el eje horizontal y desde 0 hasta 1800 en el eje vertical, con barras que indican 0 entre 0 y 6, alrededor de 30 entre 6 y 12, alrededor de 800 entre 12 y 18, alrededor de 1800 entre 18 y 24, alrededor de 1600 entre 24 y 30, alrededor de 700 entre 30 y 36, alrededor de 50 entre 36 y 42, y 0 más allá de 42
  4. Habla con tu compañero ¿Cómo pueden ser correctos ambos resultados? (No hay errores en las gráficas)
  5. Habla con tu compañero ¿Por qué usarías un intervalo mayor de 1 en algún momento?
  1. Investiga la pregunta sobre por qué usarías un intervalo mayor de 1 en algún momento.