Tablas, diagramas, texto, cuadros, gráficos y otras herramientas visuales ayudan a extraer, modificar y comunicar información de los datos.
En esta página, crearás una visualización que te ayudará a analizar y comunicar la información de tu base de datos.
Clasificar los datos (classifying data) es extraer grupos de datos con una característica en común.
Otra cosa que se hace con frecuencia en la ciencia de los datos es agrupar (o clasificar) los datos. Por ejemplo, aquí están los datos de los carros agrupados por la marca de vehículo (columna 12):
La entrada por intervalos de
del bloque agrupar tabla
debe dejarse vacía cuando, como en este ejemplo, el campo en el que estás agrupando es texto en lugar de números. Más adelante en esta página, verás cómo usar intervalos para realizar gráficos.
mantener
.) Tubería
puede ser útil para las preguntas que requieren buscar dentro de las listas internas de los datos agrupados (en columna C).
histograma
funciona como la función agrupar
, pero con características especiales para datos numéricos: te permite seleccionar los límites superiores e inferiores de los datos; puedes tener un rango de valores en una sola estructura de datos (en inglés, bucket), como valores 6-10, valores 11-15, etc.; y clasifica los grupos. Por ejemplo, aquí están los datos de los carros agrupados por las MPG de la ciudad (columna 9):El número de la columna A es el valor más grande incluido en cada grupo. Si los valores no son todos números enteros, el próximo grupo incluye cualquier valor mayor. Por ejemplo, el grupo numerado 15 incluye valores desde 10.0001 (o cualquier valor mayor de 10) hasta exactamente 15.
Puedes hacer gráficas de los datos desde histograma
para visualizarlos:
El modo (mode) de un conjunto de datos es el valor que aparece con más frecuencia.