Las computadoras pueden ser útiles en el procesamiento de datos para obtener información, pero tu capacidad de procesar datos depende tanto de tus capacidades como de las herramientas que tengas disponibles.
En esta página, contruirás varias herramientas (específicamente, selectores) para ayudarte a responder las preguntas sobre los datos que te interesan.
Es posible que estés familiarizado con las tablas de las aplicaciones de hojas de cálculo (tales como Hojas de cálculo de Google, Numbers de Apple , o Microsoft Excel) que almacenan datos tabulares en diferentes formatos de archivo. Las hojas de cálculo ayudan a organizar la información de manera eficiente y pueden encontrar tendencias en los datos de manera automática (como la línea que se muestra a la derecha). CSV es un formato de hoja de cálculo abierto que funciona en cualquiera de estas aplicaciones y en Snap!.
elemento (1) de
) de los demás elementos?Una tabla es representada en Snap! como una lista de listas. Si das un clic derecho (o control-clic en una Mac) en una tabla, puedes cambiarte a "vista de lista"y ver como los datos (y encabezados de columnas) son almacenados. Ver ejemplos en vista de tabla y en vista de lista.
Registro
y columna
son selectores para una tabla
tipo de datos del resumen. No necesitamos un constructor para este tipo de datos abstractos porque estamos importando los datos de Internet, pero los selectores serán útiles. (Campo
es un selector para registro
, que es, en sí mismo, un tipo de datos abstractos.)
Observa que estos nombres de bloque sugeridos incluyen la palabra "tabla" o "registro" antes de la segunda entrada. Incluir el tipo de datos de entrada esperado en el nombre del bloque puede ayudarte a evitar errores causados por el uso de un selector que no coincide con la entrada que quieres usar.
realiza la misma función en cada elemento de una lista. Dado que una tabla es una lista de listas (donde cada lista interna es un registro),
mapear
realizará la misma función en cada registro de tu conjunto de datos. Tendrás que determinar qué función asignar sobre el conjunto de datos. Aprendiste acerca de mapear
en Unidad 3 Laboratorio 2 Página 5: Transformar cada elemento de la lista.
Puedes ver el número de la columna manteniendo el puntero del ratón sobre la letra en la parte superior de la columna en la vista de tabla.
Es posible que necesites utilizar mapear
, mantener
o combinar
para responder tu pregunta. Haz clic para ver dónde aprendiste sobre estas funciones de orden superior.
mapear
en Unidad 3 Laboratorio 2 Página 5: Transformar cada elemento de la lista.
en Unidad 2 Laboratorio 3 Página 5: Mantener
elementos de una lista .combinar
em Unidad 2 Laboratorio 4 Página 3: Más reporteros matemáticos.Haz clic para ver ejemplo de preguntas para preguntar sobre una sola columna.
promedio
.)mínimo
.)Observa que todos estos ejemplos solo requieren datos de una columna. Si quieres hacer una pregunta que requiera mirar otra columna (por ejemplo, "¿Cuál es el modelo de carro con el mayor MPG?"), a continuación puedes hacer la actividad "Si queda tiempo".
Los investigadores a menudo se enfrentan a desafíos con los datos antes de comenzar el análisis. Imagina que estás combinando datos de diferentes países sobre distancias entre ciudades, y descubres que los datos de distancia de los EE. UU. se miden en millas, pero los datos de distancia de Europa se miden en kilómetros; para hacer comparaciones significativas, necesitas datos uniformes (todos en millas o todos en kilómetros). Como otro ejemplo, si utilizas una encuesta en línea para recopilar datos, la forma en que los participantes abrevian, deletrean o escriben con mayúsculas sus respuestas puede variar. Los datos también pueden estar incompletos (si algunas personas no completaron la encuesta) o no ser válidos (si algunas personas cometieron errores).
Limpieza de datos (cleaning data) es el proceso de hacer los datos uniformes sin cambiar su significado (como el reemplazo de abreviaturas, ortografía y mayúsculas por la palabra deseada o la conversión de millas a kilómetros). Los programadores pueden utilizar programas para filtrar y limpiar los datos digitales, obteniendo así una mayor visión y conocimiento.
Imagina que lees en las noticias que las personas que comen mucho brócoli tienen menos probabilidades de contraer cáncer. La conclusión de que el brócoli previene el cáncer podría ser el resultado del sesgo. Podría ser que las personas que comen mucho brócoli tienden a ser las mismas personas que también hacen mucho ejercicio, y en realidad es el ejercicio lo que hace la diferencia. En la investigación, el término "sesgo" no tiene que significar prejuicio; se trata de las razones por las que los datos podrían no significar lo que parecen significar.
La gente a veces piensa que la manera de superar el sesgo es usar una muestra más grande (preguntando a más personas si comen brócoli y tienen cáncer). Pero si la muestra más grande tiene el mismo problema (las personas que hacen más ejercicio también comen más brócoli), entonces una muestra más grande no eliminará el sesgo.
I need to redo these images and code
statements with "record" instead of "row." --MF, 6/27/19
A continuación se muestra una forma de construir un máximo de función de 'ranura de entrada de lista' para una lista simple (que no es una tabla). Puedes construir un bloque que compare dos entradas y utilizarlo con combinar para encontrar el máximo de una lista entera.
Puedes utilizar un enfoque similar aquí construyendo un que compare un campo en específico (columna) para dos líneas y reporta la línea con el valor más alto en la columna específica.