Tema 3. Análisis de datos agrupados

De CNB
< Serie Aprendo y enseño‎ | Matemáticas‎ | Estadística para organizar y comunicar la información
Revisión del 00:50 10 jul 2020 de Carlos Mulul (discusión | contribs.)
(difs.) ← Revisión anterior | Revisión actual (difs.) | Revisión siguiente → (difs.)
Ir a la navegación Ir a la búsqueda
Busca en cnbGuatemala con Google

Aprendo y Enseño Conjunto, Sistemas Númericos y Operaciones icono1.jpg

Inicio[editar | editar código]

Aprendo y Enseño Conjunto, Sistemas Númericos y Operaciones icono4.jpg

Indicadores de logro

  1. Tabula datos utilizando una tabla de frecuencias con datos agrupados en intervalos.
  2. Calcula la media, mediana y moda para datos agrupados en intervalos.

1. Realice las actividades.

Actividad 1:

  • Corte tres tiras de papel de un metro de longitud y diez centímetros de ancho.
  • Una las tiras de papel para formar una sola y marque sobre esta una recta numérica desde cero hasta tres metros. Divida la recta de diez en diez centímetros.
  • Pegue las tiras de papel sobre el piso, tal como se muestra en la figura 1.
Aprendo y enseño - Matemáticas 6 pag(15.1).jpg
1 metros
Aprendo y enseño - Matemáticas 6 pag(15.2).jpg
2 metros
Aprendo y enseño - Matemáticas 6 pag(15.3).jpg
3 metros
Figura 1

Actividad 2:

  • Elabore un cartel donde coloque el nombre de todos sus compañeros de grupo, tal como se muestra en la figura 2.
  • En el orden en que fue inscrito en el cartel, cada integrante del grupo debe realizar un salto largo desde 0. Salten a un lado de la recta numérica para evitar estropearla. Vea la figura 3.
Figura 2
No. Nombre de mis compañeros Salto largo en centímetros
1
2
3
4
5
....

Para ello, sigan estas instrucciones:

  • Retrocedan hasta un metro para tomar impulso.
  • Salten con fuerza y una persona debe verificar cuál es la longitud de cada salto.
  • Anoten, en el cartel, la longitud de cada salto en centímetros.
Aprendo y enseño - Matemáticas 6 pag(15.4).jpg
Figura 3

3. Responda.

  • ¿Es posible identificar la longitud del salto que representa la moda?
  • ¿Cuál es el salto promedio de todo el grupo?
  • ¿A qué se debe que unos salten más que otros?

Razonamiento matemático

Para datos no agrupados, la moda representa el dato que más se repite. Al calcular el promedio, se suman todos los datos y se dividen entre la cantidad de datos sumados.

Desarrollo[editar | editar código]

Aprendo y Enseño Conjunto, Sistemas Númericos y Operaciones icono4.jpg

Nuevos conocimientos[editar | editar código]

1. Lea y resuelva.

Celso es el responsable de medir el peso en libras de los deportistas que asisten a un centro deportivo en Quiché. Luego de varios meses de mantener una dieta saludable y una rutina de ejercicios permanente, Celso registró la pérdida de peso en libras de N atletas. En la tabla 1 muestra la forma como registró la medición: el número indica las libras perdidas y los palitos, la frecuencia absoluta de las personas que fueron medidas.

  • ¿Cuál es la diferencia entre el deportista que perdió más peso con respecto al que perdió menos?
  • ¿Cuál es la moda en esta tabla de distribución de frecuencia que muestra la pérdida de peso?
  • Si solicitan la media aritmética y la mediana de esta distribución de datos, ¿cómo la calcula?
Figura 1
6 / 19 //// 32 /
7 / 20 //// 33
8 ///// 21 ///// 34
9 // 22 / 35
10 //// 23 //// 36
11 // 24 / 37
12 ////// 25 //// 38
13 /// 26 39
14 //// 27 // 40 /
15 //////// 28 /// 41
16 ///// 29 / 42
17 /////// 30 / 43
18 /////// 31 44 /

Nuevos aprendizajes[editar | editar código]

Si el número de valores es demasiado grande, conviene hacer una agrupación de valores. Para agruparlos se procede de la siguiente forma:

Primero Se calcula el rango o recorrido, esto es R = dato máximo – dato mínimo. En la situación inicial el rango es R = 44 – 6 = 38; esto significa que hay 38 valores distintos entre el dato mayor y el dato menor.
Segundo Se calcula la amplitud de los intervalos. Para ello, se divide el recorrido o rango entre el número de intervalos. En nuestro caso, la amplitud da = 38/8 = 4.75, este número se aproxima a 5. Es decir que la amplitud del intervalo es 5.

Para homogenizar el criterio sobre el número de intervalos a utilizar y tomando en cuenta que el tamaño de cada grupo depende del incremento o la reducción del error de agrupación, se aplica la Regla de Sturges, que se resume en la siguiente tabla:

Tabla 2
Número de datos Número aproximado de intervalos
10 a 100 4 a 8
100 a 10000 8 a 1
1000 a 100000 11 a 14

En la tabla 3 se ilustran los primeros dos intervalos para agrupar.

Tercero Se agrupan los valores de la variable en intérvalos. Un intervalo se expresa por dos números que forman sus límites. Por ejemplo, en la tabla 3, 6 – 10 es un intervalo donde el límite inferior es 6 y el límite superior es 10. Este intervalo comprende todos los datos entre 6 y 10.

2. Agrupe los datos de la tabla 1 en grupos de cinco en cinco.

  • ¿Cómo lo hará?
  • Exponga su respuesta. Para ello, siga la guía que proporciona la tabla 3 y complete la tabla en el cuaderno.
Tabla 3
Grupos en cinco en cinco límites Datos repetidos inferior superior
Inferior Superior Frecuencia (f)x
6 10 13
11 15 23
16 20 27
21 25 15
26 30 7
31 35 1
N=

Razonamiento matemático

Al completar la tabla 3, primero se definen los límites inferior y superior. Luego, con los datos de la tabla 1, se definen las frecuencias para cada intervalo.

Los intervalos quedan: 16–20 con frecuencia 27; 21–25 con frecuencia 15; 26–30 con frecuencia 7; 31–35 con frecuencia 1; 36–40 con frecuencia 1; 41 – 44 con frecuencia 1.

El total de datos es N=38.

3. Analice y resuelva.

Celso necesita calcular la moda y la mediana de las distribuciones de datos. Para hacerlo, debe copiar y completar la tabla de frecuencias con ocho intervalos. Vea la tabla 4 en la siguiente página.

  • Siga la guía del cuadro y complete en el cuaderno.
Aprendo y enseño - Matemáticas 6 pag(18).jpg
Tabla 4

Razonamiento matemático

En la actividad 3, los límites reales son: (15.5–20.5); (20.5–25.5); (25.5–30.5); (30.5–35.5); (35.5–40.5) y (40.5–44.5). Las marcas de clase son: (18, 23, 28, 33, 38 y 42.5). Las frecuencias acumuladas son: (63, 78, 85, 86, 87 y 88).

  • Recuerde y analice.

La media aritmética es el dato promedio del total de datos. La moda es el dato que más se repite. La mediana es el valor del dato medio, esto significa que 50% del total de datos está arriba de este dato y abajo está el otro 50%.

  • La siguiente expresión se emplea para calcular la media aritmética de datos agrupados:
[math]\displaystyle{ \overline{X}=\frac{\sum Fx N_s}{N} }[/math]

[math]\displaystyle{ f }[/math]: frecuencia absoluta

[math]\displaystyle{ x_s }[/math]: marca de clase

[math]\displaystyle{ Σfx_s }[/math]: sumatoria de producto de frecuencia absoluta y marca de clase

[math]\displaystyle{ N: }[/math] total de datos

[math]\displaystyle{ \overline{X}=\frac{1543.5}{88}=17.54 }[/math] es el promedio de libras que perdieron los atletas

  • Para datos agrupados, se emplea la siguiente expresión para calcular la moda:

[math]\displaystyle{ Mo=L_{RI}+\frac{f_p}{f_p+f_a}a }[/math]

[math]\displaystyle{ L_{RI} }[/math]: límite real inferior donde se ubica la frecuencia absoluta más grande

[math]\displaystyle{ f_p }[/math]: frecuencia absoluta posterior al intervalo de la mayor frecuencia

[math]\displaystyle{ f_a }[/math]: frecuencia anterior al intervalo de la mayor frecuencia

[math]\displaystyle{ a }[/math]: Amplitud de intervalo

[math]\displaystyle{ Mo=15.5+\frac{15}{15 23}5 =17.47 }[/math] : es la pérdida de peso más común en los atletas.

  • Para datos agrupados, se emplea la siguiente expresión para calcular la moda:

[math]\displaystyle{ Me=L_{RI}+\frac{N/_{2^{-f{a^a}}} }{f}a }[/math]

[math]\displaystyle{ L_{RI} }[/math]: límite real inferior donde se ubica el valor N/2 o mayor que este

[math]\displaystyle{ f_p }[/math]: frecuencia acumulada al intervalo donde se encuentra N/2

[math]\displaystyle{ f }[/math]: frecuencia absoluta donde está el intervalo de N/2

[math]\displaystyle{ a }[/math]: Amplitud de intervalo

[math]\displaystyle{ Me=15.5+\frac{44-36}{27}5=16.98 }[/math]este valor divide el grupo de datos en 50% mayor que este, mientras que el otro 50% es menor.

Cierre[editar | editar código]

Ejercicios del tema[editar | editar código]

Aprendo y Enseño Conjunto, Sistemas Númericos y Operaciones icono2.jpg

Nivel: análisis[editar | editar código]

1. Lea y resuelva.

Jennifer trabaja como contadora en una agencia de inversión en Cobán. Necesita presentar un informe al gerente sobre las inversiones que las cooperativas asociadas han realizado durante 22 meses. La tabulación de los datos se muestra en la tabla 5. El informe debe incluir un análisis sobre el valor de inversión que más se hace y la mediana de las inversiones.

Tabla 5
Intervalos continuos

Inversión en miles de Q.

Límite real inferior Límite real superior f fa
3.5 10.5 1 1
10.5 17.5 3 4
17.5 17.5 12 16
24.5 31.5 6 22
  • Planee una estrategia para calcular los valores que deben incluirse en el informe.
  • Calcule la moda y la mediana utilizando los datos mostrados en la tabla 5.

Razonamiento matemático

Se utiliza la moda y la mediana para datos agrupados en intervalos. Para calcular la moda [math]\displaystyle{ L_{RI}=17.5, fa=6, fp=3 }[/math] y [math]\displaystyle{ amplitud=7 }[/math], el valor de la moda es=22.17, se interpreta como el valor de inversión que más se hace por parte de las cooperativas. En el cálculo de la mediana </math>L_{RI}= 17.5, N/2=11, Faa=4, f=12</math> y amplitud es [math]\displaystyle{ 7 }[/math]; entonces, la mediana es[math]\displaystyle{ = 21.58 }[/math], este valor se interpreta como el 50% de las cooperativas que hacen inversiones por debajo del [math]\displaystyle{ 21.58 }[/math] y la otra mitad por arriba de este valor.

2. Complete la tabla 6 en el cuaderno y responda.

  • La tabla 6 ordena por intervalos las edades de un grupo de personas de una comunidad de Chiquimula.
Tabla 6
Intervalos continuos Intervalos Marca de clase Frecuencia Frecuencia acumulada
Límite real inferior Límite real superior Límite inferior Límite superior
0.5 10.5 1 10 5.5 7 7
10.5 20.5 11 20 15.5 16 23
21 30 28
31 40 12
41 50 5
51 60 4
61 70 4
71 80 2
  • ¿Cuál es la edad media del conjunto de individuos?
  • ¿Cuál es la edad que más se repite?
  • ¿Cuál es la edad que divide en dos partes iguales a la muestra?

Razonamiento matemático

Los intervalos reales son: [math]\displaystyle{ 20.5–30.5; 30.5–40.5; 40.5–50.5; 50.5–60.5; 60.5–70.5; 70.5–80.5. }[/math]

Las marcas de clase son: [math]\displaystyle{ 25.5, 35.5, 45.5, 55.5, 65.5, 75.5. }[/math] Las frecuencias acumuladas son: [math]\displaystyle{ 51, 63, 68, 72, 76, 78. }[/math]

La media es de 29.35 años, es la edad media de la comunidad.

Para calcular la moda <maht>L_{RI}=20.5, f_a=16, f+p=12</math> y [math]\displaystyle{ amplitud=9 }[/math], el valor de la [math]\displaystyle{ moda es=24.36 }[/math], es la edad de varios miembros de la comunidad.

El cálculo de la mediana [math]\displaystyle{ L_{RI}= 20.5, N/_2=39, F_aa=23, f=28 }[/math] y amplitud es [math]\displaystyle{ 9 }[/math]; entonces, la [math]\displaystyle{ mediana es = 25.64 }[/math], se interpreta que el [math]\displaystyle{ 50% }[/math] de la comunidad es mayor de [math]\displaystyle{ 25.64 }[/math] años y el otro [math]\displaystyle{ 50% }[/math] es menor de esta edad.

En el continuo de coaching es el rol de ser muy directo y enseñar, mostrar, guiar, etc.