La media (promedio) en datos agrupados se calcula usando el punto medio ($m_i$ ) de cada intervalo de clase y la frecuencia ( $n_i$ ) de cada intervalo. La fórmula para la media es:
$\overline{X} = \frac{\sum (m_i \cdot n_i)}{n}$
donde:
$m_i = \frac{\text{Límite inferior} + \text{Límite superior}}{2}$
Este método permite calcular un promedio representativo de los intervalos de datos.
La mediana es el valor que divide los datos en dos partes iguales: 50% de los valores están por debajo o igual a la mediana, y el otro 50% está por encima o igual a ella, OJO: tienen que estar ordenados. Se utiliza especialmente cuando los datos están sesgados o tienen valores atípicos, ya que no se ve afectada por estos extremos.
$Me = L_i + \left( \frac{\frac{n}{2} - N_{i-1}}{n_i} \right) \cdot x_{a_i}$
donde: - $L_i$ es el límite inferior del intervalo de clase que contiene la mediana. - n es el número total de observaciones. - $N_{i-1}$ es la frecuencia acumulada hasta el intervalo anterior al de la mediana. - $n_i$ es la frecuencia del intervalo que contiene la mediana. - $x_{a_i}$ es el ancho del intervalo.
Característica | Media | Mediana |
---|---|---|
Ventajas | - Fácil de calcular y entender. <br> - Utiliza toda la información del conjunto de datos. | - Resistente a valores atípicos y datos sesgados. <br> - Útil para representar distribuciones asimétricas. |
Desventajas | - Sensible a valores atípicos y extremos, lo que puede distorsionar el resultado. <br> - No siempre representa adecuadamente datos sesgados. | - No utiliza toda la información del conjunto de datos. <br> - Puede ser menos representativa si los datos están distribuidos simétricamente. |
La media es ideal para datos simétricos y sin valores extremos, mientras que la mediana es preferible en distribuciones sesgadas o con valores atípicos.