El propósito de este artículo es apoyarlos con su aprendizaje de la Estadística Básica.
La Estadística Básica o Estadística Descriptiva es la rama de la Matemática Aplicada que trata acerca del manejo de la información numérica (datos) y su tratamiento para obtener una representación de la misma y sacar conclusiones de ella.
La información en su conjunto, presenta dos características de interés para el estudioso de las ciencias: la centralización y la dispersión de la información. El primer atributo, llamado Medida de Tendencia Central (MTC), se estudia al organizar la información de menor a mayor e identificar sus puntos o valores centrales; mientras que el segundo atributo, llamado Medida de Dispersión (MD) se desprende del estudio anterior al observar el alejamiento de los datos alrededor de la MTC.
Las tres MTC más empleadas en la práctica son: la Media, la Mediana y la Moda. Las tres MD más utilizadas son: la Varianza, la Desviación Media y la Desviación Estándar.
Dentro de las MTC la Media Aritmética tiene un lugar especial por su forma sencilla de calcularse, definiéndose como la suma de los datos entre el número total de ellos.
La segunda en importancia dentro de las MTC es la Mediana y se define como el valor que divide a una distribución de datos en dos partes iguales.
Finalmente, la Moda se define como el dato que se repite más (el que tiene mayor frecuencia absoluta). Cabe aclarar que una distribución de datos puede tener una, dos o más, e incluso ninguna Moda.
Las medidas de centralización o de tendencia central, nos indican concentración de datos...
Fórmulas para el cálculo de las MTC para datos agrupados.
La Media (muestral), se calcula con la expresión:
, donde fi representa la frecuencia absoluta de la clase i, las Xi representan las marcas de clase de cada clase y n el total de los datos de una muestra.
La Mediana (muestral) se calcula con la expresión:
, donde LRICMe es el límite real inferior de clase de la clase mediana, n/2 representa la mitad de los datos, fAi es la suma acumulada de frecuencias absolutas hasta antes de la clase mediana, n el total de datos y A la amplitud de clase de la tabla.
La moda (muestral) se calcula con la expresión:
, donde LRICMo es el límite real inferior de clase de la clase modal, representa la diferencia de frecuencias absolutas de la frecuencia de la clase modal y la frecuencia anterior a la modal, y representa la diferencia de frecuencias absolutas de la frecuencia de la clase modal y la frecuencia posterior a la modal.
La MD con unidades cuadradas más aplicada es la la Varianza, de la cual se obtiene la Desviación Estándar. La tercera en importancia es la Desviación Absoluta Promedio o Desviación Media.
La Varianza se define como el promedio de los cuadrados de las diferencias de cada valor observado menos su media. La Desviación Estándar se define como la raíz cuadrada de la Varianza y la Desviación Media como el promedio de los valores absolutos de las diferencias de cada valor menos la media.
Fórmulas de las MD para datos agrupados:
La Varianza se calcula como:
, donde Xi son las marcas de clase, fi la frecuencia absoluta para cada clase y n el número de de datos de la muestra.
La Desviación Estándar se calcula como:
, mientras que la fórmula de la Desviación Media (DAP) es:
, donde el símbolo | | representa el valor absoluto de un número (de manera tal que siempre es positivo).
Un ejemplo de cálculo de las MTC para datos agrupados es el siguiente.
1.
Un
profesor de educación física desea hacer un estudio sobre el desempeño de sus
alumnos(as) en la prueba de atletismo de 100 metros planos. Selecciona
una muestra de 20 alumnos(as) y registra los tiempos que éstos marcaron. Los
tiempos registrados, en segundos, son:
18.71, 21.41,
20.72, 28.10, 19.29, 22.43, 20.17, 23.71, 19.44, 20.55, 18.92, 20.33, 23.00, 22.85, 19.25, 21.77, 22.11, 19.77, 18.04, 21.12.
Calcule las MTC y las MD para datos agrupados con los datos anteriores.
Solución:
PASO 1: Ordenar la información
de menor a mayor.
18.04, 18.71, 18.92, 19.25, 19.29,
19.44, 19.77, 20.17, 20.33, 20.55,
20.72, 21.12, 21.41, 21.77, 22.11, 22.43,
22.85, 23.00, 23.71, 28.10.
PASO 2: Calcular el paso, recorrido o rango.
R = Dato Mayor – dato menor
= 28.10 – 18.04 = 10.06
PASO 3: Obtener el número de clases.
K = 1 + 3.322 log (20) = 5.322, redondeamos a 6
PASO 4: Calcular la amplitud de clase A.
A = R/K = 10.06/6 = 1.676, redondeamos a 2.
PASO 6: Construir la tabla de distribución de frecuencias por intervalos.
LIC1 = 18.04, LSC1 = LIC1 + A - 1 = 18.04 + 2 - 1 = 19.04;
LIC2 = LIC1 + A = 18.04 + 2 = 20.04, LSC2 = LSC1 + A = 19.04 + 2 = 21.04;
LIC3 = LIC2 + A = 20.04 + 2 = 22.04, LSC3 = LSC2 + A = 21.04 + 2 = 23.04;
LIC4 = LIC3 + A = 22.04 + 2 = 24.04, LSC4 = LSC3 + A = 23.04 + 2 = 25.04;
LIC5 = LIC4 + A = 24.04 + 2 = 26.04, LSC5 = LSC4 + A = 25.04 + 2 = 27.04;
LIC6 = LIC5 + A = 26.04 + 2 = 28.04, LSC6 = LSC5 + A = 27.04 + 2 = 29.04.
LRICi = LICi - 0.5; LRSCi = LSCi + 0.5.
Xi = (LIC + LSC)/ 2
fiXi = columna fi por columna Xi
|Xi - media| = |Xi - 21.04|, etc.
La tabla buscada es...
Paso 7: Tomando como base lo anterior calculamos las MTC:
Para el cálculo de la Mediana identificamos la CMe (clase mediana) como aquel renglón donde se acumula la mitad de los datos (en color rojo). Para esta clase, los datos a aplicar en la fórmula son: LRICMe = 19.54, n /2 = 10, fAMe = 6, fMe = 7, A = 2. Aplicando valores se obtiene:
Para el cálculo de la Moda identificamos la CMo (clase modal) como aquel renglón que tiene mayor frecuencia absoluta (en color rojo). Para esta clase, los datos a aplicar en la fórmula son: LRICMo = 19.54, = 7 - 6 = 1, = 7 - 5 = 2, A = 2. Aplicando valores se obtiene:
Paso 8: Calculamos las MD.
a) Varianza:
b) Desviación estándar:
c) Desviación Absoluta Promedio:
Espero que esta información les haya sido de utilidad.
Atentamente: Facilitador Leopoldo Raúl Cano Rivera.
Hora actual en
Mexico City, Mexico © Diferencia horaria