martes, 10 de noviembre de 2009

2.Medidas de dispercion

Las medidas de dispersión son las que se utilizan con mayor frecuencia, para conocer la variabilidad general de un conjunto de datos o medir su grado de dispersión respecto a una medida de tendencia central.
Estas nos aportan información acerca de la diseminación o variabilidad de los datos en un conjunto.
Las medidas de dispersión y las medidas de tendencia central nos permiten describir de manera mas precisa las características de un conjunto de datos.
Las medidas de dispersión son las siguientes:
• Rango
• Rango entre percentiles
• Desviación media
• Varianza
• Desviación típica
• Covarianza
• correlacion

AMPLITUD O RANGO
El rango es la diferencia entre el valor mayor y el valor menor en un conjunto de números. Esto es:

Rango = valor mayor – valor menor.

Y a continuación se presenta un ejemplo:

Calcular el rango en el conjunto:

Xﭐ = (235, 298, 710, 438,976)

Solución:

Rango = 976-235 =741

RANGO ENTRE PERCENTILES 10-90
Este rango nos permite conocer los valores extremos entre los cuales se ubica el 80 % de los datos al eliminar un decil (10 %) en ambos extremos.
La obtención es mediante la diferencia de los percentiles 90 y 10 o los deciles 9y1.


DESVIACION MEDIA

La desviación media es el cociente que resulta de la suma de los valores absolutos de sus desviaciones respecto ala media aritmética dividida por el total de datos.
A pesar de que esta es una medida razonable es poco utilizada por manejar el valor absoluto, ya que dificulta el manejo algebraico que es importante en inferencia estadística.
La desviación media se representa por


Ejemplo
Calcular la desviación media de la distribución:
9, 3, 8, 8, 9, 8, 9, 18


VARIANZA
Llamamos varianza al promedio de desviaciones de cuadradas de la media aritmética.
Se representa por:
(s²)

Si se maneja el total de elementos de una población, se utiliza el segundo símbolo y se llama varianza censal. La ecuación es:

= 1 K
N Σ f i (xi - x )

Donde:
N = Σ f i = numero total de elementos en el conjunto de datos.
K = numero de intervalos de clase.
Fi = frecuencia absoluta de i-esimo intervalo de clase.
Xi = marca de clase del i-esimo intervalo de clase.
Xi – X = desviación de la marca de clase del i –esimo intervalo de clase respecto ala media aritmética.

Si se trabaja con una parte de la población, se utiliza el símbolo (s²), ala varianza se le llama varianza muestral. Y para calcularla se sustituye N por N -1 en la ecuación.
De esta forma:
1
s² = Σ (Xi – X)²
N-1

Cuando no se especifica el tipo de población, (censal o muestral) o cuando no se va a realizar estudios específicos de inferencia estadística, podemos utilizar simplemente la siguiente:

1
s² = Σ (Xi – X)²
N

Ejemplo:

Calcular la varianza de los siguientes conjuntos:

Xi = {-6,-2, 0, 4, 5, 8,12}

Yi = {2,2.5, 2.8, 3,3.3, 3.4, 4}

Solución:
En primer lugar se calcula la media aritmética:
Como se puede apreciar ambos conjuntos tienen la misma media aritmética, la cual es:
X = 3 Y= 3
• Las desviaciones cuadradas con respecto ala media del primer conjunto son:


(X1 –X)² = (-6-3)² = 81
(X2 – X)² = (-2-3)² = 25
(X3 –X)² = (0-3)² = 9
(X4 - X)² = (4-3)² = 1
(X5 – X)² = (5-3)² = 4
(X6 – X)² = (8-3)² = 25
(X7 – X)² = (12-3)² = 81





Al sustituir en la ecuación:

1
s² = Σ (Xi – X)² = 1 / 7 (81+25+9+1+4+25+81)
N

S² = 1 / 7 (226) = 32.28571429


• Las desviaciones cuadradas para el segundo conjunto son así:

(Y1 –Y)² = (2-3)² = 1
(Y2 – Y)² = (2.5-3)² =0. 25
(Y3 –Y)² = (2.8-3)² = 0.04
(Y4 - Y)² = (3-3)² = 0
(Y5 – Y)² = (3.3-3)² = 0.09
(Y6 – Y)² = (3.4-3)² = 0.16
(Y7 – Y)² = (4-3)² = 1

Se sustituyen los datos en la ecuación:

1
s² = Σ (Yi – Y)² = 1 / 7 (1+0.25+0.04+0+0.09+0.16+1)
N

S² = 1 / 7 (2.54)= 0.362857142

Como podemos apreciar el segundo conjunto es evidentemente más homogéneo por lo que su dispersión es menor.

DESVIACIÓN TIPICA

La desviación típica también es llamada desviación estándar. Equivale a la raíz cuadrada del cuadrado medio de las desviaciones de la media o bien ala raíz cuadrada positiva de la varianza.
La desviación típica utiliza los símbolos б o S como identificación para la desviación típica censal o muestral, respectivamente.

Las ecuaciones que se utilizan para representar la desviación típica en datos sin agrupar obtenidas a partir de la varianza son:

1
б = √ Σ (Xi – X)²
N

No hay comentarios:

Publicar un comentario