martes, 10 de noviembre de 2009

MEDIDAS DE DISPERSIÓN ABSOLUTA

VARIANZA
Es el promedio del cuadro de las distancias entre cada observación y la mediana aritmética del conjunto de observación.

DERIVACIÓN TÍPICA:
(s) es la varianza viene dada por las mismas unidades que la variable pero el cuadro, para evitar este problema usar como medida de dispersión la desviación típica que se define como la raíz cuadrada positiva de las varianza.


RANGO MUESTRAL:
Es la diferencia entre valor de las observaciones mayor y menor.
Medidas de dispersión relativas
Coeficiente de variación de pearson
Cuando se requiere comprar el grado de dispersión de dos distribuciones que nos vienen dadas en las mismas unidades o que las medidas no son iguales se utiliza el coeficiente de variación de pearsón que se define como el cociente entre la desviación típica y el valor absoluto de la media aritmética.
CV representa el numero de veces que la desviación típica contiene a la media aritmética y por lo tanto cuando mayor es CV mayor es la dispersión y menor la representatividad de la media.

MEDIDAS DE FORMA

ASIMETRÍA

El objetivo de la media de asimetría .es, sin necesidad de dibujar la distribución de frecuencias, estudiar la deformación horizontal de los valores de la variable respecto al valor central de la media.
Diremos que la distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden:

Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas).descienden mas lentamente por la derecha que por la izquierda.
Su valor es cero cuando la distribución es simétrica positiva cuando existe asimetría a la derecha y negativa cuando existe asimetría a la izquierda.


APUNTAMIENTO POR CURTOSIS
Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda.
Se define tres tipos de distribución según su grado de curtosis.
• Distribución mesocurtica:
Presenta un grado de concentración medio alrededor de los valores centrales de una variable (el mismo que presenta una distribución normal).


• Distribución leptocurtica:
Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
• Distribución platicurtica: Presenta un reducido grado de concentración alrededor de los valores centrales de la variable




4. CORRELACION

En probabilidad y estadística la correlación indica la fuerza y la dirección de una relación lineal entre 2 variables aleatorias una de ellas varia sistemáticamente y existe relación si al aumentar los valores no implica por si mismo, ninguna relación de casualidad.

COEFICIENTES DE CORRELACION
El mas conocido es el coeficiente de correlación de pearson (introducido en realidad por Francis Galton), se obtiene dividiendo la covarianza de 2 variables
Otros coeficientes son:
- Coeficiente de correlación de sperman
- Correlacion canonica




RECTA DE REGRESION

Las rectas de regresión son las que mejor ajustan a la nube de puntos generada por una distribución binominal.

- La recta de regresión de Y sobre X:


- La recta de regresión de x sobre y:



La correlación (r) de las rectas determinaran la calidad del ajuste este es cercano o igual a 1, será bueno.
Ambas rectas de regresión de regresión se intersecan en un punto llamado centro de gravedad de la distribución

MEDIDADAS DE FORMA: ASIMETRICA Y CURTOSIS, MOMENTOS

MOMENTOS DE UNA DISTRIBUCIÓN:
Los momentos de una distribución son medidas obtenidas a partir de todos sus datos y de sus frecuencias absolutas.
Se define el momento de orden h respecto al origen de una variable estadística.


Es inmediato observar que para h= i ar es la medida de la distribución.
Se define el momento central de orden h o momento respecto a la medida aritmética de orden ah como:


Es inmediato observar que m=o y que me=s2
Relaciones entre los momentos:


Los momentos respecto a la media se ven afectados por los cambios de origen y el resto por los cambios.

FORMA DE UNA DISTRIBUCIÓN:

Cuando dos distribuciones coinciden en sus medidas de posición y dispersión, no tenemos datos analíticos para ver si se distribuye o no de igual manera.
Para efectuar este estudio de la forma en una solo variable, hemos de tener como referencia una distribución de frecuencia.
Como convenio, se toma para la comparación la distribución normal de media o y varianza 1.


MEDIDA DE CENTRALIZACIÓN
Es el promedio aritmético de las observaciones, es decir, el cociente entre suma de todos los datos y el numero de ellos. Es una medida que señala de manera precisa el valor alrededor del cual distribuye las observaciones finales.

MEDIANA:
Es el valor que se separa por la mitad las observaciones de menor a mayor de tal forma que el uso de esta son menores que la mediana la medida y el otro 50% son mayores.
Si es par tomaremos como mediana aritmética de los valores centrales.

MODA
Es el valor de la variable que mas veces se repite, es decir: aquella cuya frecuencia absoluta es mayor, y no tiene por que ser única


MEDIDAS DE DISPERSIÓN ABSOLUTA

VARIANZA
Es el promedio del cuadro de las distancias entre cada observación y la mediana aritmética del conjunto de observación.

DERIVACIÓN TÍPICA:
(s) es la varianza viene dada por las mismas unidades que la variable pero el cuadro, para evitar este problema usar como medida de dispersión la desviación típica que se define como la raíz cuadrada positiva de las varianza.


RANGO MUESTRAL:
Es la diferencia entre valor de las observaciones mayor y menor.
Medidas de dispersión relativas
Coeficiente de variación de pearson
Cuando se requiere comprar el grado de dispersión de dos distribuciones que nos vienen dadas en las mismas unidades o que las medidas no son iguales se utiliza el coeficiente de variación de pearsón que se define como el cociente entre la desviación típica y el valor absoluto de la media aritmética.
CV representa el numero de veces que la desviación típica contiene a la media aritmética y por lo tanto cuando mayor es CV mayor es la dispersión y menor la representatividad de la media.

MEDIDAS DE FORMA

ASIMETRÍA

El objetivo de la media de asimetría .es, sin necesidad de dibujar la distribución de frecuencias, estudiar la deformación horizontal de los valores de la variable respecto al valor central de la media.
Diremos que la distribución es simétrica cuando su mediana, su moda y su media aritmética coinciden:

Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas).descienden mas lentamente por la derecha que por la izquierda.
Su valor es cero cuando la distribución es simétrica positiva cuando existe asimetría a la derecha y negativa cuando existe asimetría a la izquierda.


APUNTAMIENTO POR CURTOSIS
Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda.
Se define tres tipos de distribución según su grado de curtosis.
• Distribución mesocurtica:
Presenta un grado de concentración medio alrededor de los valores centrales de una variable (el mismo que presenta una distribución normal).


• Distribución leptocurtica:
Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
• Distribución platicurtica: Presenta un reducido grado de concentración alrededor de los valores centrales de la variable




4. CORRELACION

En probabilidad y estadística la correlación indica la fuerza y la dirección de una relación lineal entre 2 variables aleatorias una de ellas varia sistemáticamente y existe relación si al aumentar los valores no implica por si mismo, ninguna relación de casualidad.

COEFICIENTES DE CORRELACION
El mas conocido es el coeficiente de correlación de pearson (introducido en realidad por Francis Galton), se obtiene dividiendo la covarianza de 2 variables
Otros coeficientes son:
- Coeficiente de correlación de sperman
- Correlacion canonica


RECTA DE REGRESION

Las rectas de regresión son las que mejor ajustan a la nube de puntos generada por una distribución binominal.

- La recta de regresión de Y sobre X:


- La recta de regresión de x sobre y:



La correlación (r) de las rectas determinaran la calidad del ajuste este es cercano o igual a 1, será bueno.
Ambas rectas de regresión de regresión se intersecan en un punto llamado centro de gravedad de la distribución

METODOS PARA EL CALCULO DE DERIVACIÒ TÌPICA

MÉTODOS PARA EL CÁLCULO DE DERIVACIÓN TÍPICA

Primer método: a través de las ecuaciones conocidas para conjuntos de datos sin agrupar o con datos agrupados en intervalos de clase, ejemplo:
Calcular la desviación típica del conjunto:
Xi{3,5,8,14,403
Se calcula en primer lugar la media aritmética.
Se saca posteriormente los cuadrados de las desviaciones respecto a la media aritmética de los 5 datos.

Se sustituyen los valores en la ecuación



Segundo método:Para conjuntos datos sin agrupar por medio de las ecuaciones:

Para conjuntos de datos agrupamos en intervalos de clase incluimos la frecuencia.
Tercer método:SE usa para obtener la desviación típica en conjuntos de datos agrupados se utiliza la ecuación:


Cuarto método:Es el mas sencillo para calcular4 los desviación típica en conjuntos de datos distribuidos en intervalos de la misma amplitud.
a partir de
La amplitud de los intervalos equivale a la distancia entre dos marcas de clase consecutivas.
total de datos



La suma de la desviación es:

Y la suma de los cuadrados de las desviaciones 12

Sustituimos directamente los datos en la ecuación del método clave.

FINALMENTE:
=18.333huevos



COVARIANZA
La covarianza es una medida de asociación entre dos conjuntos, donde (X,Y,),(X2, Y2 )...
Representando N parejas de datos correspondientes a los conjuntos. X y Y, y soin sus medias aritméticas.
Ejemplo:
Calcula la covarianza de las estaturas en centímetro y los pesos en kilogramos de los 5 integrantes de la familia M.
nombre Peso (Xi) Estatuirá(Yi)
Juan 79 175
María 54 164
José 66 170
Pedro 46 150
Se calculan las medias aritméticas:



Construimos una tabla para aplicar la primera ecuación :
(X) (Yi)
79 175 18 12 216
54 164 5 7 35
66 170 -1 -7 -7
60 156 -7 1 -7
60 156 -7 1 -7
46 150 -15 -13 195







CORRELACION

Instrumento para medir el grado de relación entre dos variables o la media de asociación para dos conjuntos de datos, llamada correlacion.se representa con la letra (r) y queda definida por:

Los valores de la correlación pueden fluctuar desde -1 hasta 1cuando son positivos, las varia bles X y Y tienden a crecer o a decrecer simultáneamente;
Se calcula cada uno de los componentes de la ecuación:
X=61kg.
Y=163 kg.
Sxy=111.5kg.
Sy=10.15cm.
Por último sustituimos los valores de la ecuación:

2.Medidas de dispercion

Las medidas de dispersión son las que se utilizan con mayor frecuencia, para conocer la variabilidad general de un conjunto de datos o medir su grado de dispersión respecto a una medida de tendencia central.
Estas nos aportan información acerca de la diseminación o variabilidad de los datos en un conjunto.
Las medidas de dispersión y las medidas de tendencia central nos permiten describir de manera mas precisa las características de un conjunto de datos.
Las medidas de dispersión son las siguientes:
• Rango
• Rango entre percentiles
• Desviación media
• Varianza
• Desviación típica
• Covarianza
• correlacion

AMPLITUD O RANGO
El rango es la diferencia entre el valor mayor y el valor menor en un conjunto de números. Esto es:

Rango = valor mayor – valor menor.

Y a continuación se presenta un ejemplo:

Calcular el rango en el conjunto:

Xﭐ = (235, 298, 710, 438,976)

Solución:

Rango = 976-235 =741

RANGO ENTRE PERCENTILES 10-90
Este rango nos permite conocer los valores extremos entre los cuales se ubica el 80 % de los datos al eliminar un decil (10 %) en ambos extremos.
La obtención es mediante la diferencia de los percentiles 90 y 10 o los deciles 9y1.


DESVIACION MEDIA

La desviación media es el cociente que resulta de la suma de los valores absolutos de sus desviaciones respecto ala media aritmética dividida por el total de datos.
A pesar de que esta es una medida razonable es poco utilizada por manejar el valor absoluto, ya que dificulta el manejo algebraico que es importante en inferencia estadística.
La desviación media se representa por


Ejemplo
Calcular la desviación media de la distribución:
9, 3, 8, 8, 9, 8, 9, 18


VARIANZA
Llamamos varianza al promedio de desviaciones de cuadradas de la media aritmética.
Se representa por:
(s²)

Si se maneja el total de elementos de una población, se utiliza el segundo símbolo y se llama varianza censal. La ecuación es:

= 1 K
N Σ f i (xi - x )

Donde:
N = Σ f i = numero total de elementos en el conjunto de datos.
K = numero de intervalos de clase.
Fi = frecuencia absoluta de i-esimo intervalo de clase.
Xi = marca de clase del i-esimo intervalo de clase.
Xi – X = desviación de la marca de clase del i –esimo intervalo de clase respecto ala media aritmética.

Si se trabaja con una parte de la población, se utiliza el símbolo (s²), ala varianza se le llama varianza muestral. Y para calcularla se sustituye N por N -1 en la ecuación.
De esta forma:
1
s² = Σ (Xi – X)²
N-1

Cuando no se especifica el tipo de población, (censal o muestral) o cuando no se va a realizar estudios específicos de inferencia estadística, podemos utilizar simplemente la siguiente:

1
s² = Σ (Xi – X)²
N

Ejemplo:

Calcular la varianza de los siguientes conjuntos:

Xi = {-6,-2, 0, 4, 5, 8,12}

Yi = {2,2.5, 2.8, 3,3.3, 3.4, 4}

Solución:
En primer lugar se calcula la media aritmética:
Como se puede apreciar ambos conjuntos tienen la misma media aritmética, la cual es:
X = 3 Y= 3
• Las desviaciones cuadradas con respecto ala media del primer conjunto son:


(X1 –X)² = (-6-3)² = 81
(X2 – X)² = (-2-3)² = 25
(X3 –X)² = (0-3)² = 9
(X4 - X)² = (4-3)² = 1
(X5 – X)² = (5-3)² = 4
(X6 – X)² = (8-3)² = 25
(X7 – X)² = (12-3)² = 81





Al sustituir en la ecuación:

1
s² = Σ (Xi – X)² = 1 / 7 (81+25+9+1+4+25+81)
N

S² = 1 / 7 (226) = 32.28571429


• Las desviaciones cuadradas para el segundo conjunto son así:

(Y1 –Y)² = (2-3)² = 1
(Y2 – Y)² = (2.5-3)² =0. 25
(Y3 –Y)² = (2.8-3)² = 0.04
(Y4 - Y)² = (3-3)² = 0
(Y5 – Y)² = (3.3-3)² = 0.09
(Y6 – Y)² = (3.4-3)² = 0.16
(Y7 – Y)² = (4-3)² = 1

Se sustituyen los datos en la ecuación:

1
s² = Σ (Yi – Y)² = 1 / 7 (1+0.25+0.04+0+0.09+0.16+1)
N

S² = 1 / 7 (2.54)= 0.362857142

Como podemos apreciar el segundo conjunto es evidentemente más homogéneo por lo que su dispersión es menor.

DESVIACIÓN TIPICA

La desviación típica también es llamada desviación estándar. Equivale a la raíz cuadrada del cuadrado medio de las desviaciones de la media o bien ala raíz cuadrada positiva de la varianza.
La desviación típica utiliza los símbolos б o S como identificación para la desviación típica censal o muestral, respectivamente.

Las ecuaciones que se utilizan para representar la desviación típica en datos sin agrupar obtenidas a partir de la varianza son:

1
б = √ Σ (Xi – X)²
N

jueves, 5 de noviembre de 2009

Probabilidad y estadistica

V SEMESTRE GRUPO B


NOMBRE DEL EQUIPO:

LAS TECNIC:

ORELLAN RODRIGUEZ MARIBEL
BALDERAS HERNANDEZ KARINA
GOMEZ SOLIS PERLA
ANEL ALARCON
ISSAMAR SAN JUAN


DOCENTE: NICOLÁS LÓPEZ MARTINEZ
















1. MEDIDAS DE TENDENCIAS CENTRAL

*Media aritmética: Es el resultado de dividir la suma de los datos de un conjunto y el número total de ello. Tiene ventaja de ser fácil de calcular, señala el valor alrededor del cual se distribuyen individuales. Es el punto de equilibrio de los datos, desde el punto aritmético y geométrico resulta muy sensible la presencia de valores extremos, siendo su principal desventaja.
La media aritmética se representa simbólicamente como:

X, O con la letra M.

EJEMPLO: Calcular la media aritmética del conjunto cuyos datos son:
X1=-3, X2=0, X3=1, X4=2, X5=4 Yx6=8
Solución:
x=1/6(X1+X2+X3+X4+X5+X6)
x=1/6{xi
x=1/6(-3+0+1+2+4+8)=1/6(12)=12/6=2

Al representar gráficamente podemos identificar con claridad que la media aritmética representa geométricamente el punto de equilibrio.

X

-3 -2 -1 0 1 2 3 4


*MODA: Es el valor que ocurre con más frecuencia. Cuando un conjunto de datos no tiene un valor que ocurre con más frecuencias, es amolda o sin moda; si incide con la mayor frecuencia es uní modal.


*MEDIA GEOMETRICA: (G) La media geométrica de un conjunto de N números positivos X, X2, X3…..Xn es la raíz, N-esima del producto de esos números.
La media geométrica de una colección de números positivos es mayor o igual que su media aritmética, pero mayor o igual que su media armónica:
H

*MEDIA ARMONICA (H): La media armónica conjunto de números X, X2, X3….Xn es el reciproco de la media aritmética de los recíprocos de esos números.