miércoles, 14 de abril de 2010

ESTADISTICA INFERENCIAL

Estadística inferencial

El adjetivo de la estadística inferencial es obtener la información acerca de una población partiendo de la información que contiene una muestra. El proceso que se sigue para seleccionar una muestra de denomino muestreo.

Las ventajas que nos brinda el muestreo son:
-Los operativos son menores
-Posibilita analizar un mayor número de variables
-Permite controlar las variables en estudio.

Tipos de muestreo

Probabilístico: cuando el muestreo es proceso para seleccionar una muestra es aleatoria. Es la muestra extraída de una población de tal manera que todo elemento de la población conocida puede ser incluido en la muestra.
A) muestreo aleatorio simple: aquel en que la probabilidad de que un elemento resulto seleccionado se mantiene constante a lo largo de todo el proceso.

Ejemplo:
La extracción de una bola de una urna con devoción de la bola extraída un mismo dato puede resultar muestreando más de una vez. Cada elección no depende de los anteriores.

b) muestro aleatorio sistemático: esta técnica consiste en extraer elementos de la población mediante una regla sistematizadora que previamente hemos creado (sencillamente k elementos). Así enumerada la población se elige (aleatoriamente) un primer elemento base, partiendo de esto se aplica la regla para conseguir el tamaño muestral adecuado.


c) muestreo aleatorio estratificado: consiste en considerar categorías típicas diferentes entre sí estrates que poseen una gran homogeneidad interna (poca varianza interna) y no obstante son heterogéneas entre sí (mucha varianza entre estratos).
La muestra se distribuye y se extrae entre los datos predeterminados según la naturaleza de la población.

Ejemplo: (sexo, lugar geográfico, etc.) dicha distribución recibe el nombre afijación.
-Afijación proporcional: la distribución se hace de acuerdo con el peso (tamaño) relativo de los estratos.
-afijación simple: a cada estrato le corresponde de igual número de elementos muestral.
-Afijación óptima: se tiene en cuenta la posible o previsible disposición de los resultados de modelos que se considera la proporción y la desviación típica.

La distribución de muestreo de x̄

Esta estadística tiene un papel muy importante en problemas de tomas de decisiones para medias poblacionales desconocidas.

Ejemplo:
Se tiene una maquina de llenado para vaciar 500 grs. de cereal en una caja de cartón. Supóngase que la cantidad de cereal que se coloca en cada caja es una variable aleatoria normalmente distribuida con media 500 grs. y desviación estándar es igual a 20 grs. para verificar que el peso promedio de cada caja se mantiene en 500 grs. Se toma una muestra aleatoria de 25 de estas en forma periódica y se pese el contenido de cada caja. El gerente de la planta ha decidido detener el proceso y encontrar la falla cada vez que el valor promedio de la muestra sea mayor de 510 grs. o menor de 490 grs. obtener la probabilidad de detener el proceso.
La probabilidad deseada es igual a 1 menos la probabilidad de que x̄ se encuentre entre 490 y 510 grs; de esa forma
P (detención del proceso) = 1-P (490(-490-500
< Z <
510-500)
4

4

=1P(2.5

=1-P


= 0.0124

La distribución de muestreo de s²

Otra estadística importante empleada para formular inferencias con respecto a las varianzas de la población es la varianza muestral denotada por s² dada que la dispersión es una consideración tan importante como la tendencia central, el significado de s² para formular inferencias de θ² es comparable con el que tiene x para formular inferencias con respecto a µ.
Ejemplo:
Considérese una medición física proporcionada por un instrumento de precisión, en donde el interés recae en la variabilidad de la lectura. Supóngase que, con base de la experiencia la medición es una variable aleatoria normalmente distribuida con media 10 y desviación estándar igual a 0.1 unidades. Si se toma una muestra aleatoria procedente del proceso de manufactura de los instrumentos de tamaño 25, ¿Cuál es la probabilidad de que el valor de la varianza muestral sea mayor de 0.014 unidades cuadradas?
La probabilidad de que s²>0.014, cuando el muestreo se lleva a cabo sobre N (10,0.1) con n=25 es igual a la de P (y>ns²/>θ²).
=P[y>(25)(0.014)/0.01]
=P (y>35)
=1-P (y≤35)
En donde y x²₂₅. De la tabla E del apéndice, el valor de P (y≤35) es, aproximadamente 0.9.

Teorema de límite central

Indica que, en condiciones muy generales, la distribución de la suma de variables aleatorios tiende a una distribución normal o también llamada campana de gauss, cuando la cantidad de variable es muy grande.

Teorema: sea x₁, x₂…xⁿ una muestra aleatorio de una distribución con media µ y varianza y desviación media. Entonces, si n es suficientemente grande, la variable aleatoria
x̄=

Garantiza una distribución normal cuando n es suficientemente grande.

Existen varias versiones del TLC, una de las más simple establece que es suficiente que las variables se sumen sean independientes, idénticamente distribuidas, con valor esperando y varianzas finitas.


La aproximación entre las dos distribuciones es en general mayor en el centro de los mismos que en sus extremos o colas motivo para el cual se prefiere el nombre de teorema del límite central.
Si se obtiene una muestra de una población normal, entonces la media muestra tiene una distribución normal sin importar el tamaño de la muestra.

Ejemplo:
Hay una placa que indica que su capacidad máxima es de 12 personas o 2004 libras. Dicha capacidad se excedería si 12 personas tienen pesos con una x̄ mayor que 2004/12 es igual a 167 libras. Puesto que los hombres suelen pesar más que las mujeres, el peor de los casos implicaría a 12 pasajeros hombres.los pesos de los hombres se distribuyen normalmente, con una media de 172 libras y una desviación estándar de 29 libras.
a) Calcule la probabilidad de que al seleccionar aleatoriamente a un hombre, sea mayor de 167 libras.
b) Calcule la probabilidad de que 12 hombres que se seleccionaron al azar tenga una x̄ mayor de 167 libras (de manera que su peso total sea mayor que la máxima capacidad del teleférico de 2004 libras).
Solución:
Antes de emplear la tabla convertimos el peso de 167 libras a su puntuación z correspondiente:

z=
x-µ

Θ
167-172
29
= -0.17
167 libras es igual a 0.4325
a) por tanto, 1-0.4325=0.5675 la probabilidad de que un hombre se seleccione aleatoriamente pese mas de 167 libras es de 0.5675.

θ
√n
29
√12
b) µx̄ = µ = 172 θ x̄ = =

=8.37158
INTERVALOS DE CONFIANZA

La estimación por intervalo consiste en determinar un par de valores a y b, tales que constituidos en intervalo(a, b); y para una probabilidad 1-α prefijado (nivel de confianza) se verifique en relación al parámetro θ a estimar se cumpla.

Podemos considerar el nivel de confianza (y-x) que hemos prefijado para la expresión anterior como la probabilidad que existe (antes de tomar la muestra) de que el intervalo a construir a partir de la muestra incluya el verdadero valor del parámetro a estimar. Refleja la “confianza” en la “construcción” del intervalo y que este tras concretas la muestra contendrá el valor a estimar. De ahí que en términos numéricos, dicho que el nivel haya de tomar un vaisraltto (0>90, 0, 95, 0,90).

Evidentemente el complementario del nivel de confianza; es decir de nivel de significancia supondrá las probabilidades de cometer el error de no dar por concluido el verdadero valor del parámetro de estimar y dado que se trata de un error posible a cometer, su cuantificación en términos de probabilidad sea muy pequeña (0, 10, 0, 05, 0,003) cuanto mayor sea el nivel de confianza prefijado la amplitud del intervalo de estimación será también mayor y por tanto la estimación será menos precisa.

INTERVALOS DE CONFIANZA PARA µ CUANDO SE MUESTRA UNA DISTRIBUCION NORMAL CON VARIANZA CONOCIDA.
Sea x1, x2…., xn una muestra aleatoria de una distribución normal con media desconocida µ, pero con una varianza θ2 conocida. El interés recae en la construcción de un intervalo de confianza de un (1-α) % sobre µ y en donde α es un numero pequeño, tal que 0<α<1.
Ejemplo:
Los datos que a continuación se dan son los pesos en promedio:506,508,499,503,504,510,497,512,514,505,509,496. Si el peso de cada caja es una variable aleatoria normal con una desviación estándar α=5grs., obtener los intervalos de confianza estimados del 90, 95 y 99%, para la media de llenado de este proceso.
Para un coeficiente de confianza del 90%, α=0.1. El valor z 0.95 se obtiene de la tabla D del apéndice y es igual a 1.645, ya que p (z>1.645)=0.05. Con base en los datos muéstrales, el valor de x̄ es de 503.75 grs. Entonces un intervalo de confianza del 90% para la media del proceso de llenado es
503.75±1.645
5
√16
O de 501.69 a 505.81.

INTERVALOS DE CONFIANZA PARA µ CUANDO SE MUESTREA UNA DISTRIBUCION NORMAL CON VARIANZA DESCONOCIDA.
Se considera el problema de encontrar un intervalo de confianza para µ , cuando se muestra una distribución normal y para la cual no se tiene conocimiento acerca del valor de la varianza.
INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS CUANDO SE MUESTREAN DOS DISTRIBUCIONES NORMALES INDEPENDIENTES.
Ejemplo:
Se piensa que los estudiantes de licenciatura de contaduría pueden esperar un mayor salario promedio al egresar de la licenciatura, que el que esperan los estudiantes de administración. Recientemente se obtuvieron muestras aleatorias de ambos grupos de un área geográfica relativamente homogénea, proporcionando los datos. Determinar un intervalo de confianza unilateral del 90% para la diferencia entre los salarios promedio para los estudiantes de contaduría y los de administración.
µn -µm al regresar de la licenciatura (suponga que las varianzas θ2A y θ2m son iguales).



A partir de los datos muéstrales dado, pueden calcularse de las siguientes cantidades:
NA=10 NM=10
X̄A=16250 X̄M=15400
S2A=1187222.22 S2M=1352307.69
S 2P=1284772.73
SP=1133.84



INTERVALO DE CONFIANZA PARA θ2 CUANDO SE MUESTREA UNA DISTANCIA NORMAL CON MEDIA DESCONOCIDA


Un proceso produce cierta clase de cojinetes de cola cuyo diámetro interno interno es de 3 cm, selecciona de forma aleatoria 12 de estos cojinetes y se miden sus diámetros internos, su resultado es 3.01, 3.05, 2.99, 2.99, 3.00, 3.02, 2.98, 2.99, 2.97, 2.97, 3.02, y 3.01. Suponiendo que el diámetro es una variable aleatoria normalmente distraída, determina un intervalo de confianza de 99% para la varianza θ2. Dada que la confianza deseada es del 99%, α= 0.01.
De la tabla E del apéndice, los valor cuantiles x20.00511 y x20.995.11 son 2.60 y 26.61, respectivamente. Para determinar el valor calculado de la varianza muestral es de s2=0.0005455. Un intervalo de confianza del 99% para θ2.



Intervalo de confianza para el parámetro de proporción P cuando se muestrea una distribución bionomíal.

El porcentaje de productos defectuosos de un proceso de manufactura es el barómetro más importante para medir l calidad del proceso para manufacturar un producto dado. Ya que un artículo puede estar defectuoso es una variable aleatoria bionomíal, si se supone una productividad constante e independiente.
Ejemplo:

Un fabricante asegura a una compañía que le compra un producto en formula regular, que el porcentaje de productos defectuosos no es mayor que el 5%, la compañía decide comprobar la afirmación del fabricante seleccionado, de su inventario, 200 unidades de este producto y probándola.
¿Deberá sospechar la compañía de la afirmación del fabricante si se descubren un total de 19 unidades defectuosas en la muestra? La sospecha estará apoyada si existe un intervalo de confiabilidad alta, para la cual la proporción P se encuentra completamente a la derecha del valor asegurado 0.05. Se selecciona una confiabilidad del 95% dado que la realización de la variable aleatoria x es x=19 y n=20, el estimado de P es 19/200=0.095.

El cual resulta ser (0.5436, 0.1356). Aparentemente existe una razón para sospechar de la afirmación del fabricante, ya que el intervalo de confianza se encuentra completamente a la derecha del valor asegurado.

1 comentario: