Supóngase que se toma una muestra de una población normal con media y varianza . Si es el promedio de las n observaciones que contiene la muestra aleatoria, entonces la distribución es una distribución normal estándar. Supóngase que la varianza de la población 2es desconocida. ¿Qué sucede con la distribución de esta estadística si se reemplaza por s? La distribución t proporciona la respuesta a esta pregunta.
La media y la varianza de la distribución t son = 0 y para >2, respectivamente. La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general de la distribución t es similar a la de la distribución normal estándar: ambas son simétricas y unimodales, y el valor máximo de la ordenada se alcanza en la media = 0. Sin embargo, la distribución t tiene colas más amplias que la normal; esto es, la probabilidad de las colas es mayor que en la distribución normal. A medida que el número de grados de libertad tiende a infinito, la forma límite de la distribución t es la distribución normal estándar.
La necesidad de encontrar la
proporción, porcentaje o por ciento de una situación dada en una población es
tarea frecuente en estadística. La distribución maestral de proporciones
es el conjunto de todas las muestras posibles del mismo tamaño extraídas de una
población, junto con el conjunto de todas las proporciones muéstrales. Existen
ocasiones en las cuales no estamos interesados en la media de una muestra, sino
que queremos investigar la proporción de personas con cierta preferencia, etc,
en la muestra. La distribución muestral de proporciones es la adecuada para dar
respuesta a estas situaciones. Esta distribución se genera de igual manera
que la distribución muestral demedias, a excepción de que al extraer las
muestras de la población se calcula el estadístico proporción
(p=x/n en donde “x” es el número de
Éxitos u
Observaciones de interés y “n”
el tamaño de la muestra) en lugar
de la media de cada muestra que era lo que calculamos antes
Suponga que se tienen dos poblaciones distintas, la
primera con media1y desviación estándar1, y
la segunda con media2y desviación estándar2.Más aún, se elige una
muestra aleatoria de tamaño n1de
la primera población y una muestra independiente aleatoria de tamaño n2de la segunda población; se calcula la
media muestral para cada muestra y la diferencia entre dichas medias. La
colección de todas esas diferencias se llamadistribución
muestral de las diferencias entre mediaso
ladistribución muestral del
estadístico La
distribución es aproximadamente normal para n130 y n230. Si las poblaciones son
normales, entonces la distribución muestral de medias es normal sin importar
los tamaños de las muestras.
El teorema del límite central es un teorema fundamental de probabilidad y estadística. El teorema describe la distribución de la media de una muestra aleatoria proveniente de una población con varianza finita. Cuando el tamaño de la muestra es lo suficientemente grande, la distribución de las medias sigue aproximadamente una distribución normal. El teorema se aplica independientemente de la forma de la distribución de la población. Muchos procedimientos estadísticos comunes requieren que los datos sean aproximadamente normales. El teorema de límite central le permite aplicar estos procedimientos útiles a poblaciones que son considerablemente no normales. El tamaño que debe tener la muestra depende de la forma de la distribución original. Si la distribución de la población es simétrica, un tamaño de muestra de 5 podría producir una aproximación adecuada. Si la distribución de la población es considerablemente asimétrica, es necesario un tamaño de muestra más grande.