Es una prueba no paramétrica que se usa tanto para distribuciones discretas como continuas. Se formulan las siguientes hipótesis:
Para aplicarla los datos deben estar agrupados en frecuencias y la muestra tiene que ser lo suficientemente grande para que sea válida. Usualmente se establece que si en los datos agrupados aparece una frecuencia con valor menor a 5, esta barra del histograma no se use. Si hay más de una columna con frecuencia menor a 5, entonces deben combinarse en una para obtener una frecuencia con valor numérico mayor a 5.
El estadístico viene dado por
Para aceptar o rechazar la hipótesis nula se compara el valor obtenido en la ecuación (1.1) con un valor crítico tabulado
. Aceptando la hipótesis nula si
| 1 | 2 | 3 | 4 | 5 | |
| Nº fallas por semana |
0 | 1 | 2 | 3 | 4 o más |
| Nº de semanas con |
6 | 8 | 10 | 6 | 6 |
¿La muestra de datos se ajusta a una distribución de Poisson con
media , con un nivel de significación de
?
Para responder la pregunta se debe realizar una prueba de bondad
de ajuste donde las hipótesis deben ser: H Los datos se ajustan a
la distribución de Poisson contra :H
Los datos no se ajustan a
la distribución de Poisson.
Comencemos por calcular el promedio de fallas por semana, que es
nuestro estimador para la media ,
Ahora calculamos los valores esperados a partir de
| 0 | 1 | 2 | 3 | 4 o más | |
| 6 | 8 | 10 | 6 | 6 | |
| 5.1504 | 10.0147 | 9.7365 | 6.3107 | 4.7878 | |
|
|
0.1401 | 0.4053 | 0.0071 | 0.0153 | 0.3069 |
Con los datos tabulados calculamos
, haremos la prueba
a) que se obtuvo en el ejemplo
.
Comencemos calculando la media y la varianza muestral, dadas por
Sabiendo la naturaleza del fenómeno, observando la forma del histograma de frecuencia y viendo que la desviación estándar muestral, min, es aproximadamente igual a la media muestral,
min, cabe preguntarse si los tiempos entre llegadas de personas al punto de atención al público siguen una distribución exponencial con media
min, cuyas funciones de densidad y de distribución viene dadas por
Para responder a la pregunta hagamos la prueba de bondad de ajuste con un nivel de significación de
.
Los valores esperado en cada intervalo vienen dados por
De estos datos obtenemos
(ver Fig.
b) se ajusta a una distribución donde el 5% de los clientes solicitan una trámite de apertura, 80% hacen una consulta y el 15% restante vienen al punto por un reclamo.
Note que en este caso no es necesario estimar ningún parámetro (m=0).