PRUEBA DE BONDAD DE AJUSTE
Estas pruebas permiten verificar que la población de la cual proviene una muestra tiene una distribución especificada o supuesta. Para ello comenzamos por comprobar la siguiente hipótesis:
Ho: f(x)=fo(x)
donde: X=Variable aleatoria poblacional
fo(x) = distribución de probabilidad especificada o supuesta para X.
Ha: f(x)≠fo(x)
Existen dos tipos de pruebas:
PRUEBA JI-CUADRADA
Este tipo de prueba es aplicable para variables aleatorias discretas o continuas y se utiliza para encontrar la distribución de probabilidad de una serie de datos. La metodología de la prueba es la siguiente:
- Se colocan los n datos históricos en una tabla de frecuencias de m=√n intervalos. Se obtiene la frecuencia observada en cada intervalo i(FOi).
- Se calcula la media y la varianza de los datos.
- Se propone la distribución de probabilidad de acuerdo con la forma de la tabla de frecuencias obtenida en el paso 1.
- Con la distribución propuesta, se calcula la frecuencia esperada en cada uno de los intervalos (FEi) ,mediante la integración de la distribución propuesta y su posterior multiplicación por el número total de datos.
- Se calcula el estimador:
6. Si el estimador C es menor o igual a Ji-cuadrada con m-k-1 grados de libertad (k= # de parámetros estimados en la distribución) y a un nivel de confiabilidad de 1 - ∝, entonces no se puede rechazar la hipótesis de que la información histórica sigue la distribución propuesta en el punto 2.
A continuación se muestra un ejemplo de la aplicación de la Prueba de Bondad de Ajuste Ji-Cuadrada.
PRUEBA KOLMOROV-SMIRNOV
Esta prueba de bondad de ajuste se emplea para encontrar el tipo de distribución de probabilidad de una serie de datos. En comparación con la Ji-Cuadrada, esta prueba es mucho más eficiente en varios aspectos ya que trabaja con la distribución de probabilidad acumulada. La metodología es la siguiente:
- Se colocan los "n" datos en una tabla de frecuencias con m=√n intervalos. Para cada intervalo se obtendrá la frecuencia observada i (FOi). Se calcula la media y varianza de los valores.
- Se divide la frecuencia observada de cada intervalo por el número total de datos. A este resultado para obtener la probabilidad observada i(POi).
- Se calcula la probabilidad acumulada observada de cada intervalo (PAOi) del paso 2.
- Se propone una distribución de probabilidad de acuerdo con la forma de la tabla de frecuencias obtenida en el paso 1.
- Una vez propuesta la distribución, se procede a calcular la probabilidad esperada para cada uno de los intervalos (PEi) mediante la integración de la distribución propuesta.
- Se calcula la probabilidad acumulada esperada (PAEi) para cada intervalo de clase.
- Se calcula el valor absoluto entre PAOi y PEOi para cada intervalo y se selecciona la máxima diferencia (DM).
- Se compara DM con una valor límite correspondiente a la tabla 6 en el apéndice B con "n" datos y a un nivel de confiabilidad de 1-α. Si DM <= al valor límite de la tabla, entonces no se puede rechazar que la información histórica sigue una distribución propuesta en el paso 4.
A continuación, se muestra un ejemplo para su mayor comprensión.