domingo, 6 de marzo de 2016

PRUEBA DE BONDAD DE AJUSTE

PRUEBA DE BONDAD DE AJUSTE


Estas pruebas permiten verificar que la población de la cual proviene una muestra tiene una distribución especificada o supuesta. Para ello comenzamos por comprobar la siguiente hipótesis:



Ho: f(x)=fo(x)
donde: X=Variable aleatoria poblacional
fo(x) = distribución de probabilidad especificada o supuesta para X.
Ha: f(x)≠fo(x)

Existen dos tipos de pruebas:

PRUEBA JI-CUADRADA

Este tipo de prueba es aplicable para variables aleatorias discretas o continuas y se utiliza para encontrar la distribución de probabilidad de una serie de datos. La metodología de la prueba es la siguiente:


  1. Se colocan los n datos históricos en una tabla de frecuencias de m=√n intervalos. Se obtiene la frecuencia observada en cada intervalo i(FOi).
  2. Se calcula la media y la varianza de los datos.
  3. Se propone la distribución de probabilidad de acuerdo con la forma de la tabla de frecuencias obtenida en el paso 1.
  4. Con la distribución propuesta, se calcula la frecuencia esperada en cada uno de los intervalos (FEi) ,mediante la integración de la distribución propuesta y su posterior multiplicación por el número total de datos.
  5. Se calcula el estimador:
                                                        
    6. Si el estimador C es menor o igual a Ji-cuadrada con m-k-1 grados de libertad (k= # de parámetros estimados en la distribución) y a un nivel de confiabilidad de 1 - ∝, entonces no se puede rechazar la hipótesis de que la información histórica sigue la distribución propuesta en el punto 2.

A continuación se muestra un ejemplo de la aplicación de la Prueba de Bondad de Ajuste Ji-Cuadrada.

PRUEBA KOLMOROV-SMIRNOV


      Esta prueba de bondad de ajuste se emplea para encontrar el tipo de distribución de probabilidad de una serie de datos. En comparación con la Ji-Cuadrada, esta prueba es mucho más eficiente en varios aspectos ya que trabaja con la distribución de probabilidad acumulada. La metodología es la siguiente:
      1. Se colocan los "n" datos en una tabla de frecuencias con m=√n intervalos. Para cada intervalo se obtendrá la frecuencia observada i (FOi). Se calcula la media y varianza de los valores.
      2. Se divide la frecuencia observada de cada intervalo por el número total de datos. A este resultado para obtener la probabilidad observada i(POi).
      3. Se calcula la probabilidad acumulada observada de cada intervalo (PAOi) del paso 2.
      4. Se propone una distribución de probabilidad de acuerdo con la forma de la tabla de frecuencias obtenida en el paso 1.
      5. Una vez propuesta la distribución, se procede a calcular la probabilidad esperada para cada uno de los intervalos (PEi) mediante la integración de la distribución propuesta.
      6. Se calcula la probabilidad acumulada esperada (PAEi) para cada intervalo de clase.
      7. Se calcula el valor absoluto entre PAOi y PEOi para cada intervalo y se selecciona la máxima diferencia (DM).
      8. Se compara DM con una valor límite correspondiente a la tabla 6 en el apéndice B con "n" datos y a un nivel de confiabilidad de 1-α. Si DM <= al valor límite de la tabla, entonces no se puede rechazar que la información histórica sigue una distribución propuesta en el paso 4.
      A continuación, se muestra un ejemplo para su mayor comprensión.