Valoración de la densidad

Elija su lengua:
English | Français | Español | Italiano | Português | Deutsch | Nederlands | Svenska | Ελληνικά | Русский | 한국어 | 日本語 | 简体中文 | 繁體中文 | العربية

Bookmark and Share
 

Valoración de la densidad

En probabilidad y estadística, valoración de la densidad es la construcción de una estimación, basada en observado datos, de un subyacente inobservable función de la densidad de la probabilidad. La función inobservable de la densidad se piensa en mientras que la densidad según la cual distribuyen una población grande; los datos se piensan generalmente en como muestra escogida al azar de esa población.

Una variedad de acercamientos a la valoración de la densidad se utiliza, incluyendo Ventanas de Parzen y una gama de el arracimar de los datos técnicas, incluyendo quantization del vector.

Contenido

Ejemplo de la valoración de la densidad

Consideramos los expedientes de la incidencia de diabetes. Lo que sigue se cotiza in extenso de modem descripción:

Una población de las mujeres que eran por lo menos 21 años, de Pima La herencia y la vida indias cerca de Phoenix, Arizona, fueron probadas para la diabetes según Organización Mundial de la Salud criterios. Los datos fueron recogidos por el instituto nacional de los E.E.U.U. de la diabetes y de las enfermedades digestivas y del riñón. Utilizamos los 532 expedientes completos.

En este ejemplo, construimos tres estimaciones de la densidad para el “glu” (plasma glucosa concentración), una condicional en la presencia de la diabetes, el segundo condicional en la ausencia de la diabetes, y el condicional del tercero no en la diabetes. Las estimaciones condicionales de la densidad son entonces se utilicen construir la probabilidad de condicional de la diabetes en “glu”.

Los datos del “glu” fueron obtenidos del paquete TOTAL del Lenguaje de programación de R. Dentro 'R, ¿? Pima.tr y ¿? Pima.te dé una cuenta más completa de los datos.

medio de “glu” en los casos de la diabetes está 143.1 y la desviación de estándar es 31.26. El medio del “glu” en los casos de la no-diabetes es 110.0 y la desviación de estándar es 24.29. De esto vemos que, en este modem, los casos de la diabetes están asociados a mayores niveles del “glu”. Esto será hecha clarificante por los diagramas de las funciones estimadas de la densidad.

La primera figura demuestra estimaciones de la densidad de p(glu | diabetes=1), p(glu | diabetes=0), y p(glu). Las estimaciones de la densidad son estimaciones de la densidad del núcleo usando un núcleo Gaussian. Es decir, una función Gaussian de la densidad se pone en cada punto de referencias, y la suma de las funciones de la densidad se computa sobre la gama de los datos.

Densidad estimada de p(glu | diabetes=1) (rojo), p(glu | diabetes=0) (azul), y p(glu) (negro).

De la densidad del condicional del “glu” en la diabetes, podemos obtener la probabilidad del condicional de la diabetes en “glu” vía Regla de Bayes. Para la brevedad, la “diabetes” es “DB abreviado.” en este fórmula.

 p (\ mbox {diabetes} =1|\ = \ frac {p
 del mbox {glu}) (\ mbox {glu}|\ mbox {DB.}=1) \, p (\ mbox {DB.}=1)}{p (\ mbox {glu}|\ mbox {DB.}=1) \, p (\ mbox {DB.}=1) + p (\ mbox {glu}|\ mbox {DB.}=0) \, p (\ mbox {DB.}=0)}

La segunda figura demuestra la probabilidad posterior estimada p(diabetes=1 | glu). De estos datos, aparece que un nivel creciente del “glu” está asociado a diabetes.

Probabilidad estimada de p(diabetes=1 | glu).

Escritura por ejemplo

Los comandos del siguiente del Lenguaje de programación de R creará las figuras demostradas arriba. Estos comandos se pueden incorporar en el aviso de comando usando el corte y la goma.

biblioteca (TOTAL)
 dato (Pima.tr)

 dato (Pima.te)

 Pima <- glu del rbind (Pima.tr, Pima.te
) <- Pima [, “glu”]

 } <- == “no” d1 de Pima [, “tipo”
] <- Pima [, “tipo”] == “sí”
 base.rate.d1 <- suma (d1)/(suma (d1) + suma (}))

glu.density <- densidad (glu)
 glu.d0.density <- densidad (glu [}])
 glu.d1.density <- approxfun de la densidad (glu [d1]

) (glu.d0.density$x, glu.d0.density$y) -> approxfun
 de glu.d0.f (glu.d1.density$x, glu.d1.density$y) -> glu.d1.f

 p.d.given.glu <- función (glu, base.rate.d1)
 {
p1 <- glu.d1.f (glu) * base.rate.d1
 p0 <- glu.d0.f (glu) * (1 - base.rate.d1)
 p1/(p0+p1)
}

x <- 1:250
 y <- diagrama de p.d.given.glu (x, base.rate.d1
) (x, y, type='l', col='red', xlab='glu', ylab='estimated p (diabetes|diagrama del glu) '

) (densidad (glu [}]), ylab='estimate p (glu), p (
glu de col='blue', xlab='glu',|diabetes), p (glu|no diabetes) ', líneas del main=NA
) (densidad (glu [d1]), líneas
 del col='red') (densidad (glu))

Vea también

Referencias

  • Brian D. Ripley. Reconocimiento de patrón y redes de los nervios. Cambridge: Prensa de la universidad de Cambridge, 1996.
  • Trevor Hastie, Roberto Tibshirani, y Jerome Friedman. Los elementos de aprender estadístico. Nueva York: Springer, 2001. ISBN 0-387-95284-5. (Véase el capítulo 6.)
  • D.W. Scott. Valoración Multivariate de la densidad. Teoría, práctica y visualización. Nueva York: Wiley, 1992.
  • B.W. Silverman. Valoración de la densidad. Londres: Chapman y Pasillo, 1986.
  • J.W. Smith, J.E. Everhart, W.C. Dickson, W.C. Knowler, y R.S. Johannes. “Usando el algoritmo que aprende de ADAP para pronosticar el inicio del mellitus de la diabetes”. En Procedimientos del simposio sobre aplicaciones informáticas en asistencia médica (Washington, 1988), ed. R.A. Greenes, pp. 261-265. Los Alamitos, CA: Prensa de la sociedad de la computadora de IEEE, 1988.

Acoplamientos externos


 

The original work was translated from English to Spanish. To view the original article please click here.
Creative Commons Licence