Entendiendo que EducaciĂ³n es....

"Como hombres libres ,debemos luchar decididamente contra esa nueva forma de esclavitud que a tantos subyuga en tantas partes del mundo, especialmente entre la juventud a la que es necesario prevenir a toda costa"
Beato Juan Pablo II Cartagena Junio de 1986


domingo, 20 de mayo de 2012

Ahora si entrando en tema...(2)


Redes Bayesianas

Siguiendo a Kadie, Hovel y Horvitz (2001) dirĂ­amos que una red bayesiana es un conjunto de variables, una estructura grĂ¡fica conectando estas variables y un conjunto de distribuciones de probabilidad condicional. Codifica incertidumbre asociada a cada variable por medio de probabilidades y, gracias al teorema de Bayes, esta incertidumbre es susceptible de ser modificada con base en observaciones (o evidencias) sobre el modelo.

       Una vez mĂ¡s explicarĂ© las caracterĂ­sticas sobresalientes de estas herramientas utilizando datos del problema que nos ocupa

 
Los grĂ¡ficos siguientes son capturas del trabajo realizado en el GeNie 2.0 y corresponden a un modelo anterior al consejero Virtual




                                                                                                                                                                                                                           

Se puede afirmar que una Red  Bayesiana tiene en realidad dos dimensiones:

DimensiĂ³n cualitativa: desde esta perspectiva se puede decir que una RB es un grafo, es decir una representaciĂ³n grĂ¡fica de un determinado problema.
EstĂ¡ compuesto por.

  • Nodos: cada uno de los Ă³valos representa una variable aleatoria, es decir uno de los factores que constituyen el problema.

Dichas variables pueden tomar diferentes valores tal como se observa en la siguiente tabla para este caso en particular:

Vulnerabilidad
Alta
Baja
Familiares_Tempranos
Favorables
Desfavorables
Familiares_Actuales
Favorables
Desfavorables
Sociales_Actuales
Favorables
Neutros
Desfavorables
Cambios_Adolescencia
Aceptados
No_Aceptados

  En este caso el Nodo  principal, o Nodo Objetivo es la Vulnerabilidad ya que la meta de la inferencia es determinar la probabilidad de que un individuo resulte vulnerable al consumo abusivo a partir de la informaciĂ³n recopilada  sobre los distintos factores de riesgo

  • ·   Las Aristas que relacionan los distintos Nodos modelan la dependencia condicional que existe entre ellos , por ejemplo:


Se observa en esta porciĂ³n extraĂ­da de la red principal que las aristas son en realidad flechas, esto se expresa diciendo que las Redes Bayesianas son Grafos Dirigidos, es decir grĂ¡ficas en las cuales importa el orden en que se relacionan los dos Nodos que definen cada arista.

      Esto se explica en forma elemental a partir del Teorema de Bayes:
En efecto:
·         El Nodo que recibe la flecha  (Nodo Hijo) es  condicionalmente dependiente del
                Nodo del cual parte la flecha (Nodo Padre).

      Traducido en palabras simples, puede decirse que en el trozo elegido:

1)          Los factores sociales actuales ejercen influencia sobre los factores familiares
        tempranos.
2)          Los factores familiares tempranos  influyen sobre los cambios en la
        adolescencia
3)          Los cambios en la adolescencia influyen finalmente sobre la vulnerabilidad

      Esto significarĂ­a, por ejemplo que partiendo de esta dependencia puede calcularse la probabilidad de que los factores  Familiares_Tempranos sean “Favorables” si se conoce como evidencia que los factores Sociales_Actuales  son “Favorables” utilizando el Teorema de Bayes tal como ha sido descrito anteriormente[1]

   Esto permite la actualizaciĂ³n de las probabilidades “a priori” de los distintos nodos a partir de las evidencias y de las relaciones de dependencia entre ellos y sus padres.

    Igualmente es importante consignar que el grafo refleja tambiĂ©n las relaciones de Independencia entre Nodos (aquellos que no se encuentran relacionados por flechas), en cuyo caso, la evidencia de un valor en uno no tiene efecto sobre la probabilidad de los valores en el otro.
 
  • DimensiĂ³n Cualitativa :
 Asociada a cada Nodo de la red existe una tabla en la que se ingresan todas las probabilidades previamente elicitadas. 
Se conoce como  elicitaciĂ³n al proceso de extracciĂ³n del conocimiento del experto


En el ejemplo en cuestiĂ³n, por ejemplo el nodo  Sociales_Actuales (que no tiene padres) tiene asignadas las siguientes probabilidades “a priori”, para cada uno de sus valores.

(En este caso los valores los he colocado yo para poder ver la red en funcionamiento, pero  realmente deben ser obtenidos a partir de la experiencia de un profesional idĂ³neo)


Puede observarse que como los tres valores son mutuamente excluyentes la suma de las probabilidades de los tres debe ser igual a 1

       Para el nodo Familiares_Tempranos que ya posee un padre (Sociales_Actuales), la tabla presenta ya las probabilidades condicionadas en funciĂ³n de los valores de dicho padre
 
 
   El agregado de estas tablas constituyen lo que se conoce como la funciĂ³n de probabilidad conjunta, el cual junto con el grĂ¡fico y las variables que representan, conforman el modelo probabilĂ­stico que constituye la base de conocimientos sobre la que opera el SE.

  El manejo de la inferencia  es realizado por un Algoritmo basado en el Teorema de Bayes y cuya funciĂ³n es propagar el impacto de las evidencias a travĂ©s de los nodos de la red, calculando para cada uno las correspondientes  probabilidades  “a posteriori”.

Existen varios tipos de algoritmos para la propagaciĂ³n de evidencias : 

 Un algoritmo de propagaciĂ³n se denomina exacto si calcula las probabilidades de los nodos sin otro error que el resultante del redondeo producido por las limitaciones de cĂ¡lculo del ordenador.

Estos algoritmos no siempre pueden aplicarse y muchas veces resultan ineficientes cuando la red a la que deben aplicarse contiene un nĂºmero muy grande nodos y resulta altamente compleja.

En esos casos, se aplican algoritmos “aproximados”, es decir que calculan las probabilidades condicionales de los nodos de forma aproximada.

Convenientemente utilizados, estos algoritmos pueden ofrecer estimaciones lo suficientemente correctas en todos los casos y con un gasto computacional mas adecuado.




.

No hay comentarios:

Publicar un comentario