Redes Bayesianas
Siguiendo a Kadie, Hovel y Horvitz
(2001) dirĂamos que una red bayesiana es un conjunto de variables, una
estructura grĂ¡fica conectando estas variables y un conjunto de distribuciones
de probabilidad condicional. Codifica incertidumbre asociada a cada variable
por medio de probabilidades y, gracias al teorema de Bayes, esta incertidumbre
es susceptible de ser modificada con base en observaciones (o evidencias) sobre
el modelo.
Los grĂ¡ficos siguientes son capturas del
trabajo realizado en el GeNie 2.0 y corresponden a un modelo anterior al
consejero Virtual
Se puede afirmar que una Red
Bayesiana tiene en realidad dos dimensiones:
DimensiĂ³n cualitativa: desde esta perspectiva se puede decir
que una RB es un grafo, es decir una representaciĂ³n grĂ¡fica de un
determinado problema.
EstĂ¡ compuesto por.
- Nodos: cada uno de los Ă³valos representa una variable aleatoria, es decir uno de los factores que constituyen el problema.
Dichas variables pueden tomar
diferentes valores tal como se
observa en la siguiente tabla para este caso en particular:
Vulnerabilidad
|
Alta
Baja
|
Familiares_Tempranos
|
Favorables
Desfavorables
|
Familiares_Actuales
|
Favorables
Desfavorables
|
Sociales_Actuales
|
Favorables
Neutros
Desfavorables
|
Cambios_Adolescencia
|
Aceptados
No_Aceptados
|
En este caso el Nodo principal, o Nodo Objetivo es la
Vulnerabilidad ya que la meta de la inferencia es determinar la
probabilidad de que un individuo resulte vulnerable al consumo abusivo a partir
de la informaciĂ³n recopilada
sobre los distintos factores de riesgo
- · Las Aristas que relacionan los distintos Nodos modelan la dependencia condicional que existe entre ellos , por ejemplo:
Se observa en
esta porciĂ³n extraĂda de la red principal que las aristas son en realidad
flechas, esto se expresa diciendo que las Redes Bayesianas son Grafos
Dirigidos, es decir grĂ¡ficas en las cuales importa el orden en que se
relacionan los dos Nodos que definen cada arista.
Esto se explica en forma elemental a
partir del Teorema de Bayes:
En efecto:
·
El Nodo que recibe la flecha (Nodo Hijo) es condicionalmente dependiente del
Nodo del cual parte la flecha
(Nodo Padre).
Traducido en palabras simples, puede
decirse que en el trozo elegido:
1)
Los factores sociales actuales ejercen
influencia sobre los factores familiares
tempranos.
2)
Los factores familiares tempranos influyen sobre los cambios en la
adolescencia
3)
Los cambios en la adolescencia influyen
finalmente sobre la vulnerabilidad
Esto significarĂa, por ejemplo que
partiendo de esta dependencia puede calcularse la probabilidad de que los
factores Familiares_Tempranos sean
“Favorables” si se conoce como evidencia que los factores
Sociales_Actuales son “Favorables”
utilizando el Teorema de Bayes tal como ha sido descrito anteriormente[1]
Esto
permite la actualizaciĂ³n de las probabilidades “a priori” de los distintos
nodos a partir de las evidencias y de las relaciones de dependencia entre ellos
y sus padres.
Igualmente es importante consignar que el
grafo refleja también las relaciones de Independencia entre Nodos (aquellos que
no se encuentran relacionados por flechas), en cuyo caso, la evidencia de un
valor en uno no tiene efecto sobre la probabilidad de los valores en el otro.
- DimensiĂ³n Cualitativa :
Asociada a cada Nodo de la red existe una
tabla en la que se ingresan todas las probabilidades previamente elicitadas.
Se conoce como elicitaciĂ³n al proceso de extracciĂ³n del conocimiento del experto
En el ejemplo
en cuestiĂ³n, por ejemplo el nodo
Sociales_Actuales (que no tiene padres) tiene asignadas las siguientes
probabilidades “a priori”, para cada uno de sus valores.
(En este caso los valores los he colocado yo para poder ver la red en funcionamiento, pero realmente deben ser obtenidos a partir de la experiencia de un profesional idĂ³neo)
Puede
observarse que como los tres valores son mutuamente excluyentes la suma de las
probabilidades de los tres debe ser igual a 1
El agregado de estas tablas constituyen lo
que se conoce como la funciĂ³n de
probabilidad conjunta, el
cual junto con el grĂ¡fico y las variables que representan, conforman el modelo probabilĂstico que constituye
la base de conocimientos sobre la que opera el SE.
El manejo de la inferencia es realizado por un Algoritmo basado en el Teorema de Bayes y cuya
funciĂ³n es propagar el impacto de las evidencias a travĂ©s de los nodos de la
red, calculando para cada uno las correspondientes probabilidades “a posteriori”.
Existen varios
tipos de algoritmos para la propagaciĂ³n de evidencias :
Un algoritmo
de propagaciĂ³n se denomina exacto si
calcula las probabilidades de los nodos sin otro error que el resultante del redondeo
producido por las limitaciones de cĂ¡lculo del ordenador.
Estos
algoritmos no siempre pueden aplicarse y muchas veces resultan ineficientes
cuando la red a la que deben aplicarse contiene un nĂºmero muy grande nodos y
resulta altamente compleja.
En esos casos,
se aplican algoritmos “aproximados”, es decir que calculan las probabilidades
condicionales de los nodos de forma aproximada.
Convenientemente
utilizados, estos algoritmos pueden ofrecer estimaciones lo suficientemente
correctas en todos los casos y con un gasto computacional mas adecuado.
No hay comentarios:
Publicar un comentario