You are on page 1of 75

Centralidad y algunas medidas

Universidad Nacional de Colombia


Sede Manizales

22 de agosto de 2014

Centralidad y algunas medidas

Medidas y metricas
Como bien sabemos, la estructura de un grafo nos permite calcular
una variedad de cantidades o medidas u
tiles que capturan
caractersticas particulares de el.

Centralidad y algunas medidas

Grado de centralidad
Una gran cantidad de investigaciones sobre redes se han planteado
la pregunta: Cuales son los vertices mas centrales o importantes
en una red?[New10]

Centralidad y algunas medidas

Eigenvector Centrality

Podemos pensar el grado de centralidad, como una asignacion de


centralidad para cada red de vecinos que tiene un vertice. No
todos los vecinos son equivalentes. En muchas circunstancias la
importancia de un vertice se ve incrementada por el n
umero de
conexiones que tiene con otros vertices que son ellos mismos
importantes.

Centralidad y algunas medidas

Eigenvector Centrality

Hagamos una suposici


on inicial xi de centralidad de cada vertice i.
Supongamos por ejemplo xi = 1, esto no es una medida u
til de
centralidad, pero puede usarse para hallar una mejor x0i . La cual
podemos definir como la suma
X
Aij xj
(1)
x0i =
j

donde Aij es un elemento de la matriz de adyacencia, en notacion


matricial x0 = Ax donde x0 es un vector con las medidas de
centralidad.

Centralidad y algunas medidas

Eigenvector Centrality

Repitiendo este proceso con el fin de obtener una mejor


estimacion, al cabo de t pasos el vector x(t) estara dado por
x(t) = At x(0)

Centralidad y algunas medidas

(2)

Eigenvector Centrality

Ahora escribamos x(0) como combinaci


on lineal de los vectores
propios vi de la matriz de adyacencia:
X
x(0) =
ci vi
(3)
i

Centralidad y algunas medidas

Eigenvector Centrality

La expresion (2) quedara:


x(t) = A

X
i

ci vi =

X
i

ci kit vi

kjt

X
i


ci

ki
kj

t
vi ,

(4)

donde cada ki son los valores propios de la matriz de adyacencia y


kj el mayor de todos ellos.

Centralidad y algunas medidas

Eigenvector Centrality

Dado que xxji < 1 para todo i 6= j, los terminos de la suma,


excepto el j decaen exponencialmente a medida que t aumenta y
obtenemos
x(t) cj kjt vj .
(5)
En otras palabras, el vector lmite de centralidades es simplemente
proporcional al lder de los vectores propios de la matriz de
adyacencia.

Centralidad y algunas medidas

Eigenvector Centrality

Equivalentemente podramos decir que la centralidad x satisface


Ax = kj x.
Este es entonces el eigenvector centrality propuesto inicialmente
por [Bon87].

Centralidad y algunas medidas

(6)

Eigenvector Centrality

Finalmente, como se haba afirmado, la centralidad xi del vertice i


es proporcional a la suma de las centralidades de los vecinos
X
xi = kj1
Air xr ,
(7)
r

note que esta medida tiene una buena propiedad, y es que puede
ser muy grande debido a que tiene muchos vecinos o sus vecinos
son muy importantes (o ambos).

Centralidad y algunas medidas

Eigenvector Centrality

Ademas, note que la ecuaci


on (6) no dice nada sobre
normalizacion, esto no importa, pues nos interesa saber que tan
alto o bajo es su nivel de centralidad y no ubicarlos en una escala
absoluta.

Centralidad y algunas medidas

Eigenvector Centrality

En teora eigenvector centrality puede ser calculado para los


casos de redes dirigidas y no dirigidas. Sin embargo, trabaja mejor
para el segundo caso; en el caso de redes dirigidas aparecen ciertas
complicaciones. Primero que todo, las redes dirigidas tienen una
matriz de adyacencia que en general, es asimetrica. Esto implica
que tiene dos conjuntos de valores propios, los vectores propios
izquierdos y los vectores propios derechos.

Centralidad y algunas medidas

Eigenvector Centrality

Cual de los dos conjuntos debe ser usado para definir


eigenvector centrality? La respuesta depende si queremos definir
esta medida de centralidad de un vertice dando importancia a las
relaciones que apuntan hacia el o las que salen de el.

Centralidad y algunas medidas

Eigenvector Centrality

El n
umero de citaciones de publicaciones que se hagan en un
artculo no significa que sea muy importante. Sin embargo, el
n
umero de citaciones que hagan de este es un claro indicador de
que tan importante o u
til es. Por otro lado, si un artculo cita a
otro, no significa que alla halla sido citado.

Centralidad y algunas medidas

Eigenvector Centrality

Por lo tanto, la correcta definici


on para este ejemplo de
eigenvector centrality de un vertice i en una red dirigida, se hace
proporcional a la centralidad de los vertices que apuntan hacia el.
X
xi = kj1
Air xr ,
(8)
r

la cual da Ax = kj x en notaci
on matricial, donde x es el vector
propio principal derecho de A.

Centralidad y algunas medidas

Eigenvector Centrality

Figura : Porci
on de una red dirigida.

Centralidad y algunas medidas

Eigenvector Centrality

Sin embargo, todava hay problemas con una red dirigida.


Considere la Figura 1.

Centralidad y algunas medidas

Eigenvector Centrality

El vertice A en la figura esta conectado a los demas vertices del


grafo, pero solo tiene aristas que parten de el y ninguna que llegue.
Por lo tanto este vertice tendra siempre eigenvector centrality
igual a cero. Como consecuencia, el eigenvector centrality del
vertice B sera cero, pues el u
nico termino de la ecuacion (8) es
igual a cero.

Centralidad y algunas medidas

Eigenvector Centrality

Observacion
En terminos matematicos, para redes acclicas el eigenvector
centrality de todos los vertices sera cero.
Una variacion de eigenvector centrality que permite solucionar
estos problemas es la katz centrality la cual abordaremos a
continuacion.

Centralidad y algunas medidas

Katz Centrality

Una solucion a los problemas de la secci


on anterior es la siguiente:
asignaremos una peque
na cantidad de centralidad de cierta manera
libre. Esto sin importar la posici
on en la red o la centralidad de
sus vecinos.

Centralidad y algunas medidas

Katz Centrality

En otras palabras, definiremos


X
xi =
Air xi + ,

(9)

donde y son constantes positivas. La primera parte es el


termino de eigenvector centrality en el cual los vertices enlazados
a i son sumados y la segunda parte es el termino libre, la cual
reciben todos los vertices.

Centralidad y algunas medidas

Katz Centrality

La Ecuacion (9) en terminos matriciales pueden se escritos como,


x = Ax + U,
Donde U es el vector (1, 1, . . . , 1).

Centralidad y algunas medidas

(10)

Katz Centrality

Despejando x, podemos ver que


x = (I A)1 U,

(11)

esto si es posible invertir el termino I A. Esta medida de


centralidad fue inicialmente propuesta por Katz en 1953 [Kat53].

Centralidad y algunas medidas

Katz Centrality

Si queremos hacer uso de katz centrality debemos escoger un


valor para la constante . De hecho es importante entender que
no debe ser arbitrariamente grande. Por otro lado si 0,
solamente sobrevivira el termino constante en la Ecuacion (9) y
todos los vertices tendran la misma centralidad . Usualmente se
escogen valores inferiores a 1/kj .

Centralidad y algunas medidas

Katz Centrality

Un problema que surge al aplicar esta medida es que se le asignan


peque
nos valores positivos a vertices que no son centrales.
Otro problema surge al aplicar la Ecuaci
on (11) a redes muy
grandes, pues hallar la inversa de una matriz cuadrada de tama
no
n requiere un tiempo de computaci
on proporcional a n3 .

Centralidad y algunas medidas

Katz Centrality

Para este u
ltimo es u
til hacer una aproximaci
on haciendo uso de la
Ecuacion (9) (o equivalentemente la Ecuaci
on (10)). Luego
calcular una mejor estimaci
on
x0 = Ax + U.

Centralidad y algunas medidas

(12)

Katz Centrality

Si repetimos muchas veces este proceso, el valor x converge a un


valor cercano de la centralidad correcta.

Centralidad y algunas medidas

Katz Centrality

Una posible variacion a katz centrality podra ser considerar una


medida un poco mas general
X
xi =
Air + i .
(13)
r

Entonces el vector x de centralidades esta dado por


x = (I A)1 .
Donde es un vector cuyos elementos son los i .

Centralidad y algunas medidas

(14)

Katz Centrality

Una buena caracterstica de este enfoque es que la parte dficil del


calculo (la inversion de la matriz) solamente se hace para una
propuesta de . Para diferentes escogencias de i no necesitamos
recalcular la inversa, simplemente multiplicarla con diferentes
vectores .

Centralidad y algunas medidas

Closeness Centrality

Una medida totalmente diferente de centralidad es proporcionada


por closeness centrality, la cual implica conocer la media de las
distancias de un vertice a otros.

Centralidad y algunas medidas

Closeness Centrality

Primero debemos conocer el concepto de camino geodesico, esto


es el camino mas corto a traves de la red entre dos vertices.
Supongamos que dij es el tama
no del camino geodesico de los
vertices i a j.

Centralidad y algunas medidas

Closeness Centrality

Entonces
li =

1X
dij ,
n

(15)

es la distancia media mas corta, del vertice i a todos los demas


vertices de una red.

Centralidad y algunas medidas

Closeness Centrality

En muchos textos, es com


un encontrarse con autores que excluyen
el termino i = j, por lo que la Ecuaci
on (15) quedara como:
li =

1 X
dij ,
n1

(16)

j(6=i)

es la distancia media mas corta, del vertice i a todos los demas


vertices de una red.

Centralidad y algunas medidas

Closeness Centrality

Dado que por definicion dii es cero este termino no influye en la


suma. La u
nica diferencia entre ambas ecuaciones es el termino
1/(n 1) en lugar de 1/n. El significado de li cambia por un
factor de n/(n 1). Dado que este factor no depende de i en la
mayora de los casos es posible ignorar las diferencias entre las
Ecuaciones (15) y (16).

Centralidad y algunas medidas

Closeness Centrality

La distancia media li no es una medida de centralidad como las


otras consideradas hasta ahora. Puesto que se obtienen valores
bajos para vertices mas centrales y valores altos para otros menos
centrales.

Centralidad y algunas medidas

Closeness Centrality

Es com
un calcular la inversa de li en vez de la misma li . Esta
inversa es llamada closeness centrality Ci :
Ci =

1
n
=P
.
li
j dij

Esta es una medida muy natural de centralidad para ciertos


estudios de redes. Sin embargo tiene algunos problemas.

Centralidad y algunas medidas

(17)

Closeness Centrality

El primer problema es la dificultad de diferenciar entre vertices


centrales y otros no tanto. Esto debido al comportamiento
logartmico de la medida.

Centralidad y algunas medidas

Closeness Centrality

Surge otro problema al usar closeness centrality. Generalmente se


suele definir la distancia de un camino geodesico entre dos vertices
como infinito, si los vertices se encuentran en componentes
diferentes de una red. Entoces li es infinito para cualquier i en una
red con mas de una componente y Ci es cero.

Centralidad y algunas medidas

Closeness Centrality

Hay dos estrategias para solucionar esto. Una de las mas comunes
es simplemente considerar el promedio sobre aquellos vertices que
estan en la misma componente que i. Entonces n en la Ecuacion
(15) se convierte en el n
umero de vertices en la componente y la
suma es solamente sobre la misma componente.

Centralidad y algunas medidas

Closeness Centrality

Esto nos da una medida finita, aunque con sus propios problemas.
En particular las distancias geodesicas tienden a ser peque
nas en
componentes peque
nas. Entonces vertices en componentes
peque
nas tienden a tener medidas mas grandes que otros vertices
de la misma red pero en componentes mas grandes.

Centralidad y algunas medidas

Closeness Centrality

Tal vez, una mejor soluci


on, sera redefinir closeness centrality en
terminos de la distancia harm
onica media entre dos vertices, por
ejemplo, el promedio de la inversa de las distancias:
Ci0 =

1 X 1
n1
dij
j(6=i)

Centralidad y algunas medidas

(18)

Hubs and Authorities

Introduccion
En el caso de redes dirigidas, hay otro par de medidas de
centralidad un poco intuitivas. A grandes rasgos, hemos
considerado medidas que asignan una alta centralidad a vertices si
aquellos que apuntaban a el tienen alta centralidad. Sin embargo,
en algunas redes es apropiado tambien acordar que un vertice tiene
alta centralidad si apuntan a otros con alta centralidad.

Centralidad y algunas medidas

Hubs and Authorities

Aspectos relevantes

Centralidad y algunas medidas

Hubs and Authorities

Aspectos relevantes
authorities son nodos que contienen informacion informacion
u
til sobre un tema de interes.

Centralidad y algunas medidas

Hubs and Authorities

Aspectos relevantes
authorities son nodos que contienen informacion informacion
u
til sobre un tema de interes.
hubs son nodos que nos dicen donde los mejores authorities
van a ser encontrados.

Centralidad y algunas medidas

Hubs and Authorities

Aspectos relevantes
authorities son nodos que contienen informacion informacion
u
til sobre un tema de interes.
hubs son nodos que nos dicen donde los mejores authorities
van a ser encontrados.
Un authority puede ser un hub y viceversa.

Centralidad y algunas medidas

Hubs and Authorities

Algoritmo
Estas ideas fueron propuestas por [Kle99] y desarrolladas por
dentro de un algoritmo de centralidad llamado hyperlink-induced
topic search o HITS

Centralidad y algunas medidas

Hubs and Authorities

Algoritmo

Centralidad y algunas medidas

Hubs and Authorities

Algoritmo
Le asigna a cada vertice i una centralidad authority xi y una
centralidad hub yi .

Centralidad y algunas medidas

Hubs and Authorities

Algoritmo
Le asigna a cada vertice i una centralidad authority xi y una
centralidad hub yi .
xi es alto, si el vertice i es se
nalado por muchos vertices
hubs, es decir, vertices con alta centralidad hub.

Centralidad y algunas medidas

Hubs and Authorities

Algoritmo
Le asigna a cada vertice i una centralidad authority xi y una
centralidad hub yi .
xi es alto, si el vertice i es se
nalado por muchos vertices
hubs, es decir, vertices con alta centralidad hub.
yi es alto, si el nodo i apunta a muchos vertices con alta
centralidad authority.

Centralidad y algunas medidas

Hubs and Authorities

En el trabajo de Kleinberg, la centralidad authority se


definio como la suma proporcional de las centralidades hub de los
vertices que apuntan hacia el:
X
Aij yj ,
(19)
xi =
j

donde es una constante.

Centralidad y algunas medidas

Hubs and Authorities

Similarmente la centralidad hub de un vertice es proporcional a la


suma de las centralidades authority de los vertices que el seala:
X
yi =
Aji xj ,
(20)
j

con otra constante.

Centralidad y algunas medidas

Hubs and Authorities

En terminos matriciales
x = Ay,

y = AT x,

(21)

AT Ay = y,

(22)

combinando ambas ecuaciones:


AAT x = x,
donde = ()1 .

Centralidad y algunas medidas

Hubs and Authorities

Las medidas hub y authority son inmediatamente determinadas


por el lder de los vectores propios de AAT y AT A. De los
contrario no podramos satisfacer ambas condiciones en la
Ecuacion 22[New10].

Centralidad y algunas medidas

Hubs and Authorities

Usualmente se suele resolver el sistema en la Ecuacion 22 para


encontrar el valor de x y hacer y = AT x.

Centralidad y algunas medidas

Hubs and Authorities

Note que AAT es la matriz de co-citaciones y AT A es la matriz de


acoplamiento bibliografico.

Centralidad y algunas medidas

Hubs and Authorities


Ventajas

Centralidad y algunas medidas

Hubs and Authorities


Ventajas
Evade el problema que tiene eigenvector centrality con las
redes dirigidas.

Centralidad y algunas medidas

Hubs and Authorities


Ventajas
Evade el problema que tiene eigenvector centrality con las
redes dirigidas.
Es quizas una soluci
on mas elegante a la centralidad en redes
dirigidas, como en el caso de a
nadir una peque
na cantidad
como en la Ecuaci
on 9.

Centralidad y algunas medidas

Hubs and Authorities


Ventajas
Evade el problema que tiene eigenvector centrality con las
redes dirigidas.
Es quizas una soluci
on mas elegante a la centralidad en redes
dirigidas, como en el caso de a
nadir una peque
na cantidad
como en la Ecuaci
on 9.
Puede introducirse un termino constante o incluso la
normalizacion de la centralidad de vertices por el grado de
vertices que apuntan a ellos. [BRRT01, NZJ01]

Centralidad y algunas medidas

Eigentrust

Introduccion
Piense en el sistema de reputaciones de eBay, compradores y
vendedores pueden calificarse unos a otros despues de cada
transaccion[KSGM03]. La reputaci
on general de cada persona es la
suma de las calificaciones de los u
ltimos seis meses.

Centralidad y algunas medidas

Eigentrust

En cierto ambiente, un individuo i puede hacer una transaccion de


el individuo j, este puede calificarlo de manera positiva
(tr(i, j) = 1) o de manera negativa (tr(i, j) = 1).
Como el modelo de eBay, puede definirse un valor local de
confianza sij como la suma de las calificaciones que ha hecho el
individuo i al individuo j:
X
sij =
trij
(23)
= sat(i, j) unsat(i, j)

Centralidad y algunas medidas

(24)

Eigentrust

Con la intension de generar una escala normalizada, se puede hacer


un valor de confianza normalizado
m
ax (sij , 0)
cij = P
ax (sij , 0)
j m

Centralidad y algunas medidas

(25)

Eigentrust

Una forma natural de agregar estos valores de confianza es:


X
tik =
cij cjk ,

(26)

donde tik representa la confianza que el vertice i asigna al vertice


k basado en la opinion de sus amigos.

Centralidad y algunas medidas

Eigentrust

Si C es la matriz [cij ] y t~i el vector que contiene los valores tik , la


Ecuacion 26 en forma matricial puede ser expresada como
t~i = C T c~i

Centralidad y algunas medidas

Eigentrust

Sin embargo los valores anteriores solo reflejan la confianza de un


vertice a otros basado en su experiencia.
Con el fin de tener una gran opini
on el vertice i podra explorar la
opinion de los vecinos de sus vecinos (t = (C T )2 ci ). Si
continuamos con esta idea, t = (C T )2 ci , tendramos una opinion
completa del vertice i cuando n es muy grande.

Centralidad y algunas medidas

Eigentrust

Por otro lado, podemos simplemente considerar:


~t = (C T )n~e
donde ~e es un vector de dimensi
on m, que representa la
probabilidad uniforme de todos los m vertices.

Centralidad y algunas medidas

(27)

Eigentrust

Nociones previas de confianza


Supongamos que conocemos cierto conjunto de vertices P que son
confiables, entonces puede definirse

1/|P |,
si i P
pi =
(28)
0,
en otro caso

Centralidad y algunas medidas

Eigentrust

vertices inactivos
Observe que es posible que la Ecuaci
on 25 no este definida, en este
caso cij redefinida sera
( max s ,0
P
ij
P
,
si
ax(sij , 0) 6= 0
j m
m
a
x(s
,0)
ij
j
cij =
(29)
pj ,
en otro caso

Centralidad y algunas medidas

Eigentrust

Colectivos maliciosos
~t(k+1) = (1 a)C T ~t(k) + a~
p

Centralidad y algunas medidas

(30)

References I

P. F. Bonacich.
Power and centrality: A family of measures.
Am. J. Sociol, 33:11701182, 1987.
A. Borodin, G. O. Roberts, J. S. Rosenthal, and P. Tsaparas.
Finding authorities and hubs from link structures on the world
wide web, in v. y. shen, n. saito, m. r. lyu, and m. e. zurko,
eds.
In Proceedings of the 10th International World Wide Web
Conference, pages 415429. Association of Computing
Machinery, New York, 2001.

Centralidad y algunas medidas

References II
L. Katz.
A new status index derived from sociometric analysis.
Psychometrika, 18(3943), 1953.
J. M. Kleinberg.
Authoritative sources in a hyperlinked environment.
J. ACM, 46:604632, 1999.
Sepandar D. Kamvar, Mario T. Schlosser, and Hector
Garcia-Molina.
The eigentrust algorithm for reputation management in p2p
networks.

Centralidad y algunas medidas

References III
In Proceedings of the 12th International Conference on World
Wide Web, WWW 03, pages 640651, New York, NY, USA,
2003. ACM.
M.E.J. Newman.
Networks: An Introduction.
Oxford, UK: Oxford University Press, 2010.
A. Y. Ng, A. X. Zheng, and M. I. Jordan.
Stable algorithms for link analysis, in d. h. kraft, w. b. croft, d.
j. harper, and j. zobel, eds.
In Proceedings of the 24th Annual International ACM SIGIR
Conference on Research and Development in Information
Retrieval, pages 258266. Association of Computing
Machinery, New York, 2001.
Centralidad y algunas medidas

You might also like