Chapitre 8 Modèle à blocs stochastiques

Dans ce chapitre, nous présentons un nouveau modèle de graphe aléatoire, le modèle à blocs stochastiques ou stochastic block model (SBM). Son intérêt est multiple:

  • forte capacité de modéliser des réseaux hétérogènes avec des hubs, des communautés et/ou des structures bi- ou multipartis. Le SBM s’ajuste bien à un très grand nombre de graphes issus d’applications. En quelque sorte, le SBM est pour les graphes ce qu’est le modèle de mélange pour les données univariées ou vectorielles.

  • étant un modèle génératif, il est facile de simuler des graphes selon un SBM ;

  • l’interprétatbilité des paramètres du modèle est un grand avantage pour les applications ;

  • la procédure d’estimation fournit automatiquement un clustering des noeuds, ce qui augmente l’interprétatibilité du modèle.

Le grand inconvénient du modèle est que l’estimation des paramètres est difficile. En fait, le SBM est un modèle à variables latentes, mais la strucutre de dépendance du modèle est complexe et rend l’estimation difficile.

D’ailleurs, un cas particulier est le modèle de Erdös-Rényi ou \(G(n,p)\). Mais d’un point de vue statistique, c’est le cas le moins intéressant, car on est plus intéressé par les graphes hétérogènes.