La segmentation
d'image est une opération de traitement d'images qui a pour
but de rassembler des pixels entre eux suivant des critères
pré- définis. Les pixels sont ainsi regroupés en
régions, qui constituent un pavage ou une partition de
l'image. Il peut s'agir par exemple de séparer les objets du
fond. Si le nombre de classes est égal à deux, elle est
appelée aussi binarisation.
La segmentation est une étape primordiale en
traitement d'image. À ce jour, il existe de nombreuses
méthodes de segmentation, que l'on peut regrouper en trois
principales classes:
-
Segmentation par seuillage
-
Segmentation par croissance de région (ligne de partage des
eaux).
-
Segmentation par détection de frontières (dilatation,
érosion....)
L'opération
dite de "seuillage simple" consiste à mettre à zéro
tous les pixels ayant un niveau de gris inférieur à une
certaine valeur (appelée seuil, en anglais treshold en niveaux
de gris) et à la valeur maximale les pixels ayant une valeur
supérieure. Ainsi le résultat du seuillage est une image
binaire contenant des pixels noirs et blancs, c'est la raison pour
laquelle le terme de binarisation est parfois employé. Le
seuillage permet de mettre en évidence des formes ou des
objets dans une image. Toutefois la difficulté réside
dans le choix du seuil à adopter.
Pour chaque point :
si f(x,y)>Seuil alors f(x,y)=1 sinon
f(x,y)=0.
Pour effectuer une
segmentation manuelle, il faut avoir déterminé le seuil
(la valeur de partition) à appliquer à l'image : le
seuillage permet de sélectionner les parties de l'image qui
intéressent l'opérateur. Pour sélectionner des
objets, il faut donc choisir des limites entre lesquelles les
pixels devront être pris en compte.
-
Seuillage sur les objets clairs :
On a gardé dans l'image finale
seulement les régions blanches.
-
Seuillage sur les objets sombres :
On a gardé ici seulement les
régions noires c'est à dire le chat et le
contour.
-
Seuillage par intervalle (sur les objets gris):
On a gardé seulement les régions
comprise dans l'intervalle c'est dire les montagnes et l'ombre du
chat.
Après cette opération on pourra alors
traiter l'image en appliquant des filtres pour enlever/garder
certaines région, en appliquant des outils morphologiques
...
Le seuillage n'est
pas nécessairement une opération qui s'effectue
manuellement : la valeur de seuil peut être obtenue de
manière automatique.
Le seuillage automatique est basé sur
l'analyse de la distribution en fréquence sur l'histogramme
des niveaux de gris associée à l'image. L'objectif des
méthodes de recherche de seuil automatique est de déceler
2 "populations" sur l'histogramme, et de proposer la valeur qui
permet de les séparer au mieux.
On peut distinguer comme seuillage
automatique:
-
seuillage par maximisation d'entropie
-
seuillage par variance inter-classe
-
seuillage métrique
-
seuillage par préservation des moments
-
La morphologie
mathématique
L'analyse par
morphologie mathématique vise à modifier la
structure et la forme des objets de l'image, par exemple, pour
séparer les objets, les discriminer en fonction de leur
taille, remplir les trous ...
Il existe, en fait, deux types de morphologie
mathématique, la morphologie mathématique
ensembliste et la morphologie mathématique
fonctionnelle. La première traite les images
binaires en utilisant la théorie des ensembles alors que
la seconde traite les images en niveaux de gris. Mais les
transformations d'images dans les deux cas se pratiquent de la
même manière.
C'est pour cela que toutes les fonctions
suivantes seront traitées plus en détails dans la partie
"morphologie sur image binaire" puisqu'elles utilise le même
principe mais en plus simple car il n'y a que 2 couleurs (le noir
et le blanc).
La transformation
morphologique modifie la valeur d'un pixels de l'image en fonction
de la valeur de ses voisins. Pour cela, on utilise un
élément structurant, qui est un masque
binaire.
Il permet de prendre en compte le voisinage du
pixels.
Exemple d'un élément structurant à
4-connexité:
En réalité, chaque couleur
représente un nombre: 1 pour le noir et 0 pour le
blanc.
Pour
l'érosion, l'élément structurant balaye l'image de
façon à ce que son centre x passe par tous les pixels de
l'image à traiter.
Pour chacune des positions de x, chacun des
pixels de l'élément structurant prend la valeur du pixel
de l'image sur lequel il se situe.
Le pixel de l'image qui se trouve sous le pixel
central de l'élément structurant prend la valeur
minimale.
Nous répétons cette opération pour
chaque position de l'image. Ainsi nous obtenons une nouvelle image
appellée image érodée.
Illustration:
- zone grise: image de départ.
- grille rouge: grille de séparation des
pixels.
- zones noires: image érodé
superposé à l'image de départ.
- zones vertes: élément
structurant.
Image originale; image érodée par
un élément structurant à 8-connexité; image
érodée par un élément structurant à
4-connexité
L'érosion est un des opérateurs de base
qui réduit les petites structures claires et qui élargit
les zones sombres. Par conséquent, les objets qui sont plus
petits que l'élément structurant vont disparaître.
Dans certains cas, les bords ne seront pas traités.
Voici un exemple d'érosion sur l'image
binaire du chat:
Image initiale binaire; image
érodée (4-connexité); image érodée (8-
connexités).
L'image en niveaux de gris est définie par
une fonction f qui représente l'amplitude en niveau de gris au
point x.
L’érosion en niveaux de gris
réduit la luminance des pixels qui sont entourés de
voisins de moindre intensité
L'opération de
dilatation est analogue à l'érosion. Elle consiste à
affecter au pixel courant, la valeur maximale de son
voisinage.
Dans le cas de la dilatation, l'élément
structurant correspond à un pinceau qui passe sur les contours
des formes binaires.
Illustration :
- zone noire: image de départ
superposée a l'image dilatée.
- grille rouge: grille de séparation des
pixels.
- zones grises + zone noire: image
dilatée.
- zones vertes: élément structurant,
son centre étant le pixel rayé.
Image originale; image dilatée par un
élément structurant à 8-connexité; image
dilatée par un élément structurant à
4-connexité
Les objets vont grossir de la taille de
l'élément structurant et ceux qui sont situés à
une distance moins grande que la taille de l'élément
structurant seront fusionnés. Par conséquent, les trous
dans les objets seront comblés.
Image initiale binaire; image dilatée
(4-connexité); image dilatée (8-
connexités).
La dilatation en niveaux de gris accroît la
luminance des pixels entourés de voisins plus lumineux
-
L'ouverture et la
fermeture
L'ouverture et la
fermeture sont en fait des applications des deux opérateurs
érosion et dilatation appliqués soit dans un sens, soit
dans l'autre:
-
l'ouverture, c'est l'application de l'opérateur érosion
puis de l'opérateur dilatation avec le même
élément structurant.
- la
fermeture est l'application de l'opérateur dilatation suivie
de l'opérateur érosion avec le même
élément structurant.