Il existe une solution au problème évoqué
précedemment. Il s'agit en
pratique d'allouer une contrainte temporelle au niveau des connexions pour
pouvoir finalement établir un nombre de visiteurs approchant de la
réalité.
On suppose donc qu'un utilisateur lambda navigue sur ses sites
préférés
de manière un peu pragmatique. Il suffit de fixer le temps maximum pour
lire une page et le tour est joué. En pratique ce temps est variable, de
l'ordre de 20 à 30 minutes, on n'a en effet rarement vu des personnes
scotchées sur la même page pendant un temps aussi long même avec des textes
d'une longueur conséquente. On considère donc que si une personne ne
consulte plus aucun document pendant une période de 20 à
30 minutes, c'est
que cette personne a quitté le site. Si par hasard il s'agissait de l'heure de sa
pause café et qu'il est toujours sur le même site, le prochain document
demandé sera considéré comme le début d'une
nouvelle session. Donc
la méthode n'est pas parfaite mais c'est actuellement la plus satisfaisante.
Un second paramétre permet de différencier les visites humaines des
visites liées à des programmes (robot,indexation...) : le temps
maximum sur le site. Il est peu probable de voir des personnes consulter
chaque page d'un site de manière ordonnée et ce pendant des heures et des
heures !
Une fois ces deux régles établies, il est alors possible d'extraire
une multitude de précieuses informations sur le parcours de chaque visite :
la durée d'une visite moyenne, l'histogramme des visites, le degré
de fidélité...