Il existe une solution au problème évoqué précedemment. Il s'agit en pratique d'allouer une contrainte temporelle au niveau des connexions pour pouvoir finalement établir un nombre de visiteurs approchant de la réalité.
On suppose donc qu'un utilisateur lambda navigue sur ses sites préférés de manière un peu pragmatique. Il suffit de fixer le temps maximum pour lire une page et le tour est joué. En pratique ce temps est variable, de l'ordre de 20 à 30 minutes, on n'a en effet rarement vu des personnes scotchées sur la même page pendant un temps aussi long même avec des textes d'une longueur conséquente. On considère donc que si une personne ne consulte plus aucun document pendant une période de 20 à 30 minutes, c'est que cette personne a quitté le site. Si par hasard il s'agissait de l'heure de sa pause café et qu'il est toujours sur le même site, le prochain document demandé sera considéré comme le début d'une nouvelle session. Donc la méthode n'est pas parfaite mais c'est actuellement la plus satisfaisante.
Un second paramétre permet de différencier les visites humaines des visites liées à des programmes (robot,indexation...) : le temps maximum sur le site. Il est peu probable de voir des personnes consulter chaque page d'un site de manière ordonnée et ce pendant des heures et des heures !
Une fois ces deux régles établies, il est alors possible d'extraire une multitude de précieuses informations sur le parcours de chaque visite : la durée d'une visite moyenne, l'histogramme des visites, le degré de fidélité...