Il TrustRank è una tecnica che si compie per identificare, operazione non di un robot ma di una persona fisica, quali siti web presentano delle oagine “utili” agli internauti oppure, in caso contrario, rientrino nella categoria dello spam.
Redattori umani aiutano a combattere lo spam dei motori di ricerca. Il TrustRank mette un voto di fiducia su una serie di siti recensiti per aiutare i motori di ricerca ad identificare le pagine di spam.
L’algoritmo TrustRank è un procedimento per valutare la qualità dei siti ed è stata pubblicata da Gyongyi, Garcia-Molina e Pedersen nel 2004. L’idea di base è simile al PageRank. L’algoritmo può essere visto come un ulteriore sviluppo del procedimento PageRank. Tuttavia, l’ulteriore sviluppo non è necessariamente un miglioramento.
Il punto di partenza dell’algoritmo è la selezione di pagine attendibili a mano. Queste pagine sono le fonti di fiducia. La fiducia può essere trasferita ad un’altra pagina, inserendo un link ad essa.
Il Trust Rank prevede diverse fasi:
1) l’algoritmo seleziona un gruppo di pagine di cui non è chiara la qualità dei contenuti
2) un esperto umano esamina le pagine e comunica all’algoritmo quali possono essere definite spam e quali no
3) l’algoritmo infine identifica le altre pagine sulle basi della precedente classificazione umana.
La tecnica del TrustRank può essere utilizzato per:
– aumentare le pagine web che hanno una più alta probabilità di essere valide
– aiutare i motori di ricerca ad accrescere il posizionamento in base all’effettiva qualità