AniBlurbs (Column)

Anibal's thoughts on Online Marketing Strategy, Service Design, Tech, Innovation, Business and more…

Google, Microsoft en 1 April (UPDATE)

Op Google’s officiële blog werd onlangs bekend gemaakt dat ze 1 biljoen URL’s hebben geïndexeerd.

Theoretisch, want zoals ze zelf al vermelden is het aantal URL’s/webpagina’s eigenlijk oneindig, denk maar aan bijvoorbeeld een online kalender die telkens naar een volgende pagina (week, maand, jaar) kan doorlinken en the deep Web.

Microsoft heeft naar buiten gebracht dat ze een nieuwe methode hebben gevonden om pagina’s te indexeren, waarbij de menselijke factor meegewogen wordt en zoekresultaten dus “beter” worden.

Microsoft gelooft dat BrowseRank, dat het aantal minuten dat een bezoeker op een pagina doorbrengt als criterium neemt bij het indexeren, een doorslaggevende succesfactor kan zijn in de Search Oorlog met Google en Yahoo. (Bron: Microsoft Research Asia)

Don’t want to jump the gun, maar ik kan me bijna niet voorstellen dat de knappe koppen uit Redmond dit echt als een alternatief zien, vanwege de voor de hand liggende haken en ogen van dit idee.

Is het niet zo dat je een browser venster open laat staan omdat je even weg bent om bijvoorbeeld  een vergadering bij te wonen of de telefoon te beantwoorden?

Is het daarnaast ook niet eens zo dat je een gebruiker moet monitoren en dat je hem of haar dus ook moet volgen over meerdere sites, middels een toolbar die je moet installeren? Of moeten alle websitebeheerders een stuk code op hun site plaatsen om dit soort data te vergaren?

En wat te denken van AJAX waarbij alleen bepaalde gedeeltes van een pagina herladen worden?

Of wil men Internet Explorer standaard en heimelijk die info naar Microsoft laten doorsturen? Als dat zo is en het uiteindelijk uitlekt, dan is dat de laatste nagel aan de doodskist van IE en stapt men en masse over naar Firefox. Geheid.

En wat betreft de onderhuidse sneer naar Google toe dat de bovenstaande menselijke methode minder foutmarge en fraude toelaat dan o.a. Google’s PageRank; daar valt nog wel het een en ander op af te dingen. Sterker nog, nu wordt het behalen van de eerste pagina in de zoekresultaten wel heel erg simpel, want je laat gewoon zoveel mogelijk browser vensters open staan om jezelf omhoog te werken in de zoekresultaten. Of je huurt i.p.v. een helpdesk een sweatshop uit Azië in en laat menselijke en geautomatiseerde bots over je site navigeren vanuit wisselende IP nummers.

Google werkt omdat het om de kwaliteit gaat van de URL’s en de content.

Al zou men al deze voor de hand liggende haken en ogen weten af te dekken en bijvoorbeeld daadwerkelijk de activiteit van de bezoekers op pagina niveau meten, dan nog zegt die data niets zonder context, immers verblijft iemand langer dan gemiddeld (en wat is gemiddeld?!!!) op een pagina, komt dat dan omdat de navigatie zo slecht is, of omdat iemand een tekst op een pagina niet begrijpt? Is het wellicht een docente die een college geeft en dus de tijd neemt om een bepaalde pagina per element toe te lichten aan haar studenten?

En even los van al deze praktische bezwaren; wat zegt de factor tijd over waarde? Niets, als je een pagina met een film hebt die één uur duurt of een stream aan het bekijken bent, tikt dat ook aardig aan. Voor de één is drie minuten op een OV-reisinfo site wellicht meer waardevol (Materieel? Gevoelsmatig?) dan een uur keuvelen of rondstruinen op een Facebook of Hyves, en voor een ander vice versa. Relevantie.

Het mooie van Google’s methode is dat ze niet discrimineert en dat je 9 van de 10 keer vindt wat je denkt te zoeken.

Hoe meer concurrentie op het gebied van search des te beter, dus het staat Microsoft vrij om de uitdaging genaamd Google op een legitieme wijze aan te gaan, maar dan wel graag wat meer doordacht dan dit. De afgelopen twee jaar heb ik me niet geheel kunnen ontrekken aan het feit dat Ballmer vreemde bokkensprongen aan het nemen is en er alleen op uit is om Google te vernietigen, terwijl hij beter nog meer tijd zou kunnen steken in het oprecht willen innoveren vanuit een inner drive.

Voor Microsoft hoop ik dan ook echt dat ik er volledig naast zit en dat ze nog nader zullen toelichten waar ze precies naartoe willen en wat de gebruiker hier uiteindelijk aan zal hebben.

Zo niet dan ga ik ervan uit dat ze in Redmond iets te ver naar voren hebben geklikt op de online kalender en dachten dat het 1 April was…

UPDATE: De studenten en stagiaires die de paper hebben uitgebracht in opdracht van Microsoft, hebben in hun onderzoek inderdaad gebruik gemaakt van speciaal te installeren toolbars, die met instemming van de deelnemers geanonimiseerde parameters doorstuurde.

BrowseRank zoals zij het algoritme hebben gedoopt, is dus afhankelijk van de penetratie van een speciale client side toolbar EN vereist ook nog eens opt-in van haar gebruikers.

Zie hier meteen de achilleshiel; als de penetratie (maar vooral de acceptatie van de voorwaarden) niet 100% is, zullen de gegevens die aan MS doorgespeeld worden ook niet een kloppende weergave zijn van hetgeen men wil meten, waarmee ik direct op een tweede denkfout stuit.

Tijdens het doornemen van de paper (je kunt hier de “BrowseRank: Letting Web Users Vote for Page Importance” paper (PDF) downloaden) schoot mij ook nog eens te binnen dat  men de populariteit meet van webpagina’s. BrowseRank is dus een soort van Comsore / Top 40 van de meest populaire internetpagina’s, waarbij populair overigens synoniem staat voor de verblijfsduur van de gemiddelde bezoeker: Hiermee gaat de vergelijking met Google’s methode (waarbij PageRank overigens slechts één onderdeel is van meer dan 200 verschillende factoren die uiteindelijk de indexering bepalen) volledig mank.

Bij zoekresultaten gaat het om de relevantie en niet om de populariteit van online documenten.

Het is een interessante proefballon die hier op academische wijze opgelaten is en men zal ongetwijfeld wel een weg om de meeste hindernissen -en scepsis- weten te vinden, maar vooralsnog is dit dus niet de killer-app die Live Search aan een inhaalslag op Google gaat helpen.

Share
WHAT? No tags for this ’Blurb?! Contact Anibal and tell him to get busy! No Comments yet, your thoughts are welcome! »

No comments yet... Be the first and get the discussion rolling!

Please leave a reply below:

Please be patient, due to Anti-Spam measures, comments may take a short while to post.