1. hakank.blogg: Håkan Kjellerstrand 2003-07-08 11:31
Skoj litet problem!
Några spridda tankar:
En möjlig teori är att de månader som är precis föregående får större antal träffar eftersom både online magasin och bloggar innehåller en massa månadsnamn, och man kan väl anta att antalet sådana sidor ökar hela tiden. För att testa detta borde man göra liknande sökningar t.ex. varje 15:e i månaden för att se om man hittar mer stabila samband.
En annan sak som kan påverka är att vissa månader är kanske viktigare än andra, t.ex. företagens kvartalsrapporter etc. Finns det kanske några dokument/skrifter där man måste skriva ut månadsnamnet i ställer för t.ex. datumformerna "2003-07-06"?
Jag hade först en teori om att "maj" borde vara väldigt överrepresenterad eftersom det dels är ett namn, dels är det samma i sin forkortning (jämför "aug", "jan" etc), men det stämmer inte med data.
Sedan kan man undra om andra sökmotorer ger samma resultat eller är det bara google som fått någon hicka?
|
2. Klocklös i Tiden: Mats Andersson 2003-07-09 12:18
Håkan: Du har tänkt lite längre än jag märker jag. :) Maj borde ha varit mer representerat rent logiskt, med tanke på det du skriver om förkortning och namn, men hur ofta är sökningar logiska?
Det där du skriver om att föregående månad borde vara populärast verkar ju stämma ganska väl med tanke på junis resultat.
Jag får väl försöka komma ihåg att återkomma den sjunde augusti för att se hur resultatet ser ut efter en månad.
Kanske då också med mer än Googles resultat. |
3. hakank.blogg: Håkan Kjellerstrand 2003-07-09 13:43
En annan tanke. Ett sätt att få bort eventuella irrelevanta träffar är att göra en sökningen enligt:
" månad" och
t.ex. "januari månad" och
dvs uttryckligen skriva att det ska vara månad. Följande resultat fick jag igår. Intressant är att "maj månad" dominerar väldigt, vilket nog inte riktigt stödjer vår "tes om förra månaden".
Januari: 4020 Februari:4110 Mars: 9370 April: 6400 Maj: 12100 Juni:8330 Juli: 7240 Augusti: 4160 September: 4950 Oktober: 5490 November: 4600 December: 4910
|
4. Klocklös i Tiden: Mats Andersson 2003-07-09 13:49
Plötsligt hamnar januari och februari i botten av tabellen. Fast samtidigt som man inte vill ha irrelevanta träffar så ger de en ny dimension. Hur vanlig hade (fågeln) and varit om man tagit bort alla engelskspråkiga sidor? :)
Intressant att se att föregående-månads-tesen inte verkade stämma. Och maj-dominansen kan knappast bero på namnet, men kanske förkortningen?
|
5. hakank.blogg: Håkan Kjellerstrand 2003-07-09 19:14
Om maj månad: Nja, det kan nog inte beror på förkortningar eftersom vi ju nu kollar den fulla strängen strängen "maj månad". Eller missförstår jag dig?
Däremot har jag hittat en möjlig teori som förklarar majs dominans, och som är en utveckling av förra månads-teorin. Nämligen att vissa typer av månadsrapporter (statistik, företagsvinster, whatever) tar en stund att tillverka och lägga upp på webben, vilket innebär att det kommer att ta en stund att innan vi får se denna typ av resultat för maj månad. Låt oss kalla denna teori "förra-månads-teorin med fördröjning".
Min (testbara) tes är alltså att i början av nästa kommer "juni månad" att dominera.
En förklaring till skillnaden till din ursprungliga sökning: Man torde kunna förvänta sig att de dokument som innehåller " månad" är mer officiella dokument än de som innehåller endast "". Och - som vi alla vet - är officiella dokument långsammare än informella...
Ett problem med detta vi kanske nu inte testar det du ursprungligen ville testa.
En mer utvecklad tes är att antal träffar beror på avståndet till innevarande månad, dvs att ju längre tillbaka i tiden en månad är, desto färre träffar. En sådan teori kräver (väl?) att gamla dokument gallras bort från webben eller av andra orsaker inte indexeras av google. Men stämmer detta med hur webben, google eller företag funkar?
Men detta börjar nu bli lite väl mycket teori-fiskande, så jag ska nog vänta med fler sådana teorier tills vi får mer data... |
6. hakank.blogg: Håkan Kjellerstrand 2003-07-09 20:33
Heh, jag ser nu att jag min sök-formel inte skrevs ut som jag tänkte. När det står "" eller "maj " i mina inlägg nedan ska det vara: "<månadsnamn>"
respektive "maj <månadsnamn>"
dvs <månadsnamn> är en variabel för månadens namn.
Sorry about the confusion.
|
7. Klocklös i Tiden: Mats Andersson 2003-07-09 21:46
Jag menade att det bara är möjligt att ta med förkortning + hela månadsnamnet för maj månad. Alltså oavsett om det står "feb månad" eller "februari månad" så blir det ju ingen skillnad i majs fall, fast om det används på så många ställen vet jag inte.
Jag tror inte på teorin om att det blir mindre träffar ju längre från månaden man är. Dokument försvinner inte efter en viss tid utan finns kvar i sökmotorernas register så länge de finns kvar på webben.
Hur som helst, tankarna är intressanta och kanske får vi lite fler svar nästa månad. Eller också inte. :)
|