Kontroll av språk

Jag antar att detta är något som Håkan antingen har 30 färdiga svar på, eller också sätter igång att forska i ämnet.

Finns det formler för att kunna ta reda på vilket språk en text är skriven på bara genom att räkna antalet bokstäver?

Engelskan borde till exempel ha ett överskott av W (pga alla when, what, why, where, who osv) jämfört med genomsnittsspråket. Svenskan har sin motsvarighet i V (vad, vilken, vilka, varför, vem, var osv) men framförallt i Å, Ä och Ö. :)

Tyskan borde ha ett överskott av Ü. :)

Det vore intressant att använda ett program som räknar bokstäver och som sedan utifrån vissa satta gränsvärden kommer fram till vilket språk texten är skriven på, gränsvärden som efterhand blir bättre och bättre, precis som K9 blir bättre och bättre på att skilja ut spam från vanliga mail.

Andra blogganteckningar i kategorin Livet/Funderingar.

Torsdag 2003-12-18 18:00
Skriv en kommentar!

Kommentarer:



6. Mats Andersson (Klocklös i Tiden)

Det verkar med andra ord som om det inte bara är jag som tänkt i de här banorna.

2003-12-21 18:00

5. David Pettersson (Månhus Beta)

För några år sedan försökte jag göra ett program som skulle identifiera språk med just frekvensanalys av tecken. Fast jag stannade någonstans halvvägs.

2003-12-21 17:59

4. Mats Andersson (Klocklös i Tiden)

Okej, och vad gör du uppe så tidigt?? :)

2003-12-21 12:04

3. David J

Kan ju vara på sin plats att nämna att frekvensanalys av språk är ett viktigt moment inom kryptologin för att dechiffrera krypton. Det finns såklart många fler viktiga användingar inom informationsteknologi för sånt här.

2003-12-21 07:24

2. Mats Andersson (Klocklös i Tiden)

Tack! Jag kikar!

2003-12-19 21:23

1. Håkan Kjellerstrand (hakank.blogg)

Kanske inte 30 färdiga svar, men några länkar i alla fall.
Se http://www.hakank.org/webblogg/archives/000394.html .


2003-12-19 13:51

Skriv en kommentar
Namn:
Epostadress:
URL till din hemsida:
Hemsidans namn:
Fyll i
alfabetets
sista bokstav:

Använd inte A HREF-taggen för att länka!
Om du inleder url:en med http:// så blir den automatiskt en länk.

Kom ihåg min info