od martyk73 8. 11. 2006 16:04
Jde mi o to, ze do funkce vleze text, retezec, dejme tomu webova stranka (bez TAGU, proste jen text). Ta funkce ma vratit true, kdyz je stranka anglicka a false, pokud ne. Lepsi by bylo, kdyby vratila cislo, treba od 0-100 - nula znamena - stranka neni urcite anglicka, 100 znamena - je urcite anglicka.
Samozrejme naprogramovat to lze velice zjednodusene, a docela to funguje - vytvorite kratky wordlist slov, ktere jsou jenom v anglictine - the, don't, you, thanks, I'm - takovych vyrazu mit 100 a pokud se na strance vyskytuji v urcitem poctu, je velice pravdepodobne, ze stranka je anglicka. Neni to ale uplne bullet-proof reseni, protoze muze byt na ceske strance treba anglicka citace, nebo to muze byt stranka ceske hospody, ktera se jmenuje "The ....".