- Kód: Vybrat vše
cat .bash_history | sed -E 's/[ \t;]+//g' | sort | uniq | (wc)
# sice je to useless use of cat ale je to přehlednější, když se přidávají pípy
Dejme tomu že mám textový soubor s řádky z nichž některé jsou duplicitami. Pokud bych je chtěl odstranit, stačilo by použít kombo sort|uniq
1. Milestone: Chci zachovat pořadí. sort|uniq sice najde duplicity, ale jako vedlejší efekt dojde (významově) "promíchání pořadí" (z pohledu sort ale ne naopak

>> Jak provést elegantně smazání duplicit Bez nějakého bušení algoritmů. Ideálně s možnostní výběru jestli chci nechat první nebo poslední výskyt duplicity (což je relevantní požadavek - výsledný soubor bude vypadat jinak)
2. Milestone . Provést detekci duplicit s tím, že za duplicity se budou považovat i třeba řádky "ping -c1 host" - i ping -c 2 host" (Našlo by se toho víc). Tudíž proběhne nějaká normalizace řádků. (v úvodu realizovaná sedem) Ale samozřejmě ve vysledném souboru chci nenormalizovaný výskyt(první nebo poslední)