prevod textu pdf do txt s korektnim prevodem azbuky

Na téma Windows XP, 2000, Me, 98, 95 a starší

Moderátor: Moderátoři Živě.cz

Odeslat příspěvekod Petula(smazano) 30. 6. 2005 07:21

dobry den, mam problem. Potrebuju prevest text z formatu .pdf do formatu .txt. Bohuzel text je v rustine a pokud jej vlozim do poznamkoveho bloku nebo jineho editoru, tak se zmneni na ruzne klikyhaky, Pokud jsem zkousel stejny postup treba z internetovych stranek, tak vsechno fungovalo v poradku. Pouze z formatu pdf mi to nejde. Prosim poradte.
Petula(smazano)
Junior

Odeslat příspěvekod Howard 30. 6. 2005 08:34

zkus PDF2TXT
http://www.toppdf.com/

vylepsen nazev thradu
Have you tried to turn it off and on again?
Windows je ... nikoliv Windows jsou (Windows is ...)
Howard
VIP uživatel
Uživatelský avatar

Odeslat příspěvekod cache 30. 6. 2005 08:56

Problem je v tom, ze pdf ma v sebe vlastny font. Takze je mozne, ze z toho txt nijako nedostanes. Ale problem moze byt aj v tom, ze nemas nainstalovane ruske fonty a podporu azbuky v pc.
Můj bože, to je budoucnost! Mí rodiče, přátelé, má dívka.. Už je nikdy neuvidím.. JUPÍÍÍÍÍÍ! (Fry s1e1)
cache
Pokročilý
Uživatelský avatar

Odeslat příspěvekod Lemur 30. 6. 2005 13:38

Existuje jeste jedna metoda, kterou pouziju kdyz selze jakykoliv export (napr. kdyz je text ve krivkach), ale je dost narocna: Pomoci nejakeho programu ulozim PDF jako bitmapovy obrazkek (nejlip se mi na to osvedsil GhostView) a ten pak prozenu OCR. Obcas je nutne ty obrazky trochu upravit (odstranit pozadi, zvysit konstrast a pod.), ale vetsinou je spolehlivost dost slusna.
Lemur
VIP uživatel
Uživatelský avatar

Odeslat příspěvekod Petula(smazano) 30. 6. 2005 13:56

jenze ja potrebuju docela nutne prevest text do nejakeho editoru, kde jej muzu zpracovat. Neexistuji treba ruske fonty pro acrobat??
Petula(smazano)
Junior

Odeslat příspěvekod IgorK 30. 6. 2005 14:48

1, posli link na to pdf
2, aky pouzivas font v notepade?
//edit: btw., pouzi v notepade tahoma font a pozri si ten text.
Naposledy upravil IgorK dne 30. 6. 2005 15:04, celkově upraveno 1
I own all your code - pay me all your money!
IgorK
Junior
Uživatelský avatar

Odeslat příspěvekod KutilTim 30. 6. 2005 14:50

Použij FineReader od firmy ABBYY Software House. Jedná se o OCR program, který umí načíst PDF formát, pročte cca 40 jazyků (včetně ruštiny) a výsledek Ti vyplivne ve Wordu. Odtud to dát do TXT je hračka. Mám to odzkoušené. Když tak to pošli, večer Ti to udělám.
KutilTim
Kolemjdoucí

Odeslat příspěvekod mn 29. 12. 2005 16:51

mám obdobný problém

při převodu přečteného ruského textu z OCR FINEREADER do WORDu se mě zobrazí v nečitelné znakové sadě. V OCR po převodu obrazu do textu je vše OK čitelné, jedná se mě o následný přenos do WORDu.
? jde o nějaké následné nastavení windows nebo word pro ruštinu?
resp. změna fontu?
PROSÍM zda jste podobný problém neřešili.
mn
Kolemjdoucí


Kdo je online

Uživatelé procházející toto fórum: Žádní registrovaní uživatelé a 0 návštevníků