Stránka 1 z 1

prevod textu pdf do txt s korektnim prevodem azbuky

Odeslat příspěvekNapsal: 30. 6. 2005 06:21
od Petula(smazano)
dobry den, mam problem. Potrebuju prevest text z formatu .pdf do formatu .txt. Bohuzel text je v rustine a pokud jej vlozim do poznamkoveho bloku nebo jineho editoru, tak se zmneni na ruzne klikyhaky, Pokud jsem zkousel stejny postup treba z internetovych stranek, tak vsechno fungovalo v poradku. Pouze z formatu pdf mi to nejde. Prosim poradte.

Odeslat příspěvekNapsal: 30. 6. 2005 07:34
od Howard
zkus PDF2TXT
http://www.toppdf.com/

vylepsen nazev thradu

Odeslat příspěvekNapsal: 30. 6. 2005 07:56
od cache
Problem je v tom, ze pdf ma v sebe vlastny font. Takze je mozne, ze z toho txt nijako nedostanes. Ale problem moze byt aj v tom, ze nemas nainstalovane ruske fonty a podporu azbuky v pc.

Odeslat příspěvekNapsal: 30. 6. 2005 12:38
od Lemur
Existuje jeste jedna metoda, kterou pouziju kdyz selze jakykoliv export (napr. kdyz je text ve krivkach), ale je dost narocna: Pomoci nejakeho programu ulozim PDF jako bitmapovy obrazkek (nejlip se mi na to osvedsil GhostView) a ten pak prozenu OCR. Obcas je nutne ty obrazky trochu upravit (odstranit pozadi, zvysit konstrast a pod.), ale vetsinou je spolehlivost dost slusna.

Odeslat příspěvekNapsal: 30. 6. 2005 12:56
od Petula(smazano)
jenze ja potrebuju docela nutne prevest text do nejakeho editoru, kde jej muzu zpracovat. Neexistuji treba ruske fonty pro acrobat??

Odeslat příspěvekNapsal: 30. 6. 2005 13:48
od IgorK
1, posli link na to pdf
2, aky pouzivas font v notepade?
//edit: btw., pouzi v notepade tahoma font a pozri si ten text.

Převod PDF na TXT

Odeslat příspěvekNapsal: 30. 6. 2005 13:50
od KutilTim
Použij FineReader od firmy ABBYY Software House. Jedná se o OCR program, který umí načíst PDF formát, pročte cca 40 jazyků (včetně ruštiny) a výsledek Ti vyplivne ve Wordu. Odtud to dát do TXT je hračka. Mám to odzkoušené. Když tak to pošli, večer Ti to udělám.

OCR

Odeslat příspěvekNapsal: 29. 12. 2005 15:51
od mn
mám obdobný problém

při převodu přečteného ruského textu z OCR FINEREADER do WORDu se mě zobrazí v nečitelné znakové sadě. V OCR po převodu obrazu do textu je vše OK čitelné, jedná se mě o následný přenos do WORDu.
? jde o nějaké následné nastavení windows nebo word pro ruštinu?
resp. změna fontu?
PROSÍM zda jste podobný problém neřešili.