Forum » Programska oprema » Splitanje pdf-ja in poimenovanje po zapisu na strani
Splitanje pdf-ja in poimenovanje po zapisu na strani
jaka611 ::
Zdravo,
imam pdf dokument s celo kopico strani. Recimo tam okoli 200. Sedaj bi rad celoten dokument ločil na 200 posamičnih. Vsaka posamična stran bo potem nov dokument. Na istem mestu vsakega lista je zapisana neka koda, ki je na vsakem listu drugačna. Sedaj ta pdf splitati na posamične in vsakega posamičnega poimenovati po kodi. Potrebujem nek ocr search.
Kako se to najlažje naredi? Ali obstaja nek free program ali pa kaj drugega?
Hvala za odgovor
imam pdf dokument s celo kopico strani. Recimo tam okoli 200. Sedaj bi rad celoten dokument ločil na 200 posamičnih. Vsaka posamična stran bo potem nov dokument. Na istem mestu vsakega lista je zapisana neka koda, ki je na vsakem listu drugačna. Sedaj ta pdf splitati na posamične in vsakega posamičnega poimenovati po kodi. Potrebujem nek ocr search.
Kako se to najlažje naredi? Ali obstaja nek free program ali pa kaj drugega?
Hvala za odgovor
</head> ::
Najpomembnejši podatek je, če je PDF machine readable. Torej, da je možno iskati po tekstu.
Če ni, se kar na roke loti. Krekan adobe pdf editor in gas. 200× shranit file bo najhitreje.
Če je in imaš veselje, pa naloži python in PyPDF2: https://realpython.com/pdf-python/#how-...
Če ni, se kar na roke loti. Krekan adobe pdf editor in gas. 200× shranit file bo najhitreje.
Če je in imaš veselje, pa naloži python in PyPDF2: https://realpython.com/pdf-python/#how-...
b3D_950 ::
1. splitaš na posamezne fajle (file1.pdf, file2.pdf...). https://pdfsam.org/
2. poženeš nek ocr, kjer mu nastaviš kaj naj "gleda" (x, y, width, height) in shraniš v txt fajl:
googlaš za npr: ocr pdf specific region
3. poženeš neko skripto, ki ti preimenuje fajle glede tisto kar imaš v txt fajlu:
https://stackoverflow.com/questions/608...
Verjetno bo pa najhitrej, da splitaš s pdfsam in potem narediš seznam kod in ročno preimenuješ.
2. poženeš nek ocr, kjer mu nastaviš kaj naj "gleda" (x, y, width, height) in shraniš v txt fajl:
googlaš za npr: ocr pdf specific region
3. poženeš neko skripto, ki ti preimenuje fajle glede tisto kar imaš v txt fajlu:
https://stackoverflow.com/questions/608...
Verjetno bo pa najhitrej, da splitaš s pdfsam in potem narediš seznam kod in ročno preimenuješ.
Zdaj ko je mir, jemo samo krompir.
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | Izvoz slik iz pdfOddelek: Pomoč in nasveti | 2142 (1758) | harvey |
» | Excel bo omogočil uvoz fotografiranih tabelOddelek: Novice / Pisarniški paketi | 5494 (3643) | lopov |
» | Poskeniraj in pretvori v txtOddelek: Programska oprema | 1326 (1026) | tiltech |
» | batch fajl iz txt (strani: 1 2 )Oddelek: Programiranje | 9860 (8521) | b3D_950 |
» | Zaščita dokumentaOddelek: Pomoč in nasveti | 2514 (1807) | VelikiTun |