» »

prepoznavanje datotek jpg, gif, doc, pdf po vsebini

prepoznavanje datotek jpg, gif, doc, pdf po vsebini

frke ::

Imam >1000 datotek različnih vrst. Imena datotek so številke - brez končnic.
Datoteke so vrste gif, jpg, pdf, doc

Kako jih programsko prepoznati po vsebini in jim dodati ustrezne končnice?

Gundolf ::

Tako da prebereš prvih nekaj bajtov vsake datoteke. Pogledas v po eno datoteko od teh stirih formatov in ugotoviš po čem se jih da lepo ločiti (recimo BMP ima na začetku vedno napisan BM, exe ima MZ, kako je za ostale formate pa ne vem).

buba švabe ::

Gif ima na začetku "GIF87a" (verjetno so še kake druge verzije tut), JPEG ima prvih šest bajtov nekaj binarno zapisano, potem je pa "JFIF", pedef se začne z "%PDF-1.4" oziroma, kakršna je pač verzija, doc pa ne zgleda, da bi mel kaj očitnega...
če hočeš razumet rekurzijo, moraš najprej razumet rekurzijo

ping ::

Datoteke so vrste gif, jpg, pdf, doc
I dont get it - kako potem nimajo končnic?
Morda jih ne vidiš - v explorerju izklopi tools-folder options - view - hide extensions for known file types.
Če pa si jim končnice izbrisal pol je pa to druga zgodba. Morda so fajli neuporabni, morda pa se jih še da odpret.
Lahko odpiraš fajl po fajl z wordom in ugotoviš katere datoteke so doc - pol jih pa sejvaš kot *.doc

trs ::

Na unixih imas "file" utility ki ti zna delat tocno to - prepozna datoteke po vsebini. Dela za vse mogoce in nemogoce formate, vkljucno z vsemi graficnimi.

Z malo znanja o shell skriptah si lahko hitro napises skriptico ki ti zna to delat; sicer pa rabis imet kasn Linux ali pa Cygwin :P



lp,
trs

darkolord ::

za Windows pa obstaja TRID ki prepozna "vse" formate :P

Zgodovina sprememb…

  • spremenilo: darkolord ()

frke ::

Z vašo pomočjo je zadeva rešena.

Potreboval sem ukaz "file" v linuxu, ki ga do sedaj nisem uporabljal.

file - determine file type


Ime datoteke je bila navadna številko brez končnice, zato ker so bile zapisane kot polja v bazi in downloadane preko skripte z wget.

Zgodovina sprememb…

  • spremenil: frke ()


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Locky dobil nov način širjenja

Oddelek: Novice / Kriptovalute
3911995 (8712) Jupito
»

Cryptowall 3.0 virus

Oddelek: Pomoč in nasveti
437088 (5142) bambam20
»

php upload file problem

Oddelek: Programiranje
151219 (769) petzup
»

Google chrome

Oddelek: Omrežja in internet
5802 (594) jack7
»

Varnost openSSH

Oddelek: Omrežja in internet
242394 (1972) Volk|

Več podobnih tem