Forum » Programiranje » Uporaba ML za odkrivanje podatkov iz teksta
Uporaba ML za odkrivanje podatkov iz teksta
i33a ::
Pozdravljeni, na disku imam precej datotek, ki vsebujejo razne tekste. Iz teh tekstov moram pridobiti nekatere podatke npr. cene, imena produktov, ...
Do sedaj sem to reševal s kupom regex izrazov in matchal stvari, ki sem jih potreboval. V prihodnosti pa to žal ne bo mogla biti rešitev, saj moram zaradi raznih manjših popravkov v opisih redno popravljati regex-e. Zato me zanima, če obstaja kakšna (relativno enostavna) metoda strojnega učenja, ki bi ji podal npr. 1000 na roko označenih primerov v datotekah in bi se na njih "naučila", potem bi pa lahko malo bolj robustno prepoznavala vzorce iz večjega števila datotek. Zavedam se, da bo kak % primerov narobej označenih a to lahko toleriramo.
Ima kdo kakšno idejo kaj in kako uporabiti?
Lep pozdrav in hvala za nasvete
Do sedaj sem to reševal s kupom regex izrazov in matchal stvari, ki sem jih potreboval. V prihodnosti pa to žal ne bo mogla biti rešitev, saj moram zaradi raznih manjših popravkov v opisih redno popravljati regex-e. Zato me zanima, če obstaja kakšna (relativno enostavna) metoda strojnega učenja, ki bi ji podal npr. 1000 na roko označenih primerov v datotekah in bi se na njih "naučila", potem bi pa lahko malo bolj robustno prepoznavala vzorce iz večjega števila datotek. Zavedam se, da bo kak % primerov narobej označenih a to lahko toleriramo.
Ima kdo kakšno idejo kaj in kako uporabiti?
Lep pozdrav in hvala za nasvete
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | [Java] Regularni izrazOddelek: Programiranje | 1120 (972) | jan_g |
» | regex prvih 100 znakovOddelek: Programiranje | 987 (807) | milc |
» | c# regularni izrazOddelek: Programiranje | 2015 (1713) | darkolord |
» | [C#] Prosim pomagajte! Potrebujem program, ki bi pobiral podatke iz ene straniOddelek: Programiranje | 2743 (2353) | David1994 |