Forum » Programiranje » Uporaba ML za odkrivanje podatkov iz teksta
Uporaba ML za odkrivanje podatkov iz teksta
i33a ::
Pozdravljeni, na disku imam precej datotek, ki vsebujejo razne tekste. Iz teh tekstov moram pridobiti nekatere podatke npr. cene, imena produktov, ...
Do sedaj sem to reševal s kupom regex izrazov in matchal stvari, ki sem jih potreboval. V prihodnosti pa to žal ne bo mogla biti rešitev, saj moram zaradi raznih manjših popravkov v opisih redno popravljati regex-e. Zato me zanima, če obstaja kakšna (relativno enostavna) metoda strojnega učenja, ki bi ji podal npr. 1000 na roko označenih primerov v datotekah in bi se na njih "naučila", potem bi pa lahko malo bolj robustno prepoznavala vzorce iz večjega števila datotek. Zavedam se, da bo kak % primerov narobej označenih a to lahko toleriramo.
Ima kdo kakšno idejo kaj in kako uporabiti?
Lep pozdrav in hvala za nasvete
Do sedaj sem to reševal s kupom regex izrazov in matchal stvari, ki sem jih potreboval. V prihodnosti pa to žal ne bo mogla biti rešitev, saj moram zaradi raznih manjših popravkov v opisih redno popravljati regex-e. Zato me zanima, če obstaja kakšna (relativno enostavna) metoda strojnega učenja, ki bi ji podal npr. 1000 na roko označenih primerov v datotekah in bi se na njih "naučila", potem bi pa lahko malo bolj robustno prepoznavala vzorce iz večjega števila datotek. Zavedam se, da bo kak % primerov narobej označenih a to lahko toleriramo.
Ima kdo kakšno idejo kaj in kako uporabiti?
Lep pozdrav in hvala za nasvete
Vredno ogleda ...
| Tema | Ogledi | Zadnje sporočilo | |
|---|---|---|---|
| Tema | Ogledi | Zadnje sporočilo | |
| » | [Java] Regularni izrazOddelek: Programiranje | 1236 (1088) | jan_g |
| » | regex prvih 100 znakovOddelek: Programiranje | 1107 (927) | milc |
| » | c# regularni izrazOddelek: Programiranje | 2143 (1841) | darkolord |
| » | [C#] Prosim pomagajte! Potrebujem program, ki bi pobiral podatke iz ene straniOddelek: Programiranje | 2885 (2495) | David1994 |