» »

Google ne zanemarja pogostih besed

Tic ::

Kaj je tle tko ultra pametnega?
persona civitas ;>

minmax ::

ni ultra pametno, je pa ultra težko.

zaradi pogostosti teh besed, je zelo težko hitro iskat. poleg tega je treba zelo pazit, da ti ne zašuštrajo preveč rezultatov.

mathjazz ::

Nič. Je pa pametno, da so to končno nardil.
www.getfirefox.com

Thomas ::

Ja je. Včasih so imeli trapasto idejo, da pogoste besede kot "the", "of", "a" ... izpuščajo iz indeksiranja kot nepomembne. Dostikrat je bilo to malo moteče (za dobre iskalce z Googlom).

Zdej so ali prišli k pameti, ali jim ni treba (zaradi boljše opreme) več delati tako gnilih kompromisov.

Pozitivna stvar.

lambda ::

Sj si mel +, a ne?

Myth ::

Ne vem no. Končno so sporihtali to. Mene je vedno motilo, ko sem iskal howto-je, da je pisalo da je to pač prepogosta beseda pa mi sploh ni nič pametnega ven vrglo. Moral sem res točno določeno frazo vpisat, da mi je hapsnlo.
¤ Space is Mystery. And Myth is on Earth. ¤

BigWhale ::

Ce isces howto itak napises 'howto' in ne 'how to'. ;>

raufnk ::

men se pa zdi da še vedno ne upoštevajo pogostih besed
npr. pri iskanju 'how to start a fire' še vedno ni odebeljenih besed 'how', 'to' in 'a', prav tako pa je že drugi zadetek iskanja 'We Didn't Start The Fire'

bi rekel da samo napišejo ne več da te besede izključijo iz iskanja
lp raufnk

Myth ::

Točno tako. Tale novica je torej laž. Zdajle sem ravno posksuil nekaj možnosti in nič ni primlo. Kot je rekel slednji v tej temi, da samo več ne prikazujejo. :\
¤ Space is Mystery. And Myth is on Earth. ¤

OwcA ::

Novica je že prav, samo googlat ne znate: klik! ;)
Otroška radovednost - gonilo napredka.

aky ::

Že od pamtiveka deluje search: +"how to start a fire"

Če pa napišeš samo: how to start a fire
pa google že od nekdaj poskuša razumeti, kaj iščeš in ne išče slepo zadetkov...

M.B. ::

Meni je pa najbolj všeč Google Suggest
Everyone started out as a newbie.
Sadly only a handful ever progress past that point.

BBB ::

Owca, ti si pa povsem falil kontekst. Ni govora o iskanem zaporedju besed pač pa o pogostih besedah, ki nastopijo kjerkoli v tekstu.

Kako je teoretično možno izvesti semantični namesto običajnega sintaktičnega iskalnika? Pri slednjih je problem, da ti poišče vse tekste, kjer nastopa nabor iskanih besed, pa tudi če so teksti povsem izven konteksta, v katerem uporabnik išče. Seveda se iskanje lahko zoža s tem, da se opredeli še več besed, hkrati pa se s tem precej pravih tekstov nehote izloči - čeprav je tekst vsebinsko skladen z želenim, pa ni nujno, da uporablja celoten nabor iskanih besed. Učinkovita selekcija bi zato bila lahko izvedena le z določitvojo pomena besed in smiselnostjo medsebojnega sklapljanja. Se še spomnim pred leti, ko v Yahooju nisem mogel najti microsoftove uradne strani (pomagalo je le ugibanje: www.microsoft.com) - sedaj je v Googlu prikazan kot prvi zadetek, vendar ne zaradi načina iskanja, pač pa zaradi prioritete, ki je dodeljena Microsoftu pred njihovimi hatepagi ter drugo navlako.

Kot pravi aky, ima Googla sledi kontekstnega isklanika. Besedo "how" očitno poveže z iskanjem definicij preostalih besed, ki niso pogoste. Seveda pa mora vedeti, kje so te definicije zapisane. Iz splošnega teksta ne more vedeti ali gre za obrazložitev besed ali pa za navadno uporabo besed v tekstu. Po mojem ima Google referencirane nekatere vire, kjer se nahajajo razlage pojmov in v primeru, da uporabnik navede na začetku "how (to)", da prioriteto iskanju po teh virih. Vendar je to daleč daleč od semantičnega oz. kontekstnega iskalnika. Problem je v tem, da Google ne ve, kaj imam v mislih, ko vpišem nabor besed. Lahko bi z data miningom izluščil pogosto uporabljene besedne zveze, vendar pa bi potreboval povratno informacijo, ali je vsebina, na katero kaže link v Googlu, resnično v kontekstu iskanja. O tem lahko odločijo edino uporabniki - morajo oceniti, ali je to res zadeva, ki so jo iskali - bodisi eksplicitno s kljukico (ali z oceno od 0 do 10) na najdeni strani oz. v googlu ali pa implicitno - ISTI uporabnik, ki ne najde žele stvari, pogosto išče isto stvar še naprej (vendar to ni nujno res, ker lahko išče poleg ustreznega vira še druge, kjer so še dodatne informacije - ni zanesljiv pristop). Ko bi imel Google tako pridobljeno bazo znanja (s povratnimi informacijami), pa bi lahko predvidel, kaj večina z neko besedno zvezo išče. Manjšina uporabnikov, ki iste besedne zveze uporablja za iskanje tekstov v drugačnem kontekstu, pa bi bila odpisana. Varianta je tudi v data miningu, ki bi bil prilagojen tako celotni množici uporabnikov in bi hkrati upošteval posameznikovo različico mišljenja (problem pa je v zagotovitvi zasebnosti, saj posameznika obravnava le, če lahko prepozna njegovo identiteto - lahko je tudi psevdoidentiteta v stilu aky-ja na Slo-techu).

Zgodovina sprememb…

  • spremenil: BBB ()

B-D_ ::

Mater ste znanstveniki... :\

Itaq se po guglu inteligentno išče edino na "boolean način":

Napišeš osnoven query...
- če kaj ignorira dodaš pred besedo plus
- če je nekih neželenih rezultatov preveč (klasika za "price, linux, viagra, review, buy") besedo ki se ponavlja dodaš in pred to besedo daš minus
- če iščeš besedno zvezo "jo daš v narekovaje"
Ponovi vajo...

Komur za kaj takega krona z glave pade nej pa matkurjo uporablja. :P

BBB ::

B-D_, ti pa znaš biti konzervativec. Si kot tisti kamenodobec, ki mi je nekoč pravil, da lahko vse s kamnom naredi in da ne rabi kuninjskega noža. Kot je pokomentiral, "če ti z ostrim kamnom ne uspe dobro odrezati papiraja, pa probaj s prodom, morda bo več uspeha."

B-D_ ::

Kdor želi search, ki vedno ve kaj on hoče, naj zaprosi mamico, da mu kaj poišče... :8)

jype ::

Google je precej biased glede na to, kar se mu zazdi, da uporabnik isce. To je dobro, kadar dela, in nadlezno, kadar ne dela. Pa vseeno mislim, da mu gre vztrajno na bolje, samo vecina geekov nas postavlja taka nemogoca vprasanja, da si misli, da smo zmesani (in nam ponudi zmesane odgovore).

[Prvi del sporočila izbrisal, ker je bil off-topic in se je nanašalo na ostala sporočila, ki so bila izbrisana. LP, moderator]

Zgodovina sprememb…

BigWhale ::

Ja, meni se je v blogu oglasila ena deklica, no, mogoce zenska, kaj pa vem, ki je googlala za znano diskoteko nad mestom, pa nasla moj blog, ga prebrala in rekla, da tja sigurno ne bo sla.

No mogoce je najdi.si-jala. Kaj pa vem. :))

DixieFlatline ::

Tale Clusty iskalnik ( Link) se mi zdi dost obetaven, vzame zadetke drugih iskalnikov(na žalost ne gugla) in jih po posebnih algoritmih razvrsti v različne tematske skupine.
The sky above the port was the color of television, tuned to a dead channel.

Jux ::

Svaka čast googlu za to potezo.
Če vam ni jasna razlika prej in po - potem googlajte za gostilna as (brez narekovajev) in potem isti search dajte še v najdi.si. Ja, če napišete +as v najdi.si potem bo tudi tam rezultat na prvi strani, ampak moj oče, stric, mat, skratka vsi ki niso glih računalničarji pa ne vedo da je treba +as napisat.

Bravo google.
web&blog&etc: http://lukabirsa.com

BBB ::

B-D_,
tebe vidim kot izredno nezahtevnega uporabnika, ki vedno najde, kar išče. Sam vedno ne najdem iskanega. Da iskano pogosto obtaja, vem, ker včasih nenajdeno slučajno čez kakšen mesec to najdem, čeprav iščem nekaj drugega, kar je nekoliko sorodno tistemu, kar sem že iskal in nisem našel. Vidim veliko pomankljivost iskanja po vsebovanih besedah. Sem že razložil za kaj gre. Še najhujši problem je, ko iščem novo zadevo, ki vem, kaj naj bi pomenila oz. predstavljala, pa ne vem, kako jo imenujejo. Glede nepoznanih poimenovanj je problem predvsem pri novejših in nerazširjenih tehnologijah (seveda ni problem pri tistih, o katerih se sliši vsepovsod). Abstraktne stvari pogosto različni avtorji opisujejo z različnimi besedami, vsak pa ima tudi svoj obseg besednega zaklada in svoj stil izražanja. Da je to velik problem, sem opazil pri iskanju virov za diplomsko nalogo. Tudi z logičnimi operatorji si ne morem kaj dosti pomagati. ALI operator je brez veze, ko želim naredi čim ožjo selekcijo (to je za širjenje selekcije). AND operator je itak privzet, ko se našteva iskane besede, NOT (oz. minus pred neželeno besedo) je dvorezen meč - se dogaja, da pričakujem, da naj neka beseda v tekstu ne bi bila izražena, pa vseeno je. Če naštejem preveč besed, pa izgubim vire, kjer niso uporabljene vse besede. Tudi navajanje zaporedja besed veliko preveč omeji iskanje. Da ne govorim o iskanju slovenskih članokv, kjer je iskanje še hujše zaradi skladenjskih lastnosti - sklanjanje samostalnikov in pridevnikov proizvede veliko množico končnic (a je možo iskati le po delih besed?). Uporaba šumnikov je pa itak pesem zase - zahteva iskanje po eni in drug varianti. Da ne omenjam tipkarskih napak avtorjev člankov. Google omogoča seveda še kaj naprednejšega, npr. iskanje v okviru domene ali po času nastanka dokumenta. A kaj, ko ne vem, kje naj bi bil shranjen in kdaj približno je bil ustvarjen. Možno je tudi navesti, kako narazen se smejo besede v čalnku pojaviti. Morda je še kaj, a vendar so to precej okorna orodja za moje pojme.
Izvajanje selekcij je zamudno opravilo, ko iščem kaj zelo specifičnega. Natanko tako si pomagam, kot praviš, v stilu ponavljanja vaje z variacijo posameznih besed - duhamorno opravilo, pa ne vedno z želenim učinkom. Žal mi kar naprej pada krona z glave, kot se rad izraziš. Današnji internetni iskalniki so pač plod preteklega razvoja, sedaj pa je čas za razvoj bolj naprednih tehnologij. Brez da bi to kdorkoli ozavestil, se tudi nima kaj premaknit.

B-D_, očitno je po tvojih merilih človeštvo nedavno doseglo končno stopnjo razvoja, kjer je vse, kar je trenutno na voljo, dovolj razvito, da ni potrebe po nedaljnem razvoju - vsaj google ti zadostuje kot iskalnik za vse večne čase - meni pač ne. Sem pa siguren, da boš uporabljal kakšen naprednejši iskalnik od sedanjega googla, ko bo pač na voljo. In takrat boš s svojimi konzervativnimi izjavami zopet zagovarjal nepotrebnost razpravljanja in razvijanja česa bolj naprednega. Me prav zanima, kaj si svojim sogovornikom tupil, ko še ni bilo internetnih iskalnikov, kako naj iščejo npr. strokovne članke ali knjige in da so tisti, ki razpravljajo o čem naprednejšem, kot sta npr. internet in internetni isklaniki, v podcenjujočem smislu neki znanstveniki (morda ti je bilo to zaradi tvoje rane mladosti prizaneseno). Namesto, da bi takrat, ko ne najdem želenega podatka, moral vedno poprositi tvojo mamico, ki je hudo zverzirana v iskanju želenih podatkov, bi bilo bolje kaj tako naprednega, kot je tvoja mamica, implementirati v iskalnik. Če bi bil ti rojen v obodbju kamenodobcev, bi bil povsem zadovoljen z življenjem z njim razpoložljivimi tehnološkimi dosežki - ti se ne bi zavzemal za razvoj česa naprednejšega, še huje, zaničeval bi ga. Kar nam je v danem času razpoložljivo, to tebi povsem zadostuje in daješ v nič tiste, ki bi radi zadeve izboljšali, češ da ne znajo uporabljati obstoječega zadeve. Verjemi mi, da pot razvoja rezil od kamna do noža ni bila stimulirana zaradi tega, ker ne bi znali uporabljati kamnov, ampak zato, ker se s kovinskim nožem precej učinkoviteje reže, odreže pa tudi tisto, kar se s kamnom ne da. Mamica ti bo zrezke narezane s kamnom bolj težko pripravila - vprašaj jo, kaj je bolj priročno. Enako ti je s sedanjimi iskalniki in iskalniki prihodnjih generacij.

alum ::

OMG:)

d0rK ::

LOL BBB! Kajla!


Sicer pa ni prvic v zadnjih dneh, ko sem izpod tvojih rok [tipk] videl post izven normalnih proporcij.

Myth ::

Motil sem se. Imate prav, google se je izbolšal.
¤ Space is Mystery. And Myth is on Earth. ¤

Dead_Eye ::

hmm, če jaz dobro razumem je edina razlika, da sedaj ni potrebno napisati še + zraven?

če je samo to, potem ne vidim nobene hude izboljšave, razen za tiste, ki ne znajo uporabljat iskalnika...
The one and only

Gandalfar ::

Koliko pa mislis da je takih?


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Kako preveriti, če je airbag dejansko še notri?

Oddelek: Loža
275484 (4607) Mr Hilter
»

radeon shared memory

Oddelek: Strojna oprema
71025 (901) Carmack
»

Kako zaobiti kitajsko cenzuro

Oddelek: Novice / Zasebnost
174417 (3225) poweroff
»

Iskanje z googlom po korenu besede

Oddelek: Omrežja in internet
72137 (1986) ZaFo
»

Prevod ang-slo

Oddelek: Loža
173034 (2739) d0rK

Več podobnih tem