Kogda pol'zovatel' i6et 4to-to v Internete i s
pervogo raza ne naxodit nujnoy informacii, on staraetsa
pereformulirovat' zapros, 4tobi polu4it' relevantniy rezul'tat: ubrat'
li6nee slovo ili uto4nit' zapros, dobavit' operator poiska ili
radikal'no pomenat' slova zaprosa. Imenno etot process –
pereformulirovku zaprosa – izu4ili issledovateli iz universiteta
University of Washington Information School.
Issledovateli vzali okolo 36 millionov logov
zaprosov, sdelannix k poiskovoy sisteme AOL v poslednie dva goda, i
viasnili, 4to po4ti 3,5 milliona iz nix avlautsa pereformulirovannimi
zaprosami. Polu4aetsa, 10% zaprosov – eto popitka nayti informaciu,
kotoruu pol'zovatel' ne na6el po pervomu zaprosu.
V rabote predstavleni varianti togo, kak
pol'zovateli pereformulirovali svoi zaprosi. Issledovateli ne stali
vklu4at' takie varianti, kak dobavlenia geografi4eskogo ograni4enia
(t.e. izmenenia zaprosa s «lu46ie teatri» na «lu46ie teatri barseloni»)
ili dobavlenia dati («rezul'tati legkaa atletika» na «rezul'tati legkaa
atletika vesna 2009»). Takje ne rassmatrivalis' dobavlenia k zaprosu
operatorov poiska, tak kak k nim pribegaet nebol'6oe koli4estvo
internet-pol'zovateley.
Vidi pereformulirovok zaprosov
Izmenenie poradka slov
Nesmotra na to, 4to izmenenie poradka slov ne sil'no
vliaet na relevantnost' rezul'tatov, kotorie vidit pol'zovatel' posle
pereformulirovania zaprosa, eta strategia avlaetsa odnoy iz naibolee
4asto ispol'zuemix (barselona lu46ie teatri -- lu46ie teatri barselona).
Izmenenie punktuacii ili probela
Pol'zovateli 4asto ubiraut ili dobavlaut voprositel'nie znaki, zapatie, tire, 4tobi polu4it' bolee to4nie rezul'tati (London, stoimost' turov -- London stoimost' turov).
Udalenie slov
Obi4no takaa operacia privodit k tomu, 4to
pol'zovatel' polu4aet bolee 6irokiy vibor rezul'tatov. 4etirexslovnie
zaprosi, sformulirovannie pol'zovatelem, mogut vidavat' sli6kom
specifi4eskie rezul'tati. V to vrema kak udalenie odnogo ili neskol'kix
slov mojet dat' iskomiy rezul'tat (kurs valuti dollar rubl' – kurs dollar rubl').
Dobavlenie slov
Uto4nenie zaprosa dla polu4enia men'6ego koli4estva bolee relevantnix rezul'tatov (bank depozit – bank depozit stavki).
Urezanie urla
Inogda pol'zovateli vvodat v adresnuu stroku ne
zapros, a polnocenniy adres stranici. Posle togo kak Google pokazivaet
im rezul'tati dla etogo urla, 4ast' pol'zovateley udalaet na4al'nie
www. i poslednee .com ili .ru (www.seonews.ru – seonews) i prodoljaet poisk.
Otbrasivanie okon4aniy
Pri poiske, kotoriy ne pokazal nujnix rezul'tatov,
skajem, vo mnojestvennom 4isle, pol'zovateli ispol'zuut zapros,
pereformulirovanniy v edinstvennoe 4islo. Takje mogut otrezat'sa
padejnie okon4ania ili pokazateli formi glagola v angliyskom azike (turi na krit – tur na krit).
Ispol'zovanie sokra6eniy
Posle togo kak pol'zovatel' vvel polnoe nazvanie
organizacii ili avlenia i ne polu4il nujnix rezul'tatov, on mojet
poprobovat' sokra6enniy variant (programmnoeobespe4enie – PO).
Ras6ifrovka sokra6eniy
Obratnaa operacia. Abbreviatura dala nerelevantnie rezul'tati, poetomu pol'zovatel' razvernul ee v polnocenniy zapros (OON – organizacia ob&edinennix naciy).
Zamena slov
Pol'zovateli mogut zamenat' slova v zaprose drugimi
na osnovanii razli4nix otno6eniy slov. Zamena mojet proizvodit'sa po
principu sinonimi4nosti ili anonimi4nosti; pol'zovatel' takje mojet
ispol'zovat' giponimi ili giperonimi. Giperonim — eto slovo s bolee
6irokim zna4eniem, 4em giponim;
ono virajaet ob6ee ponatie po otno6eniu k giponimu. V eti otno6enia
mogut vxodit' vidi transporta i slovo «transport» (tramvay, trolleybus,
avtobus – ob6estvenniy transport). Poxojie otno6enia nabludautsa mejdu meronimom i xolonimom, kotorie predstavlaut soboy 4ast' i celoe sootvetstvenno (ladon' -- ruka).
Ispravlenie o6ibok
Zapros s4itaetsa pereformulirovannim po etomu
principu, esli pol'zovatel' sam zametil ope4atku i ispravil ee, i
tol'ko posle etogo sdelal vtoroy zapros (polaskat' – poloskat').
Effektivnost' pereformulirovok i ka4estvo poiska
Posle klassifikacii osnovnix sposobov
pereformulirovki zaprosa, issledovateli viasnili, kakie iz etix
sposobov naibolee effektivni dla naxojdenia relevantnix rezul'tatov.
Esli rassmotret' process poiska, to mojno videlit' na4al'niy i
pereformulirovanniy zapros. Sootvetstvenno pol'zovatel' mojet
deystvovat' po 4etirem veroatnim sxemam:
-
Ne klik – klik.
-
Klik – klik.
-
Ne klik – ne klik.
-
Klik – ne klik.
Pervaa i vtoraa sxema obozna4aut, 4to pol'zovatel'
na6el relevantniy rezul'tat vo vtorom poiske, t.e. pereformulirovanniy
zapros okazalsa polezen. Tret'a i 4etvertaa – pereformulirovka ne
prinesla rezul'tatov.
Esli posmotret' na sootno6enie klikov i ne klikov v
pervom zaprose i sootnesti ix s raznimi sposobami pereformulirovania
zaprosov, mojno ponat', v kakix slu4aax pol'zovateli pribegaut k tomu
ili inomu sposobu. Tak, visokiy procent neklikov obi4no privodit k
tomu, 4to pol'zovateli ispravlaut o6ibki v zaprose i ras6ifrovivaut
abbreviaturi. A vot ispol'zovanie abbreviaturi vmesto polnogo
slovoso4etania, izmenenie poradka slov, udalenie i zamena slova obi4no
ispol'zuutsa posle dovol'no-taki uda4nix rezul'tatov poiska (kliki) dla
togo, 4tobi polu4it' bolee to4nie rezul'tati.
Sootno6enie klikov i neklikov vo vtorom zaprose
pozvolaet uvidet', naskol'ko pomogli pol'zovatelu pereformulirovki. Po
rezul'tatam issledovania, samimi effektivnimi pereformulirovkami
(v slu4ae, kogda perviy zapros zakon4ilsa neklikom) mojno s4itat'
dobavlenie slov k zaprosu, ispravlenie o6ibok i ras6ifrovka
abbreviaturi. Eto logi4no, tak kak ras6ifrovka zaprosa delaet ego
to4nim, pozvolaa izbejat' neskol'kix variantov interpretacii; a
dobavlenie slova sujaet oblast' poiska s pomo6'u kontekstnogo
uto4nenia. V slu4ae, kogda perviy zapros zakon4ilsa klikom, samimi
effektivnimi dla ego uto4nenia stali izmenenie poradka slov, zamena i
dobavlenie slov.
Esli sravnivat' perviy i pereformulirovanniy
zaprosi, kotorie oba zakon4ilis' klikom, to mojno ocenit' izmenenie
ka4estva vida4i. Issledovanie pokazalo, 4to kajdiy povtorniy zapros
soprovojdalsa klikom po bolee visokomu rezul'tatu, 4em pervona4al'niy.
V tablice mojno uvidet', na skol'ko poziciy v srednem podnimalis'
relevantnie pol'zovatel'skomu zaprosu rezul'tati i kakoe vrema
proxodilo mejdu pervim i vtorim zaprosom.
Sposob pereformulirovki
|
Srednee vrema mejdu zaprosami, s.
|
Srednee izmenenie poziciy
|
Zamena slova
|
73
|
+ 4
|
Dobavlenie slova
|
63
|
+3,2
|
Udalenie slova
|
33
|
+3,15
|
Izmenenie poradka slov
|
85
|
+2,8
|
Ras6ifrovka abbreviaturi
|
42
|
+2
|
Udalenie okon4ania
|
33
|
+2
|
Abbreviatura
|
35
|
+1,4
|
Ispravlenie o6ibok
|
22
|
+1
|
Izmenenie punktuacii
|
27
|
+0,5
|
Samie zna4imie izmenenia v poziciax rezul'tatov
pokazali sleduu6ie sposobi pereformulirovania zaprosov: zamena,
dobavlenie ili udalenie slov. V to vrema kak izmenenie punktuacionnix
znakov minimal'no vliaet na izmenenie poziciy rezul'tatov.
Issledovanie Analyzing and Evaluating Query Reformulation Strategies in Web Search Logs (pdf).