|
АБРАКАДАБРА (Тоже самое но в читаемом виде)
Re6il napisat' nebol'6uu raz&asnitel'nuu stat'u na etu temu.
Nemnogo vodi dla na4ala
Sovsem nedavno stali poavlat'sa novosti o tom, to IBM i BBC prinalis'
za razrabotku Web 3.0. Zatem postupila informacia, 4to mejdu
Evropeyskim Souzom i S6A name4aetsa konkurencia za pravo pervenstva v
texnologiax Web 3.0, ili, kak e6e nazivaut, Semanti4eskoy Seti.
Voob6em-to Web3.0 dovol'no uslovnoe nazvanie, ibo ne vse priznaut i veb
2.0, potomu dalee budu nazivat' eto ne4to semanti4eskoy set'u.
4to je takoe v deystvitel'nosti Semanti4eskiy Veb i dostoin li on
priyti na smenu su6estvuu6emu internetu – osnovnie voprosi
pol'zovateley i setevix investorov. Ob etom i poydet re4'.
Web1.0, Web2.0, Web3.0 — s4itaem pered snom
Kogda mi govorim o Web, to v pervuu o4ered' podrazumevaem kontent.
Ska4at' referatik ili noviy soft iz gigantskoy vseplanetnoy svalki i
zaplatit' za eto utomleniem glaz bannernoy reklamoy – eto koncepcia
togo, 4to sey4as mojno nazvat' Web 1.0. Pol'zovatel' vistupaet
passivnim potrebitelem informacii, kotoruu sozdaut 2-10 % aktivnix
u4astnikov seti.
Internet eto global'naa informacionnaa set'. Internet celikom sostoit
iz kontenta i razli4ie «versiy» veba eto li6' razli4ie mejdu sposobami
organizacii/poda4i kontenta. Veb 1.0 podrazumeval polnuu amorfnost'
pol'zovatela, kotoriy vistupal prostim potrebitelem.
Pod Web 2.0 obi4no ponimaut servisi, kotorie pozvolaut pol'zovatelami
samim generirovat' kontent, a takje rasprostranat' ego posredstvom lent
i giperssilok. Pol'zovatel' sam vibiraet, kakoy imenno kontent on
doljen polu4at', vixoda v set', nastraivaas' na 4tenie izbrannix
blogov, soob6estv, lent.
Osoznav etot prostoy fakt, rad krupnix korporaciy (v 4astnosti, BBC,
IBM, Google, Oracle) v ka4estve osnovnogo napravlenia razvitia
interneta na blijay6ie 5-10 let predlojili semanti4eskuu sistemu Web
3.0, osnovannuu na «umnoy» obrabotke informacii. Sut' eё zaklu4aetsa v
tom, 4to ne pol'zovateli, a sami ma6ini osu6estvlaut poisk informacii
po soderjimomu, vklu4aa poisk po video- i cifrovim izobrajeniam,
osnovivaas' na metadannix i metabazax. Web 3.0 doljen re6it' samuu
aktual'nuu problemu razvitia interneta - poiska zna4imoy informacii,
otdelenie eё ot informacionnogo musora. Odno iz re6eniy zaklu4aetsa v
tom, 4tobi ranjirovat' informaciu po isto4niku avtorstva, v zavisimosti
ot reytinga isto4nika. I sam reyting doljen bit' ne avtomati4eskim,
na4islaemim prosto za aktivnost' v seti, a opredelaemim drugimi
pol'zovatelami interneta. Drugie, bolee popularnie re6enia, v osnovnom
stroatsa vokrug metadannix.
4to i kak
Semantic Web (SW) avlaetsa nadstroykoy nad uje su6estvuu6im WWW.
Semantika odnozna4no xarakterizuet naydenniy kontent po radu
xarakternix priznakov. SW dla traktovki dannix ispol'zuet universal'niy
identifikator resursov (URI; eto ssilki ne tol'ko na elektronnie adresa
ili kakie-to Web-stranici, no i na otdel'nix ludey, goroda,
xudojestvennie artefakti i t.d.), ontologii i aziki opisania metadannix
(leksi4eskiy analiz dla ma6innoy obrabotki).
Sey4as bol'6aa 4ast' informacii v seti sover6enno ne ponatna dla
komp'uterov. To est' programma ne mojet to4no skazat' o 4em danniy
tekst, kto takoy A.S.Pu6kin i sobrat' soob6enia dvux blogov v odin tred
po odnoy teme. V SW dla opisania informacii ispol'zuet RDF (Resource
Description Framework) kotoriy odnozna4no opi6et logi4eskie svazi
informacii.
«led tronulsa...»
Semanti4eskiy veb ispol'zuetsa ne tol'ko v fantaziax Sera Timoti
Bernersa-Lii, no i v krupnix korporaciax i gosu4rejdeniax, no eto
special'nie razrabotki, trebuu6ie bol'6ix usiliy. Naprimer, v razvedke
semanti4eskaa texnologia ispol'zuetsa dla viavlenia svazey mejdu lud'mi
pri bor'be s terrorizmom. Vsa informacia o terroristax xranitsa v
trexurovnevoy sisteme RDF, postroennoy na standartnoy baze dannix. Dla
upravlenia slojnim processom obrabotki etix dannix sisteme trebuetsa 22
Tbayt operativnoy pamati, i rabotaet ona nestabil'no, a na
vosstanovlenie sistemi posle sboa uxodit nedela.
Poprobuem je vzglanut' na te texnologii kotorie jdut nas vo vsemirnoy
seti.
Vozmojno, vam znakomi takie texnologii, kak RDF, OWL Web Ontology
Language i SPARQL, a takje ix rodstvenniki, napodobie XML. Ves' etot
nabor bukv pozvolaet razrabot4ikam organizovat' dannie v semanti4eskuu
strukturu.
Samiy osnovnoy azik eto kone4no RDF. On opisivaet vse dannie 4erez
tripleti: sub&ekt — predikat — ob&ekt. Naprimer, utverjdenie «Nebo
golubogo cveta» v RDF-terminologii mojno predstavit' sleduu6im obrazom:
sub&ekt — «nebo», predikat — «imeet cvet», ob&ekt — «goluboy».
Drugoy kit, na kotorom stoit Web 3.0 - Web Ontology Language (OWL). OWL
– eto azik ontologii dla interneta na osnove XML. Azik veb-ontologiy
OWL prizvan obespe4it' azik, kotoriy mojet bit' ispol'zovan dla
opisania klassov i otno6eniy mejdu nimi, kotorie prisu6i dla
veb-dokumentov i prilojeniy. V osnove azika naxoditsa predstavlenie
deystvitel'nosti v modeli dannix ob&ekt-svoystvo. Kajdomu elementu
opisania v etom azike stavitsa v sootvetstvie www-adres URI.
I 4to mi imeem?
Prejde vsego dla prosmotra(ili xota b raspoznania prisutstvia na
stranice) semanti4eskix dannix vam ponadobatsa RDF brauzeri ili
ras6irenia dla brauzerov HTML. Dla Firefox ideal'nim variantom avlaetsa
so4etanie Semantic Radar i Operator Toolbar
.
FreeBase — soob6estvo
pol'zovateley, kotorie sozdaut svazi k svobodno predstavlennim bazam
WikiPedia, Musicbranz i drugim. Slinkovannie dannie dobavlautsa v
Wiki-stile po meta-priznakam, kategoriam i fol'ksomonii. V baze dannix
sey4as nas4itivaetsa okolo 20 000 fil'mov, 350 000 muzikal'nix
al'bomov, 350 000 dannix o ludax, vsego 873 kategorii. Kajduu zapis' v
baze mojno obsudit', posmotret' otno6enia ili otredaktirovat'. Proekt
naxoditsa v al'fa-testirovanii, i poetomu dostup k baze - tol'ko po
prigla6eniam.
DBpedia — toje soob6estvo, kotoroe
izvlekaet strukturirovannuu informaciu iz Wikipedia i sozdaet svazi s
drugimi isto4nikami. Proekt ispol'zuet RDF (9,3 milliona dokumentov s
647,348 svazami na 11 azikax), 4to pozvolaet delat' SPARQL-zaprosi k
etim dannim (SPARQL – standart azikovix zaprosov semanti4eskoy
pautini)). Neskol'ko realizaciy dla razli4nix azikov programmirovania
uje su6estvuut. Na danniy moment imeet svazannie ssilki s bazami
Musicbranz, Geonames, YAGO-klassifikaciey i soderjit po4ti 60 tisa4
dannix o ludax. V baze predstavleni takie razdeli, kak fil'mi, muzika,
politika, nauka i drugie, postoanno popolnau6iesa.
Friend of a Friend (FOAF) —
proekt po sozdaniu modeli ma6inno-4itaemix doma6nix stranic i
social'nix setey. Serdcem proekta avlaetsa specifikacia, kotoraa
opredelaet nekotorie virajenia, ispol'zuemie v viskazivaniax o
kom-libo: naprimer, ima, pol i drugie xarakteristiki. 4tobi soslat'sa
na eti dannie, ispol'zuetsa identifikator, vklu4au6iy unikal'nie
svoystva druga (naprimer, SHA1-summa ot E-Mail adresa, Jabber ID, ili
URI doma6ney stranici, vebloga).
Osnovanniy na RDF, opredelёnniy s pomo6'u OWL i razrabotanniy dla
lёgkoy ras6iraemosti, FOAF pozvolaet raspredelat' dannie mejdu
razli4nimi komp'uternimi okrujeniami.
Semanticly Linked Online Communitis(SIOC)
— sposob svazi postov v blogax, kommentariev na forumax, statey i
pro4ix soob6eniy v odin tred po teme ili klu4evim slovam. S nedavnix
por texnologia pod6efnaa W3C.
WordNet — leksi4eskaa baza
dla angliyskogo azika. V baze sobrani imena su6estvitel'nie, glagoli,
prilagatel'nie i nare4ia, kotorie gruppiruutsa v nabori poznavatel'nix
sinonimov (synsets). Synsets tesno svazan s pomo6'u
umozritel'no-semanti4eskix i leksi4eskix otno6eniy. Rezul'tiruu6aa set'
zna4imo svazannix slov i ponatiy mojet bit' naydena predstavlennim na
sayte navigatorom. Ko vsem dannim bazi otkrit svobodniy dostup s
pomo6'u ma6innix zaprosov SPARQL.
Geonames — proekt sopostavlenia
geografi4eskix nazvaniy s associiruemimi RDF-dannimi. Drugimi slovami,
geografi4eskaa informacia budet predstavlena na sayte po RDF-standartam.
Linking Open Data on the Semantic Web
— sobiraetsa voob6e vsu otkrituu informaciu v internete perevesti v RDF
i, k tomu je, zanimaetsa sostavleniem RDF-ssilok mejdu drugimi
proektami Web 3.0.
Semanti4eskaa Mediaviki
Vsex saytov ispol'zuu6ix RDF i ne pere4islit', eto i JJ i nedavno proskakivav6iy na xabre Dobrometr
I v zaklu4enie
Web 3.0 na segodna6niy den' v bol'6ey stepeni otve4aet vnutrennim
izmeneniam mexanizmov raboti Seti, pod4as nezametnie obi4nomu
pol'zovatelu. Semanti4eskiy Web – ne revolucionnoe re6enie, kotoroe
odnajdi izmenit mir vokrug nas, a postepenno vnedraemaa (i uje uspe6no)
texnologia, instrument, pozvolau6iy v lu46ey stepeni ispol'zovat'
dostupnie nam sey4as resursi.
Rekomenduu
W3C Semantic Web Activity News
Semanticfind Stat'i i
obsujdenia o podvijkax semanti4eskogo veba, soputstvuu6ix texnologiax i
specifikaciax,semanti4eskix ras6ireniy dla brauzerov.
Vse o SW
Toje otli4niy sayt o SW
V sozdanii stat'i ispol'zovani otrivki iz statey xakep.ru
P.S. A xo4u posvatit' etomu svoy blog, delit'sa s
lud'mi receptami, perevodit' novosti i specifikacii, prodvigat' SW v
ru/ua/baynete. Kak dumaete dostoynaa tema? habrahabr.ru/blog/sw/27073.html
|