IPS je Svrha i funkcije sistema za pronalaženje informacija
IPS je Svrha i funkcije sistema za pronalaženje informacija

Video: IPS je Svrha i funkcije sistema za pronalaženje informacija

Video: IPS je Svrha i funkcije sistema za pronalaženje informacija
Video: ЗАПРЕЩЁННЫЕ ТОВАРЫ с ALIEXPRESS 2023 ШТРАФ и ТЮРЬМА ЛЕГКО! 2024, April
Anonim

Savremenoj osobi je teško zamisliti život bez interneta i gotovo trenutnog pristupa izvorima informacija. Korisnik rijetko razmišlja o tome kako se vrši pretraga željenog sadržaja na mreži. Ali ovo je veoma interesantno.

Sistem za pronalaženje informacija (IPS) je složen softverski i hardverski sistem koji bira informacije na zahtjev korisnika. Informacije se pohranjuju na serverima u digitalnom obliku, kao što su se knjige nekada nalazile na policama biblioteka. Sistem se sastoji od mnogo podsistema. Svaki obavlja svoj zadatak u procesu obrade zahtjeva korisnika i pružanja informacija u tekstualnom ili zvučnom obliku. Mnoštvo zadataka koje treba riješiti određuje složenost arhitekture modernih sistema za pronalaženje informacija (skraćenica od sistema za pronalaženje informacija). Neka vrsta "crne kutije": na ulazu - tekst zahtjeva, šta je unutra - nepoznato, na izlazu - sveobuhvatne informacije.

Kartoteka u stvarnom životu
Kartoteka u stvarnom životu

Ulazni tokovi

Zahtjevi za informacije koje osoba formira u tekstualnom obliku na ekranu svog gadgeta,čine mali dio zahtjeva koje obrađuje pretraživač. Glavne nizove upita za pretraživanje formiraju roboti koji prihvaćaju ljudski zahtjev i vrše pretragu u više koraka i povratnu informaciju s korisnikom. Sistemi za pronalaženje informacija uključuju dobro poznate Google, Yandex i druge, koji svakodnevno obrađuju milione zahtjeva.

Objekti pretraživanja izvora

Skup početnih objekata od interesa za pretragu su dokumenti, zapisi, video zapisi, slike i još mnogo toga. Kreirani su izvan IPS-a. Opšti sistem za skladištenje i pronalaženje informacija treba da ima ugrađeni bibliografski sistem - neku vrstu kataloga koji vam omogućava da tražite bilo koju vrstu objekata.

Objekti ili njihove digitalne transformacije postaju "ulazni resurs" u IPS. Među njima se biraju informacije koje su korisniku potrebne.

Potražite informacije
Potražite informacije

Spoljni izvori

Prikaz odabira informacija koristi eksterne izvore znanja. Ovo su informacije koje korisnik traži. Naslov filma, citat iz knjige i još mnogo toga. Za kompjutersko pretraživanje, ove informacije moraju biti prevedene u upit na algoritamskom jeziku. U IPS-u se to radi pomoću bloka za kreiranje, indeksiranje i razvoj upita.

U idealnom slučaju, ova tri procesa – predstavljanje, indeksiranje i razvoj upita – bi se trebali oslanjati na identične izvore znanja, ali u praksi to nije ostvarivo.

Izvore znanja treba stalno pregledavati i ažurirati, a ažuriranje treba biti identično isinhronizovano. A vanjski izvor znanja uvijek hronološki prethodi njegovoj upotrebi u pretraživačima za upit, ponekad i za nekoliko godina.

Sistem za pronalaženje informacija
Sistem za pronalaženje informacija

Nastupi

Reprezentacije originalnih objekata su sastavljene od ulaznih podataka u nekoj kombinaciji ili transformisane u skladu sa pravilima i algoritmima određenog sistema za pronalaženje informacija.

Pregledi su manje-više transformisane kopije originalnog objekta pretrage. U zbirci neuređenih punih tekstova svaki je tekst svoj vlastiti prikaz. U zbirci predmeta muzejskih eksponata i artefakata, reprezentacija može biti transformisani opis predmeta sa njegovom slikom. U nekim slučajevima, reprezentacija može biti dijelom izvedena iz originalnog objekta, a dijelom iz opisa: u bibliografskim pretraživačima, reprezentacije se izvode iz objekta - na primjer, naslov, ime autora će se kombinirati sa napomenom o radu.

Pronalaženje onoga što vam treba
Pronalaženje onoga što vam treba

Indeks koji se može pretraživati

Budući da se informacije u sistemima za pronalaženje informacija pohranjuju u obliku reprezentacije, logično je pretpostaviti da se pretraga vrši prema reprezentaciji i da se nakon odabira daje korisniku. U praksi to nije slučaj. Na primjer, trenutni katalozi online biblioteka obično ograničavaju pretraživanja na nekoliko polja: autor, naslov i podnaslovi unutar prikaza koji sadrži druga polja koja se ne pretražuju. Ovo je dovoljan razlog zašto je potrebno razlikovatiprikaz i indeks koji se može pretraživati, koji je dio za pretraživanje u pogledu. Definira sve što bi trebalo biti pretraživo. Indeks koji se može pretraživati, poput pogleda i izvornog objekta, može se podijeliti u zasebne podindekse kako bi se pružila preciznija, ciljana pretraživanja

Tražilice obično imaju internu sintetičku strukturu za uparivanje validnih rezultata pretrage. Ova struktura je druga komponenta indeksa koji se može pretraživati.

Proceduralno, proces indeksiranja se može implementirati na različite načine: indeks koji se može pretraživati može se dobiti na:

  • bukvalno kopiranje pretraživanog prikaza;
  • kopiranjem detalja pregleda. Ovo može biti dio ili svi pogledi koji fizički postoje samo kao fragmenti, distribuirani prema pravilima za kreiranje indeksa za pretragu, koji će se prikupljati kada je potrebno.
Upravljanje pretraživanjem
Upravljanje pretraživanjem

Zahtjev za pravila dizajna i formalne zahtjeve

Inženjering upita je funkcija koja posreduje između upita korisnika i formalnog upita. On transformiše korisnički upit, uparujući ga sa rječnicima naredbi za dohvaćanje, specifikacijom indeksa i indeksom prije preuzimanja. U zoru razvoja IPS-a, ova uloga je tradicionalno bila dodijeljena kvalifikovanim IT stručnjacima.

Razvijanje kompjuterskih upita koji se mogu podudarati sa rječničkim upitima u indeksni sistem koji se može pretraživati obično se naziva modul "unos rječnika". Automatizacija ove funkcije obećava i nudi mogućnosti za stručne i probabilističke metode pretraživanja.

Zvanični zahtjev postaje formalni zahtjev nakon što se korisnikov zahtjev konvertuje. Primjeri takvih formalnih transformacija uključuju skraćivanje, zamjenu, normalizaciju, vektorizaciju i druge transformacije "spoljašnje" reprezentacije u "unutarnje" reprezentacije računarskog IPS-a (dešifriranje - sistem za pronalaženje informacija).

Izdvojeni skupovi veza za dokument

Rezultirajući skup izvora informacija je logično podskup pogleda kreiranih uparujućim pravilima primijenjenim na formalni upit pomoću indeksa koji se može pretraživati.

Obično, ali ne nužno, postoji poseban proces sortiranja za oporavljeni skup informacija. Online bibliotečki katalozi obično mijenjaju redoslijed primljenih skupova po abecednom redu prema autorima prije prikazivanja. U sistemima za pronalaženje informacija koji proizvode striktno rangiranje, redoslijed rangiranja prethodi svakom ponovnom redoslijedu.

Analiza podataka
Analiza podataka

Izlazni tokovi

Izlaz rezultata pretrage vrši se tradicionalno na displeju, češće u obliku niza objekata koji se koriste negdje drugdje ili u neku drugu svrhu, završava glavnu petlju pretraživanja. Takvi tokovi se mogu poslati na uređaje za vizualizaciju, pohranjivanje za dalju obradu ili korištenje kao ulazni tokovi za druge usluge odabira.

Sistemi za pronalaženje informacija dozvoljavaju povratne informacije odrezultat bilo kojeg procesa selekcije. Rezultat bilo kojeg procesa može biti povratna informacija drugim procesima. Povratne informacije mogu pružiti osnovu za stručnu procjenu u bilo kojoj fazi.

Preporučuje se: