2024 Autor: Howard Calhoun | [email protected]. Zadnja izmjena: 2023-12-17 10:20
Savremenoj osobi je teško zamisliti život bez interneta i gotovo trenutnog pristupa izvorima informacija. Korisnik rijetko razmišlja o tome kako se vrši pretraga željenog sadržaja na mreži. Ali ovo je veoma interesantno.
Sistem za pronalaženje informacija (IPS) je složen softverski i hardverski sistem koji bira informacije na zahtjev korisnika. Informacije se pohranjuju na serverima u digitalnom obliku, kao što su se knjige nekada nalazile na policama biblioteka. Sistem se sastoji od mnogo podsistema. Svaki obavlja svoj zadatak u procesu obrade zahtjeva korisnika i pružanja informacija u tekstualnom ili zvučnom obliku. Mnoštvo zadataka koje treba riješiti određuje složenost arhitekture modernih sistema za pronalaženje informacija (skraćenica od sistema za pronalaženje informacija). Neka vrsta "crne kutije": na ulazu - tekst zahtjeva, šta je unutra - nepoznato, na izlazu - sveobuhvatne informacije.
Ulazni tokovi
Zahtjevi za informacije koje osoba formira u tekstualnom obliku na ekranu svog gadgeta,čine mali dio zahtjeva koje obrađuje pretraživač. Glavne nizove upita za pretraživanje formiraju roboti koji prihvaćaju ljudski zahtjev i vrše pretragu u više koraka i povratnu informaciju s korisnikom. Sistemi za pronalaženje informacija uključuju dobro poznate Google, Yandex i druge, koji svakodnevno obrađuju milione zahtjeva.
Objekti pretraživanja izvora
Skup početnih objekata od interesa za pretragu su dokumenti, zapisi, video zapisi, slike i još mnogo toga. Kreirani su izvan IPS-a. Opšti sistem za skladištenje i pronalaženje informacija treba da ima ugrađeni bibliografski sistem - neku vrstu kataloga koji vam omogućava da tražite bilo koju vrstu objekata.
Objekti ili njihove digitalne transformacije postaju "ulazni resurs" u IPS. Među njima se biraju informacije koje su korisniku potrebne.
Spoljni izvori
Prikaz odabira informacija koristi eksterne izvore znanja. Ovo su informacije koje korisnik traži. Naslov filma, citat iz knjige i još mnogo toga. Za kompjutersko pretraživanje, ove informacije moraju biti prevedene u upit na algoritamskom jeziku. U IPS-u se to radi pomoću bloka za kreiranje, indeksiranje i razvoj upita.
U idealnom slučaju, ova tri procesa – predstavljanje, indeksiranje i razvoj upita – bi se trebali oslanjati na identične izvore znanja, ali u praksi to nije ostvarivo.
Izvore znanja treba stalno pregledavati i ažurirati, a ažuriranje treba biti identično isinhronizovano. A vanjski izvor znanja uvijek hronološki prethodi njegovoj upotrebi u pretraživačima za upit, ponekad i za nekoliko godina.
Nastupi
Reprezentacije originalnih objekata su sastavljene od ulaznih podataka u nekoj kombinaciji ili transformisane u skladu sa pravilima i algoritmima određenog sistema za pronalaženje informacija.
Pregledi su manje-više transformisane kopije originalnog objekta pretrage. U zbirci neuređenih punih tekstova svaki je tekst svoj vlastiti prikaz. U zbirci predmeta muzejskih eksponata i artefakata, reprezentacija može biti transformisani opis predmeta sa njegovom slikom. U nekim slučajevima, reprezentacija može biti dijelom izvedena iz originalnog objekta, a dijelom iz opisa: u bibliografskim pretraživačima, reprezentacije se izvode iz objekta - na primjer, naslov, ime autora će se kombinirati sa napomenom o radu.
Indeks koji se može pretraživati
Budući da se informacije u sistemima za pronalaženje informacija pohranjuju u obliku reprezentacije, logično je pretpostaviti da se pretraga vrši prema reprezentaciji i da se nakon odabira daje korisniku. U praksi to nije slučaj. Na primjer, trenutni katalozi online biblioteka obično ograničavaju pretraživanja na nekoliko polja: autor, naslov i podnaslovi unutar prikaza koji sadrži druga polja koja se ne pretražuju. Ovo je dovoljan razlog zašto je potrebno razlikovatiprikaz i indeks koji se može pretraživati, koji je dio za pretraživanje u pogledu. Definira sve što bi trebalo biti pretraživo. Indeks koji se može pretraživati, poput pogleda i izvornog objekta, može se podijeliti u zasebne podindekse kako bi se pružila preciznija, ciljana pretraživanja
Tražilice obično imaju internu sintetičku strukturu za uparivanje validnih rezultata pretrage. Ova struktura je druga komponenta indeksa koji se može pretraživati.
Proceduralno, proces indeksiranja se može implementirati na različite načine: indeks koji se može pretraživati može se dobiti na:
- bukvalno kopiranje pretraživanog prikaza;
- kopiranjem detalja pregleda. Ovo može biti dio ili svi pogledi koji fizički postoje samo kao fragmenti, distribuirani prema pravilima za kreiranje indeksa za pretragu, koji će se prikupljati kada je potrebno.
Zahtjev za pravila dizajna i formalne zahtjeve
Inženjering upita je funkcija koja posreduje između upita korisnika i formalnog upita. On transformiše korisnički upit, uparujući ga sa rječnicima naredbi za dohvaćanje, specifikacijom indeksa i indeksom prije preuzimanja. U zoru razvoja IPS-a, ova uloga je tradicionalno bila dodijeljena kvalifikovanim IT stručnjacima.
Razvijanje kompjuterskih upita koji se mogu podudarati sa rječničkim upitima u indeksni sistem koji se može pretraživati obično se naziva modul "unos rječnika". Automatizacija ove funkcije obećava i nudi mogućnosti za stručne i probabilističke metode pretraživanja.
Zvanični zahtjev postaje formalni zahtjev nakon što se korisnikov zahtjev konvertuje. Primjeri takvih formalnih transformacija uključuju skraćivanje, zamjenu, normalizaciju, vektorizaciju i druge transformacije "spoljašnje" reprezentacije u "unutarnje" reprezentacije računarskog IPS-a (dešifriranje - sistem za pronalaženje informacija).
Izdvojeni skupovi veza za dokument
Rezultirajući skup izvora informacija je logično podskup pogleda kreiranih uparujućim pravilima primijenjenim na formalni upit pomoću indeksa koji se može pretraživati.
Obično, ali ne nužno, postoji poseban proces sortiranja za oporavljeni skup informacija. Online bibliotečki katalozi obično mijenjaju redoslijed primljenih skupova po abecednom redu prema autorima prije prikazivanja. U sistemima za pronalaženje informacija koji proizvode striktno rangiranje, redoslijed rangiranja prethodi svakom ponovnom redoslijedu.
Izlazni tokovi
Izlaz rezultata pretrage vrši se tradicionalno na displeju, češće u obliku niza objekata koji se koriste negdje drugdje ili u neku drugu svrhu, završava glavnu petlju pretraživanja. Takvi tokovi se mogu poslati na uređaje za vizualizaciju, pohranjivanje za dalju obradu ili korištenje kao ulazni tokovi za druge usluge odabira.
Sistemi za pronalaženje informacija dozvoljavaju povratne informacije odrezultat bilo kojeg procesa selekcije. Rezultat bilo kojeg procesa može biti povratna informacija drugim procesima. Povratne informacije mogu pružiti osnovu za stručnu procjenu u bilo kojoj fazi.
Preporučuje se:
Organizacija sistema interne kontrole u organizaciji: kreiranje, svrha, zahtjevi i analiza
Svako profitabilno preduzeće nosi potencijalni profit za svog vlasnika. Koji kompetentni preduzetnik ne bi bio zainteresovan za uslove funkcionisanja sopstvenog potomstva, koji mu donose tako ozbiljne prihode? Upravo zato što se svaki priseban privrednik i sa objektivnim odnosom prema rukovodstvu svoje kompanije plaši da će jednog dana izgubiti profit i bankrotirati, uvodi sistem interne kontrole poslovanja organizacije
Svrha upravljanja je Struktura, zadaci, funkcije i principi upravljanja
Čak i osoba koja je daleko od menadžmenta zna da je svrha menadžmenta stvaranje prihoda. Novac je ono što osigurava napredak. Naravno, mnogi poduzetnici pokušavaju da se izbjele i zato dobronamjerno pokriju svoju žeđ za profitom. je li tako? Hajde da to shvatimo
Definicija, funkcije, karakteristike i svrha osiguranja
Započnite ovaj članak definicijom šta je osiguranje. Ovaj pojam podrazumijeva specifičnu vrstu ekonomskog odnosa koji osigurava osiguravajuću zaštitu organizacijama ili pojedincima od raznih vrsta opasnosti. Ovaj članak će govoriti o funkcijama osiguranja, njegovim ciljevima i vrstama
Sistem za vezivanje: svrha, funkcije i tehnički zahtjevi
Sistem za zadržavanje ima izuzetno važne funkcije. Ona je ta koja popravlja osobu na visini, kao iu vozilima. U njegovom radu postoji niz suptilnosti koje se moraju uzeti u obzir da bi bio efikasan
Pronalaženje investitora je pola puta do uspjeha
Svaka osoba ima svog anđela čuvara. Da li vaš posao ima svog anđela? Ako ste na ovo pitanje odgovorili negativno, znajte da je vrijeme da pronađete investitora i otvorite novu stranicu u historiji svog poslovanja