DatoriProgrammatūra

Izvērstā meklēšana un vaicājumu valoda. Valodu meklētājprogrammu vaicājumi

Query Language - ir mākslīgi radīts ar programmēšanas valoda, ko izmanto, lai vaicājumu datu bāzes un informācijas sistēmas.

Kopumā šādas metodes vaicājumu var klasificēt atkarībā no tā, vai tie tiek izmantoti datu bāzē, vai meklēt informāciju. Atšķirība ir tā, ka pieprasījumus šādiem pakalpojumiem esam apņēmušies sniegt faktiskos atbildes uz šiem jautājumiem, bet meklētājprogrammas cenšas atrast dokumentus, kas satur informāciju par lietotājam ir ieinteresēts šajā jomā.

Datu bāzes

Valodas bāzes vaicājumu ietver šādus piemērus:

  • QL - objektu orientēta, attiecas uz relāciju datu bāzēm; DATALOG pārņēmējs.
  • Konteksts (CQL) - formālā valoda uzrādot pieprasījumu informācijas izguves sistēmās (piemēram, tīmekļa indeksu vai bibliogrāfiskie katalogi).
  • CQLF (CODYASYL) - par CODASYL-TYPE datubāzēm.
  • Koncepcija orientēta vaicājumu valoda (COQL) - izmanto attiecīgajās modeļos (COM). Tā ir balstīta uz datiem construpt modelēšanas principiem un izmanto operācijas, piemēram, projekcijas un de projekcija daudzfaktoru analīzi, analītisko darbību un secinājumiem.
  • DMX - izmanto ieguves modeli.
  • DATALOG - vaicājums valoda deduktīvs datu bāzēm.
  • Gellish Angļu - valoda, kas var tikt izmantoti, lai vaicājumu datu bāzi Gellish angļu un ļauj sarunas (pieprasījumus un atbildes), kā arī kalpo par informācijas modelēšanas zināšanas.
  • HTSQL - pārveido HTTP vaicājumus SQL.
  • ISBL - lieto, lai PRTV (a pirmais relāciju datu bāzu pārvaldības sistēmām).
  • LDAP - protokols vaicājumiem un direktoriju pakalpojumiem, kuri darbojas, izmantojot TCP / IP protokolu.
  • MDX - būtiska OLAP datu bāzēm.

Bots

Valodu meklēšanas vaicājumus, savukārt, mērķis ir atrast datus meklētājprogrammas. To raksturo ar to, ka daļa no pieprasījuma satur teksta vai hiperteksta ar izvēles sintaksi (piemēram, "un" / "vai"). Tas būtiski atšķiras no standarta līdzīgu valodu, kas regulē stingri noteikumi sintakses vai komandas sastāvā pozicionālo parametrus.

Kā klasificēti meklēšanas vaicājumiem?

Ir trīs plašās kategorijās, kas aptver lielāko daļu meklējumiem: informatīvo, navigācijas, un darījumu. Kaut arī šī klasifikācija nav noteikta teorētiski, empīriski to apstiprina klātbūtni faktisko vaicājumu meklētājprogrammas.

Informācijas pieprasījumi - tie, kas aptver plašu tēmu (piemēram, noteiktu pilsētu, vai modelis kravas), attiecībā uz kuru var iegūt tūkstošiem atbilstošu rezultātu.

Navigācija - tas lūdz meklē mājas lapā vai interneta lapu par konkrētu tēmu (piemēram, YouTube).

Darījumu - atspoguļo lietotāja nodomu veiktu konkrētu darbību, piemēram, lai iegādātos automašīnu vai rezervēt lidojumu.

Meklētājprogrammas bieži nodrošina ceturto pieprasījuma veids, kas tiek izmantots daudz retāk. Šī tā saucamā savienojuma pieprasījumus, kas satur datus par savienojamības indeksē tīmekļa grafiku (vairākas saites uz URL definēts, vai, cik daudz lapas ir indeksētas ar konkrētu domēnu).

Kā veikt meklēšanu informāciju?

Lielākā daļa meklēšanas resursi neatklāj savus meklēšanas žurnālus, lai informācija, ko lietotāji meklē tīmeklī, tas ir ļoti grūti atrast. Neskatoties uz to, ka pirmie zinātniskie pētījumi parādījās 1998. gadā. Tas vēlāk tika atkārtoti pētījums veikts 2001. gadā, kurā analizēja pieprasījumi parādās kā ļoti nozīmīgi. Tas arī kļuva skaidrs, kā izmantot meklētājprogrammas vaicājumu valodu.

Viņi kļuva zināms interesantas raksturlielumiem, kas saistīti ar Web:

Vidējais ilgums bija 2,4 meklēšanas vaicājuma vārdi.

  • Aptuveni puse no cilvēkiem tiek nosūtīts pieprasījums, bet nedaudz mazāk nekā trešdaļa lietotāju to trīs vai vairāk, unikālu vaicājumus pa vienam.
  • Gandrīz puse no lietotājiem, lai skatītu tikai pirmos vienu vai divas lapas rezultātiem.
  • Mazāk nekā 5% lietotāju izmanto uzlabotas meklēšanas iespējas (piemēram, izvēlēties jebkuru konkrētu kategoriju vai meklēšanai meklēšanā).

Funkcijas pielāgotas darbības

Pētījums arī parādīja, ka 19% no visiem pieprasījumiem ietverto ģeogrāfisko nosaukumu (piemēram, nosaukumu, pasta indeksu, ģeogrāfiskas iezīmes, un D. utt.). Tomēr ir vērts atzīmēt, ka papildus īsiem jautājumiem (ti, ar vairākiem apstākļiem) bieži ir klāt, un prognozējami modeļus kurā lietotāji maina savu meklēšanas frāzes.

Tika arī konstatēts, ka 33% no pieprasījumiem no viena lietotāja tiek atkārtotas, un 87% gadījumu lietotājs nospiediet to pašu rezultātu. Tas liecina, ka daudzi lietotāji izmanto atkārtotus lūgumus pārskatīt vai atkārtoti atrast informāciju.

Biežums sadalījums pieprasījumu

Bez tam, eksperti apstiprināja, ka biežums izplatīšanas pieprasījumiem atbilst strāvas likumu. Tas nozīmē, ka neliela daļa no atslēgvārda notiek lielākajā sarakstā vaicājumu (piemēram, vairāk nekā 100 miljoni), un tās visbiežāk izmanto. Soda pārējie ar tiem pašiem cilvēkiem, tiek izmantoti retāk un individuāli. Šo parādību sauc par Pareto principu (vai "80-20 noteikums"), un tas ir iespējams izmantot šādus meklētājprogrammas optimizācijas metodes, piemēram, indeksējot vai sadalīšanu datu bāzes, caching un priekšielādi, kā arī sniedza iespēju uzlabot valodu meklētājprogrammu vaicājumiem.

Pēdējos gados, tas ir atklāts, ka vidējais vaicājums garums ir pastāvīgi pieaug laika gaitā. Tādējādi vidējā pieprasījums angļu valodā kļuva ilgāk. Šajā sakarā, Google ir ieviesusi atjauninājumu ar nosaukumu "Kolibri" (augusts 2013), kas spēj apstrādāt garus meklēšanas frāzes, kam nav protokola "runā" vaicājumu valodu (piemēram, "Kur ir tuvākā kafejnīca?").

Ilgāk vaicājumus izmanto to apstrādi - tie ir sadalīti frāžu šarnīrveida standarta valodu un parāda atbildes uz dažādām daļām atsevišķi.

strukturēta vaicājumu

Meklētājprogrammas, kas atbalsta loģisku darbību un sintaksi, ko izmanto visā ilgāku vaicājumu valodu. Lietotājs, kurš meklē dokumentus, kas aptver vairākas tēmas vai aspekti, var aprakstīt katru no tām loģiskā raksturojumu vārda. Savā kodols, loģiskā vaicājumu valoda ir kopums konkrētas frāzes un pieturzīmes.

Kas ir uzlabotas meklēšanas?

Valoda "Yandex" un "Google" vaicājumi spēj veikt mērķtiecīgāku meklēšanu, ievērojot noteiktus nosacījumus. Izvērstā meklēšana var meklēt lapas nosaukumu vai izmantot prefiksu galvenes, kā arī ir noteiktas kategorijas un saraksti vārdu. Tā var arī ierobežot meklēšanu ar lapām, kurās ir īpašas vārdiem nosaukumā vai zināmos tematiskajās grupās. Ja to izmanto pareizi, vaicājums valoda tā var rīkoties parametrus par kārtu sarežģītāku nekā virsmas izsniegšanas lielākās meklētājprogrammas, tostarp lietotāja definētus vārdiem beigās mainīgo un to pašu pareizrakstību. Iesniedzot uzpūsti meklēšanas rezultāti tiks parādīti kā saite uz attiecīgajām lapas sadaļām.

Tāpat ir iespējams, lai meklētu visas lapas, kas satur konkrētu frāzi, bet standarta vaicājumu meklētājprogrammas nevar kavēties jebkurā sarunu lapā. Daudzos gadījumos vaicājumu valoda var izraisīt jebkurā lapā, kas atrodas Bezindeksa tagus.

Dažos gadījumos, labi veidoti pieprasījums ļauj atrast informāciju, kas satur vairākas speciālās rakstzīmes un vēstules citu alfabētu (ķīniešu rakstzīmes, piemēram).

simboli vaicājumu valoda, kā lasīt?

Lielos un mazos burtus, kā arī daži diakritiskās zīmes (diakritiskās zīmes un Umlaut) netiek uzskatīti meklēšanā. Piemēram, atslēgvārds meklēt Citroen neatradīsiet lapas, kuras satur vārdu "Tsitroon". Bet daži ligatūras atbilst atsevišķiem burtiem. Piemēram, meklēt "Ærøskøbing" viegli atrast lapu, kurā ir "Ereskebing" (AE = Ae).

Daudzi nav burtciparu rakstzīmes ir pastāvīgi ignorēti. Piemēram, nav iespējams atrast informāciju par jautājumiem, kuros iekļauta virkne | L | (Vēstule starp divām vertikālām svītrām), neskatoties uz to, ka šis simbols tiek izmantots dažās veidnes, lai pārvērstu. Rezultāts būs tikai "LT" dati. Daži simboli un frāzes apstrādā dažādos veidos: vaicājums "aizdevums (finanses)" parāda rakstu ar vārdiem "kredīts" un "finanšu", ignorējot iekavās, pat tad, ja ir raksts ar tieši šādu nosaukumu "kredītu (finanšu)".

Ir daudzas iespējas, ka jūs varat izmantot ar vaicājumu valodu.

sintakse

Query Language "Yandex" un "Google", var izmantot dažas pieturzīmes, lai precizētu meklēšanu. Kā piemēru var minēt, cirtaini bikšturi - {{}} search. Tajos ietvertā frāze, būs pakļautas meklēt visu nemainīgs.

Ar dubultās pēdiņas frāze ļauj definēt objektu meklēšanu. Piemēram, vārds pēdiņās, tiks atzīts par lietots pārnestā nozīmē, vai kā izdomāts raksturu, bez pēdiņām - šī informācija ir daudz dokumentāls raksturs.

Turklāt visi galvenie meklētājprogrammas atbalstīt "-" par loģiska "nē", kā arī, un / vai. Izņēmums - noteikumi, kurus nevar atdalīt ar defisi vai domuzīme prefiksu.

Neatbilst meklēšanas frāze ir atzīmēti ar ~. Piemēram, ja jūs neatceraties precīzu formulējumu par termina vai nosaukumu, varat to ievadīt meklēšanas joslā ar norādīto simbolu, un varēs iegūt rezultātus ar maksimālu līdzību.

Par parametri specializētās meklēšanas

Ir arī tādi kritēriji kā nosaukumā, un incategory. Šie filtri tiek parādīti ar kolu, kā "filtru: vaicājuma virknes". Vaicājumu virkne var saturēt meklējamo vārdu vai frāzi, vai daļu vai pilnu lapas nosaukumu.

Funkcija «nosaukumā: vaicājums" dod priekšroku meklēšanas rezultātiem pēc nosaukuma, bet arī parāda, un parastie rezultātus informatīvajā galvenes. Vairāki no šiem filtriem var izmantot vienlaicīgi. Kā var izmantot šo iespēju?

Vaicājuma veids «nosaukumā: nosaukums lidostas" sniegs visus rakstus, kas satur nosaukumu nosaukumu lidostas. Ja mēs formulēt to kā «autostāvvieta nosaukumā: lidostas nosaukumu", tad jūs saņemsiet rakstu ar nosaukumu lidostas nosaukumu un ar norādi par stāvvietu tekstā.

Meklēt filtrs «incategory: Kategorija" strādā par sākotnējo izsniegšanu, kuras pieder pie konkrētas grupas vai lapas sarakstā principu. Piemēram, meklēšanas vaicājumu, lai tipa "Tempļu incategory: History" ražos rezultātus vēstures tempļi. Šo funkciju var izmantot arī kā pagarinājumu, nosakot dažādus parametrus.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 lv.atomiyme.com. Theme powered by WordPress.