Vés al contingut

Motor de cerca

De la Viquip�dia, l'enciclop�dia lliure

Quota d'�s dels Motor de cerca m�s coneguts, segons StatCounter al Desembre del 2021[1]

  Google (95.61%)
  Bing (2.84%)
  Yahoo! (0.94%)
  DuckDuckGo (0.32%)
  Ecosia (0.17%)
  Yandex (0.05%)
  Altres (0.07%)

Un motor de cerca o de recerca o b� cercador[2][3] �s un programa inform�tic dissenyat per ajudar a trobar informaci� emmagatzemada en un sistema inform�tic com ara una xarxa, Internet, un servidor o un ordinador personal. L'objectiu principal �s el de trobar altres programes inform�tics, p�gines web i documents, entre d'altres.

A partir d'una determinada paraula o paraules o una determinada frase, l'usuari demana un contingut sota un criteri determinat, i llavors recupera una llista de refer�ncies que compleixen aquest criteri. El proc�s es realitza a trav�s de les metadades,[4] elements que permeten recuperar informaci� als motors de cerca. Els �ndexs que utilitzen els cercadors sempre estan actualitzats a trav�s d'un robot web per generar rapidesa i efic�cia en la recerca. Els directoris, en canvi, s�n gestionats per editors humans.

La forma m�s p�blica i visible d'un motor de cerca �s un motor de cerca web que cerca informaci� a la World Wide Web.

Tipus de cercadors

[modifica]
  • �ndexs o directoris: S�n repertoris de p�gines web ordenats per tem�tiques. El seu �s �s simple i senzill, nom�s cal anar clicant sobre les categories i subcategories. L'ordre l'estableix una persona, no una m�quina, �s a dir, el criteri acostuma a ser subjectiu.
  • Motors de cerca: S�n cercadors que, a trav�s d'un robot anomenat aranya,[5] rastregen Internet recol�lectant p�gines web i introduint-les a la base de dades autom�ticament. La caracter�stica principal �s que aquesta cerca es du a terme a partir d'una paraula clau. Els principals motors de cerca s�n Google, Yahoo! i Bing, entre d'altres.
  • Multicercadors o metacercadors: Busquen p�gines web en diferents cercadors, i combinen els resultats que obtenen. Els multicercadors no disposen de bases de dades pr�pies. Dos exemples de multicercadors s�n Metasearch i MetaCrawler.
  • FFA (Free For All):[6] Aquests cercadors s�n gratu�ts i permeten que l'usuari pugui inscriure-hi la seva p�gina web durant un temps limitat. No �s permanent.

Cercadors jer�rquics (aranyes o spiders)

[modifica]

Un rastrejador web, indexador web, o aranya web �s una programa inform�tic que inspecciona les p�gines de World Wide Web de forma met�dica i automatizada.[7] Un dels usos m�s freq�ents que se'ls dona consisteix a crear una c�pia de totes les p�gines web visitades per al seu processament posterior per un motor de cerca que indexa les p�gines proporcionant un sistema de recerques r�pid. Les aranyes web solen ser bots.[8]

Les aranyes web comencen visitant una llista d'URL, identifica els hiperenlla�os en aquestes p�gines i els afegeix a la llista d'URL a visitar de manera recurrent d'acord a determinat conjunt de regles. L'operaci� normal �s que se li dona a el programa un grup d'adreces inicials, l'aranya desc�rrega aquestes adreces, analitza les p�gines i busca enlla�os a p�gines noves. Despr�s desc�rrega aquestes p�gines noves, analitza els seus enlla�os, i aix� successivament.

Entre les tasques m�s comunes de les aranyes del web tenim:

  • Crear l'�ndex d'una m�quina de cerca.
  • Analitzar els enlla�os d'un lloc per buscar links trencats.
  • Recol�lectar informaci� d'un cert tipus, com preus de productes per recopilar un cat�leg.

Directoris

[modifica]

Un directori web �s un tipus de lloc web que cont� un directori organitzat de dades, imatges o, m�s generalment, enlla�os a altres llocs web. Els directoris web, contr�riament als motors de cerca, es caracteritzen per estar estructurats en categories i subcategories. Habitualment, els directoris web permeten als administradors web o creadors de llocs web que informin del seu lloc perqu� sigui incl�s, i despr�s els editors autoritzats revisen aquestes sol�licituds abans d'incloure les seves enlla�os per comprovar que s'adeq�en als requisits d'acceptaci� determinats pel directori web.[9]

Entre els directoris web generalistes m�s coneguts es poden esmentar el Yahoo! Directory (inactiu des 2014) i DMOZ (inactiu des 2017). En l'actualitat els directoris web supervivents s�n petites bases de dades especialitzades en temes concrets i per aix� ja no s�n tan populars. Els grans repertoris generalistes com van ser Yahoo! Directory o DMOZ ja han estat definitivament reempla�ats pels motors de cerca, principalment el cercador de Google.

Els directoris web regionals integren en un mateix lloc a comer�os, serveis, empreses o participants de determinat sector, enfocant-se en un territori comercial en espec�fic, creant d'aquesta manera una comunitat que facilita la navegaci�, localitzaci� i mercadeig. Aquests directoris promouen el creixement econ�mic de el sector a qu� estan enfocats ja que posen a l'abast de l'usuari la possibilitat de descobrir prove�dors que desconeixia que existissin i amb aix� resoldre una necessitat de compra.

Una tecnologia molt simple per gran quantitat de scripts disponibles, ja que no es requereixen molts recursos. En canvi, es requereix m�s suport hum� i mantenimient.[10]

Multicercadors

[modifica]

Un metacercador �s un sistema que localitza informaci� en els motors de cerca m�s usats, no t� base de dades pr�pia pel que fa servir les d'altres cercadors i mostra una combinaci� de les millors p�gines que ha cada un.[11] Un cercador normal recopila la informaci� de les p�gines mitjan�ant la seva indexaci�, com Google o b� mant� un ampli directori tem�tic, com Yahoo. La definici� simplista seria que un metacercador �s un cercador en cercadors.

�En altres paraules per al�ludir a el concepte m�s gen�ric d'un cercador, podem afirmar que un metacercador és el cercador que incorpora un conjunt de cercadors. Alguns exemples de metacercadors són: Dogpile, Aleyares [12] MetaCrawler, entre d'altres. Aquests metacercadors presenten avantatges, com ampliar l'espai de recerca i en alguns casos mostrar la posició del web ».[13]

Funcionament

[modifica]

Els motors de cerca proporcionen una interfície a un grup d'elements que permet als usuaris especificar criteris sobre un article d'interès i que el motor trobi els elements coincidents. Els criteris s'anomenen consulta de cerca. En el cas dels motors de cerca de text, la consulta de cerca normalment s'expressa com un conjunt de paraules que identifiquen el concepte desitjat que un o més documents poden contenir.[14] Hi ha diversos estils de sintaxi de consulta de cerca que varien en rigor. També pot canviar de nom als motors de cerca dels llocs anteriors. Mentre que alguns motors de cerca de text requereixen que els usuaris introdueixin dues o tres paraules separades per espai en blanc, altres motors de cerca poden permetre als usuaris especificar documents sencers, imatges, sons i diverses formes de llenguatge natural. Alguns motors de cerca apliquen millores a les consultes de cerca per augmentar la probabilitat de proporcionar un conjunt d'elements de qualitat mitjançant un procés conegut com a expansió de la consulta. Els mètodes de comprensió de consultes es poden utilitzar com a llenguatge de consulta estandarditzat.

Cercador basat en índexs

La llista d'elements que compleixen els criteris especificats per la consulta normalment s'ordena o es classifica. La classificació dels elements per rellevància (de major a menor) redueix el temps necessari per trobar la informació desitjada. Els motors de cerca probabilístics classifiquen els elements basant-se en mesures de similaritat (entre cada element i la consulta, normalment en una escala d'1 a 0, l'1 és el més semblant) i de vegades la popularitat o autoritat (vegeu bibliometria) o utilitza la opinió sobre la rellevància. Els motors de cerca booleans normalment només retornen elements que coincideixen exactament sense tenir en compte l'ordre, tot i que el terme motor de cerca booleà pot referir-se simplement a l'ús de la sintaxi d'estil booleà (l'ús d'operadors AND, OR, NOT i XOR) en un context probabilístic.

Per proporcionar un conjunt d'elements coincidents que s'ordenen d'acord amb alguns criteris ràpidament, un motor de cerca normalment recopilarà metadades sobre el grup d'elements que s'està considerant prèviament mitjançant un procés anomenat indexació. L'índex normalment requereix una quantitat més petita d'emmagatzematge informàtic, per la qual cosa alguns motors de cerca només emmagatzemen la informació indexada i no el contingut complet de cada element, i en canvi proporcionen un mètode per navegar als elements a la pàgina de resultats del cercador. Alternativament, el motor de cerca pot emmagatzemar una còpia de cada element en una caché perquè els usuaris puguin veure l'estat de l'element en el moment en què es va indexar o amb finalitats d'arxiu o perquè funcionin processos repetitius. de manera més eficient i ràpida.

Altres tipus de cercadors no emmagatzemen un índex. Els Crawler, o motors de cerca de tipus aranya (també coneguts com motors de cerca en temps real) poden recollir i avaluar elements en el moment de la consulta de cerca, considerant dinàmicament elements addicionals basats en el contingut d'un element inicial (conegut com a una llavor, o URL de llavor en el cas d'un rastrejador d'Internet). Els motors de cerca meta no emmagatzemen ni un índex ni una memòria cau i, en canvi, simplement reutilitzen l'índex o els resultats d'un o més motors de cerca per proporcionar un conjunt final agregat de resultats.

Història

[modifica]

El primer cercador va ser "Wandex", un índex realitzat pel World Wide Web Wanderer, un robot desenvolupat per Mattew Gray al MIT, el 1993. Un altre dels primers cercadors, Aliweb, també va aparèixer en 1993 i encara està en funcionament. El primer motor de cerca de text complet va ser WebCrawler, que va aparèixer el 1994. A diferència dels seus predecessors, aquest permetia als seus usuaris una recerca per paraules en qualsevol pàgina web, el que va arribar a ser un estàndard per a la gran majoria dels cercadors . WebCrawler va ser així mateix el primer a donar-se a conèixer àmpliament entre el públic. També va aparèixer en 1994 Lycos (que va començar a la Carnegie Mellon University).

Molt aviat van aparèixer molts més cercadors, com Excite, Infoseek, Inktomi, Northern Light i Altavista. D'alguna manera, competien amb directoris (o índexs temàtics) populars com Yahoo!. Més tard, els directoris es van integrar o es van afegir a la tecnologia dels cercadors per augmentar la seva funcionalitat. Abans de l'adveniment de la Web, hi havia motors de cerca per a altres protocols o usos, com el cercador Archie, per a llocs FTP anònims i el motor de cerca Verònica, per al protocol Gopher.

El 1996 Larry Page i Serguei Brin van començar un projecte que portaria a l'aparició del cercador més utilitzat avui dia: Google. El projecte inicial es va cridar BackRub,[15] que era el nom de la tecnologia utilitzada per al seu desenvolupament. BackRub basava la importància dels llocs web en la quantitat d'enllaços que rebia. Presentava una interfície molt senzilla i capaç de mostrar als l'usuari els resultats més rellevants per a cadascuna de les recerques. Amb l'arribada de Google, la manera en què els motors de cerca funcionaven va canviar de forma radical, democratitzant els resultats que s'ofereixen en el seu cercador. Google va basar el funcionament del seu motor de cerca a la rellevància dels continguts de cada lloc web per als propis usuaris, és a dir, prioritzant aquells resultats que els usuaris consideraven més rellevants per a una temàtica concreta. Per a això va patentar el seu famós PageRank, un conjunt d'algoritmes que valoraven la rellevància d'un lloc web assignant-li un valor numèric de el 0 a el 10.

En la majoria de països Google.com o la versió de Google per al país concret, és el cercador més utilitzat, però, això no passa en alguns països. Per exemple, a Rússia el cercador més utilitzat és Yandex[16][17] i a la Xina és Baidu.[18]

La Unió Europea en 2018 li va imposar una multa de 5.000 milions d'euros per pràctiques monopolístiques, al considerar que força injustament als fabricants per a que la seva aplicació de recerca estigui a tots els telèfons que executin Android.[19]

Cercadors en català

[modifica]

Referències

[modifica]
  1. «Search Engine Market Share Spain». [Consulta: 1r febrer 2022].
  2. IDEC. Manuals d'ajuda. 15-03-2014.
  3. Apunts del curs d'Internet. Òmnia, accés a les noves tecnologies. Consultat el 15-02-2010
  4. Metadades. Diputació de Barcelona. http://www.diba.cat/web/idebarcelona/metadades
  5. Snowden utilizó una araña web para conseguir documentos de la NSA. Yahoo! Noticias Arxivat 2016-10-28 a Wayback Machine.
  6. Historia de la informática. http://histinf.blogs.upv.es/2011/01/11/1808/ Arxivat 2014-03-17 a Wayback Machine.
  7. Kobayashi, Mei; Takeda, Koichi «Information retrieval on the web». ACM Computing Surveys, 32, 2, 01-06-2000, pàg. 144–173. DOI: 10.1145/358923.358934. ISSN: 0360-0300.
  8. «Scutter - FOAF Wiki», 13-12-2009. Arxivat de l'original el 2009-12-13. [Consulta: 9 novembre 2020].
  9. «Directorio Web - EcuRed» (en castellà). [Consulta: 9 novembre 2020].
  10. «Tema 1.4. Directorios temáticos». Arxivat de l'original el 2020-02-25. [Consulta: 9 novembre 2020].
  11. «Google Llibres». [Consulta: 9 novembre 2020].
  12. Curiel, Raúl López. Las TIC en el aula de Tecnología. Guía para su aplicación a la metodología de proyectos (en castellà). Lulu.com, 2014-02. ISBN 978-1-291-60929-5. 
  13. Vargas Osorno, Teresa Genoveva, Bancos de datos jurídicos. Pasado, presente y futuro.. Bancos de datos jurídicos. Pasado, presente y futuro. (tesi) (en castellà). UCM: Universidad Complutense de Madrid, 2015, p. 441.  Arxivat 2016-02-01 a Wayback Machine.
  14. Voorhees, E.M. Natural Language Processing and Information Retrieval[Enllaç no actiu]. National Institute of Standards and Technology. March 2000.
  15. «Historia de los motores de búsqueda. Los inicios de Google.» (en castellà), 18-09-2016. [Consulta: 9 novembre 2020].
  16. «Los principales motores de búsqueda en Rusia: Yandex, Google.ru, Mail.ru y Rambler» (en castellà), 13-11-2013. [Consulta: 9 novembre 2020].
  17. «Cómo es Yandex, el poderoso buscador que le gana la partida a Google en Rusia» (en castellà). BBC News Mundo.
  18. País, Ediciones El. «¿Cómo se busca sin Google en el internet chino?» (en castellà), 03-08-2018. [Consulta: 9 novembre 2020].
  19. Sanz, José Luis. «El éxito del buscador de Google lo marca Bing, la alternativa de Microsoft: ¿por qué?» (en castellà). Cinco Dias, 01-10-2021. [Consulta: 14 desembre 2021].

Vegeu també

[modifica]

Enllaços externs

[modifica]