Τετάρτη 23 Απριλίου 2008

Πώς λειτουργούν οι μηχανές αναζήτησης;


Oι μηχανές αναζήτησης είναι το κλειδί για να βρούμε συγκεκριμένες πληροφορίες στον τεράστιο όγκο πληροφοριών του Παγκόσμιου ιστού. Χωρίς την χρήση ευφυών μηχανών αναζήτησης θα ήταν σχεδόν αδύνατο να βρούμε αυτό πού ζητούσαμε και αυτό γίνεται ακόμα δυσκολότερο καθώς το Internet εξαπλώνεται κάθε μέρα.

-Τι είναι όμως αυτό που κάνει μια μηχανή αναζήτησης ευφυή;

-Γιατί στα αποτελέσματα της μηχανής αναζήτησης μπορεί να περιέχονται και λανθασμένοι ή σπασμένοι σύνδεσμοι;


Γενικά έχουμε τρεις τύπους μηχανών αναζήτησης:


-- "Crawler-based engines" στέλνουν κάποια αυτοματοποιημένα προγράμματα, που ονομάζονται robots (ή web crawlers ή spiders ή bots) που επισκέπτονται μία ιστοσελίδα και διαβάζουν πληροφορίες από αυτά που γράφει, διαβάζουν τα meta-tags του κώδικα της ιστοσελίδας και επισκέπτονται τους συνδέσμους της. Τα robots αυτά γυρίζούν πίσω όλες τις πληροφορίες, οι οποίες αποθηκεύονται σε Ευρετήρια.


-- "Human-powered": οι μηχανές αναζήτησης βασίζονται σε ανθρώπους που στέλνουν πληροφορίες που κατηγοριοποιούνται και αποθηκεύονται.


-- Τύπος που χρησιμοποιεί τα χαρακτηριστικά και των δυο μαζί.


'Έτσι και στις τρεις περιπτώσεις όταν ζητάμε κάποια πληροφορία από μια μηχανή αναζήτησης, στην πραγματικότητα ψάχνουμε τις πληροφορίες που είχε συγκεντρώσει κάποια στιγμή στο παρελθόν. Οι πληροφορίες αποθηκεύονται σε τεράστιες βάσεις δεδομένων και ανανεώνονται σε χρονικά διαστήματα που καθορίζονται από τις εταιρίες που έχουν τις μηχανές αναζήτησης.


Έτσι λοιπόν εξηγείται όταν κάνουμε αναζήτηση για παράδειγμα στο Google ή στο Υahoo και μέσα στα αποτελέσματα που μας επιστρέφει μπορεί να είναι και κάποιοι σπασμένοι η λανθασμένοι σύνδεσμοι. Αυτό συμβαίνει βέβαια γιατί μια σελίδα μετακινήθηκε ή τροποποιήθηκε μετά από την τελευταία φορά που ενημερώθηκε η βάση δεδομένων της μηχανής αναζήτησης. Και αυτή η κατάσταση θα παραμένει να υπάρχει μέχρι να γίνει ενημέρωση.

Δεν υπάρχουν σχόλια:

Flickr Images