יום רביעי כ"ח באייר, 24 במאי

לשרותכם מנוע חיפוש מבוסס גוגל הממוקד באתרים חינוכים.Beta

   : חפש ראשי

מנוע חיפוש - מאחורי הקלעים

מידענות בבית הספר היא אותה מיומנות המאפשרת לכם התלמידים לאתר במדויק את המידע לו אתם זקוקים, להעריך אותו ולעשות בו שימוש חכם.
נשמע מסובך? ממש לא!
בכל שבוע בז יביא לכם כתבה נוספת שתעזור לכם להתמצא בנבכי הרשת והפעם כתבה ראשונה בסדרה העוסקת במנועי חיפוש.

יוצאים לדרך בחיפוש אחר המידע - מה זה מנוע חיפוש?

בכדי להבין כיצד פועל מנוע חיפוש ישנן כמה עובדות שרצוי לדעת על מבנה רשת האינטרנט.
אתרי אינטרנט נמצאים במחשבי שרת ברחבי העולם. מחשבי שרת להבדיל ממחשבים אישיים מאפשרים לנו לבקר בהם ולצפות בתוכן שנמצא בהם, תכונה שאינה קיימת במחשבים אישיים המסוגלים לקבל מידע בלבד. (זה אולי מסביר לחלק מאתנו מדוע אף אחד לא יוכל לצפות באתר המקסים שבנינו על המחשב האישי שלנו). מחשבי השרת מחוברים זה לזה בתקשורת מחשבים כמו רשת של קורי עכביש.

מהו אתר?
אתר הוא למעשה אוסף של דפים שנקראים דפי web ונכתבים בשפת html.דפים אלה מכילים טקסט ,קבצי תמונות,וידאו ואו קול . אחד המאפיינים של דפי web הוא יכולתם לקשר מדף אחד לדפים אחרים באותו אתר או באתרים אחרים, מה שאנו קוראים בשפת היום יום לינקים או בעברית -קישורים.

מנוע חיפוש
מנוע חיפוש הוא למעשה מחשב שרת ענק המפעיל תוכנת רובוט (Robot). הרובוט סורק מחשבי שרת ברשת באופן שיטתי תוך מעבר מאתר לאתר על-פי הקישורים המופיעים באתר. כאשר הרובוט מגלה אתר חדש, הוא בודק אם הוא מורשה למפתח אותו. ואם כן, הוא מעתיק את כל תוכן האתר, או חלקו, אל השרת של המנוע, והמנוע ממפתח את המידע שנאסף. כל המילים בתוכן האתר נשמרות במסד הנתונים של המנוע . מלבד תוכן האתר, נשמרים במסד הנתונים גם נתונים נוספים כגון תאריך "הורדת" האתר, תאריך עדכון אחרון של האתר, תמצית אוטומטית קצרה, כותרת האתר ועוד. בגלל שאתרי אינטרנט הם דינמיים, כלומר, מתעדכנים מזמן לזמן, רובוטים גם מעדכנים את האתרים שכבר מופתחו בעבר. קישורים הנמצאים באתר מוכנסים למבנה נתונים דמוי תור ומשם גם נלקחים האתרים הבאים ל"ביקור".

ניתן לחשוב שרובוט יכול להתחיל משרת מסוים ולמפתח את האתר שבו, אח"כ לעבור לאתרים המקושרים ישירות לאתר זה וכך הלאה והלאה ולבסוף למפתח את כל המידע באינטרנט. אולם, המציאות שונה. ישנם אתרים שלא מקושרים לאף אתר, כך שהרובוט לא יכול להגיע אליהם, ישנם "מסלולי" אתרים שהרובוטים מתקשים למצוא וגם כוח המחשוב וגודל מסד הנתונים הנדרש למפתוח כל הרשת עצומים. למעשה, נתונים מראים שמנועי החיפוש מצליחים לסרוק לא יותר מ -30%-35% מדפי ה web שברשת.
צורת הפעולה של כל המנועים דומה, אבל לכל אחד מהם ייחוד משלו. הייחודיות היא קודם כל באתרים שהאספן (הרובוט) סורק: חלקם סורקים רק שרתי WWW, וחלקם גם שרתי FTP (שרתי קבצים) או קבוצות דיון. יש אספנים הסורקים כל אתר, ויש הסורקים רק אתרים בעלי מס' כניסות רב וקצב עדכון גבוה. ייחודיות המנוע היא גם גודל המאגר שלו. כן יש הבדלים במידע שהמנוע שומר בשרת שלו: יש מנועים השומרים את כל תוכן האתר, ויש השומרים רק את תחילתו (מתוך הנחה שתחילת האתר מעידה על נושאו) או את האתר עד "עומק" מסוים. יש אספנים המטפלים גם בתמונות שיש באתר, בקבצי קול ומולטימדיה ובקישורים. דברים נוספים המבדילים בין המנועים הם מנגנון החיפוש וברירות החיפוש השונות, שיטת דירוג תוצאות החיפוש וחישוב רלוונטיות האתרים.
מנועי חיפוש הם כלים אוטומטיים, עם מעט מאוד "מגע" אנושי. המילים בתוכן האתר נשמרות במסד הנתונים וניתנות לאחזור, אך אין מיון אנושי של האתרים ואין תקציר אודותיהם הנכתב על ידי מידענים כפי שנמצא במדריכי אתרים.
עד כה סיפרנו מה הוא מנוע חיפוש וכיצד הוא פועל בשבוע הבא נסביר כיצד אנו הגולשים נשתמש במנועי חיפוש.
מנועי חיפוש הסוקרים את הרשת העברית: מורפיקס גוגל ישראל
alltheweb (יש להגדיר שפת שימוש Hebrew )




08.09.2002



השבוע בהיסטוריה
מורשת ישראל
אוכל ושאר ירקות
על הא ודע במדע
פנאי ובידור
הפסקה פעילה
בז שטח
מידענות
תיבת נח
המלצה על ספר
בניית אתרים


דילן, בוב

לפי תאריך :

כתוב לנו | ספר אורחים | אמנת פרטיות | פרסם בבז | הוסף אתר
כל הזכויות שמורות בז © 2000-2002 תנאי שימוש
האתר נבנה ומתוחזק עלידי אפוק