כלי החיפוש באינטרנט נחלקים לשני סוגים עיקריים :
א. "מנועי חיפוש אוטומטיים"
ב. אינדקסים אשר נבנים בצורה ידנית.
א. "מנועי החיפוש האוטומטיים"
מנועי החיפוש האוטמאטיים אוספים את הנתונים בעזרת "תוכנות שיטוט ואיסוף"' , תוכנות יעודיות אלו ידועות בספרות המקצועית לעתים גם בשם ( Crawlers ) הסורקות את אתרי האינטרנט ועוברות מדף לדף ומאתר לאתר (דרך הקישורים).
הן יוצרות קובץ גדול מאוד של מאות מיליוני דפים שעברו אינדוקס אוטמאטי ע"י תוכנה. הקובץ עליו נעשה החיפוש כולל כל מילה ש"תוכנות השיטוט" איתרו. ניתן לחפש במנועים אלה בצורה ישירה מילים או ביטויים במאות מיליוני דפים. דוגמאות של מנועים אוטומטיים: BING ,YAHOO ,Google.
אף לא אחד ממנועי החיפוש מכסה את כל האינטרנט (מעל 40 מיליארד דפים),מנועי החיפוש האוטמטיים הגדולים שבהם (כגון גוגל ) מכסים רק 50 אחוזים מהדפים. למרבית מנועי החיפוש האוטומטיים יש הסכם עם אינדקסים גדולים ובמקרה שלא מוצאים בהם את המידע הרצוי הם מפנים לאינדקס עמו הם קשורים.
ב. אינדקסים
כלי עזר למיפוי מידע /ארגון מידע הכוללים מידע שיטתי שנאסף על ידי אנשים או מידענים שמקטלגים באופן ידני את האתרים תחת "עץ קטגוריות" ומספקים תיאור קצר או איפיון קצר לכל אתר שנוסף לעץ הקטגוריות ( או "עץ-הנושאים" ).
אינדקס הוא רשימה של קטגוריות ונועד להציע לגולש חיפוש מונחה ברשת האינטרנט.דף האינדקס בנוי בצורת עץ נושאים, המכיל תחילה קטגוריות כלליות ואח"כ קטגוריות משנה.אתרי אינדקס ניתן למצוא בעמוד הפורטלים. |
באינדקסים של אתרים מתחלק התהליך לשניים: איסוף ותצוגה.תהליך האיסוף מתבצע על ידי אנשים שתפקידם למצוא אתרים חדשים, לכתוב עליהם תיאור קצר ולסווג אותם במבנה היררכי. |
באינדקסים של אתרים אפשר גם לבצע חיפוש לפי מילות חיפוש , אך צריך לזכור שהחיפוש מתבצע על שמות הקטגוריות, האתרים או התיאור שלהם ולא על התכנים בתוך האתר.
דוגמאות מעודכנות של אינדקסים , נובמבר 2014
דוגמא לאינדקס בעברית של מקורות מידע על מלחמת העצמאות
דוגמא לאינדקס של כלים מתוקשבים לניהול תוכן וניהול מידע (content curation )
אינדקס נושאי ויזאולי לתחום אוצרות תוכן ואוצרות דיגיטאלית ( סינון , מיון וארגון מקורות מידע)
דוגמא לאינדקס על טיולים באזור טוסקנה , איטליה
דוגמא לאינדקס על טיולים ותיור בויטנאם
האינדקס משמש מעין מפת התמצאות מהירה , כאשר רואים את כל תמונת האתרים ביריעה אחת , כאשר החלוקה היא לנושאי משנה ( קטגוריות)
"מתי/למה אינדקס"?
-
השימוש בהיררכיות לארגון מידע מקל על מציאתו אחר כך.
-
המידע המופיע על האתרים הוא מידע מסודר שנכתב על ידי אנשים.
-
מתואר בו תוכן האתר, מבנהו , וניתן גם להשוותו לאתרים אחרים על פי קריטריונים כמו: רייטינג, ציון וכו'.
הליכים בבניית אינדקס מקצועי
באינדקס אתרים קיים קטלוג קישורים אל אתרי אינטרנט הממויין על-פי עץ נושאים היררכי. הכנסת אתר חדש לקטלוג מבוצעת בעקבות הצעת האתר על ידי אחד ממשתמשי האינדקס.
בעת הרישום מגיש מציע האתר את שם האתר ותיאור קצר של תוכנו. בשלב הבא האתר נסקר על ידי אחד מעורכי האינדקס, ובמידה והוא נמצא ראוי להופיע, הוא יתווסף לאינדקס האתרים.
המידע המופיע באינדקס לגבי האתר הוא שילוב של המידע אותו הגיש מציע האתר, עם שינויים אותם ביצע העורך. אינדקס אתרים מסוג זה יהיה מבוסס על עריכה אנושית, וידרוש משאבים רבים על מנת לשמור על עדכניות המידע. דוגמא לאינדקס מסוג זה היא אינדקס דמוז (dmoz.org).
הדוגמא המוכרת ביותר של אינדקס הוא ה – Yahoo אשר מכסה כ 5 מיליון אתרים. קיימים עוד אינדקסים בגודל דומה ( לדוגמא: ׂhttp://dmoz.org,) ואלפי אינדקסים קטנים המתמחים בנושאים ספציפיים. במקרים רבים האינדקסים הספציפיים הם יותר מקצועיים וממוקדים בתחום אותו הם מכסים וכדאי להקדיש זמן לאיתור אינדקס טוב בתחום בו מתעניינים או חוקרים.
אינדקס DMOZ , עברית ( עדיין בשלבים ראשונים , אבל אפשר להשתמש) .
הנה לדוגמא, האינדקס של DMOZ העוסק בנושאי בריאות
הנה לדוגמא , האינדקס של מDMOZ המוקדש לתולדות האמנות
ניתן ישירות מתוך האינדקס להריץ חיפוש באותו נושא באחד ממנועי החיפוש העיקריים
לדוגמא :
"Art History" search on: AOL – Ask – Bing – Blekko – DuckDuckGo – Gigablast – Google – ixquick – Yahoo – Yandex – Yipp
מטלה מס' 1
התנסות קצרה באינדקס DMOZ
עליכם לבחור נושא כלשהו באינדקס הממויין של DMOZ ולשוטט שם .
עוד על האינדקס של DMOZ
שייך למעשה לארגון ממפתחים ידני בשם DMOZ .ORG
http://dmoz.org
זהו , למעשה, ארגון אינדקסים המתחרה ליאהו ועתה הוא המוביל באינטרנט . הוא מבוסס על עבודת מתנדבים בלבד . לכן , יש לעתים שהכיסוי שלו טוב ויש לעתים שהכיסוי שטחי .
עכשיו גשו לאינדקס והתרשמו מצורתו וממתכונת הסיווג שלו : http://dmoz.org
חיפוש מתקדם בDmoz
ראו צילום מסך של חיפוש מתקדם בdmoz
במנגנון חיפוש מתקדם של DMOZ אפשר למקד את החיפוש בקטגוריה ( categories only ) של נושא מסויים כגון REFERENCE , חינוך או בריאות .
האינדקס המפואר שירד מגדולתו : YAHOO
האינדקס של יאהו היה בזמנו החשוב בעולם זהו ה-DIRECTORY של יאהו YAHOO הנמצא בכתובת הבאה :
http://dir.yahoo.com
הקטגוריה של אתרי חינוך ( באנגלית) באינדקס יאהו
לצערנו הרב , ביולי 2014 הודיעה חברת יאהו כי היא מפסיקה לעדכנו .
אינדקסים עיקריים בישראל
א. אינדקס נענע
מפעל של צוות אנשי המידע המסורים באתר נענע העובד כבר למעלה מ10 שנים על סיווג ידני והיררכי של האתרים הישראליים העיקריים .
ב. פרוייקט ת.א.ר
"מטרתו של פרוייקט ת.א.ר – תו איכות רשת הוא להביא את תשומת לב הגולשים לאתרים איכותיים.
היות ואין ב"עולם האינטרנט הישראלי" תקן או אתר המצביע על אתרים איכותיים, לקחנו על עצמינו להצביע על אתרים אלו.
לא מדובר בהכרח באתרים יוצאי דופן בעיצובם או בתכניהם, אלא באתרים המציגים את התכנים אותם הם התיימרים להציג, בצורה טובה וברורה".
דוגמא לאינדקס שלהם בנושאי בריאות ורפואה
דגמים מומלצים של אינדקסים בישראל
האינדקס הממוין הישראלי של נענע 10
האינדקס של YNET
אינדקס אתרי יהדות :: בבא קמא
דוגמא לאינדקס צמחי מרפא
אינדקס אחזקה ובטיחות תעשייה בישראל – דוגמא לאינדקס נגלל
אינדקס משולב עם מסד נתונים פרמטרי ( חיפוש עפ"י סיווגים) , אינדקס מטפים פסיכולוגים בישראל
מטלה מס' 2
עליכם לבחור נושא כלשהו באינדקס של YNET ולשוטט בו
סיכום השיעור
מנוע חיפוש יוצר אינדקסים אוטומטיים לכל מילה בטקסט ובכותר ללא שיקול דעת , ואילו אינדקס מבוסס על סינון ומיון של אנשים. כלומר מידענים הם אלו שבוחרים באופן מבוקר וידני את האתרים שיופיעו באינדקס ויוצגו בפניכם.
האינדקס ממקד את החיפוש לאתרים הרלבנטיים בלבד . תמיד נקבל מידע רלבנטי ומדויק כאשר נחפש באינדקס המבוקר.
לעומת זאת במנוע חיפוש אוטומאטי כגון GOOGLE רק חלק מהמידע ( בסביבות 20 אחוזים) רלבנטי וממוקד.
Pingback: עמי סלנט » אינדקסים ככלים לחיפוש מידע מסונן במידענות – חלק ב’
Pingback: עמי סלנט » הקניית מיומנויות חיפוש מידע לתלמידים: תמונת מצב 2012
Pingback: מתחת למכסה המנוע : אסטרטגיות חיפוש מידע באינטרנט ובמאגרי מידע | עמי סלנט