אינדקסים לעומת מנועי חיפוש

17498

כלי החיפוש באינטרנט נחלקים לשני סוגים עיקריים :

א. "מנועי חיפוש אוטומטיים"

ב.  אינדקסים אשר נבנים בצורה ידנית.


א.  "מנועי החיפוש האוטומטיים"

מנועי החיפוש האוטמאטיים אוספים את הנתונים בעזרת "תוכנות שיטוט ואיסוף"' , תוכנות יעודיות אלו ידועות בספרות המקצועית  לעתים גם  בשם  ( Crawlers ) הסורקות את אתרי האינטרנט ועוברות מדף לדף ומאתר לאתר (דרך הקישורים).

הן יוצרות קובץ גדול מאוד של מאות מיליוני דפים שעברו אינדוקס אוטמאטי ע"י תוכנה.  הקובץ עליו נעשה החיפוש כולל כל מילה ש"תוכנות השיטוט" איתרו.  ניתן לחפש במנועים אלה בצורה ישירה  מילים או ביטויים במאות מיליוני דפים. דוגמאות של מנועים אוטומטיים: BING ,YAHOO  ,Google.

אף לא אחד ממנועי החיפוש  מכסה את כל האינטרנט (מעל 40 מיליארד דפים),מנועי החיפוש האוטמטיים  הגדולים שבהם  (כגון גוגל ) מכסים רק  50 אחוזים מהדפים. למרבית מנועי החיפוש האוטומטיים יש הסכם עם אינדקסים גדולים ובמקרה שלא מוצאים בהם את המידע הרצוי הם מפנים לאינדקס עמו הם קשורים.

 

ב. אינדקסים

כלי עזר למיפוי מידע /ארגון מידע הכוללים מידע שיטתי  שנאסף על ידי אנשים או מידענים שמקטלגים  באופן ידני את האתרים תחת "עץ קטגוריות"  ומספקים תיאור קצר  או איפיון קצר לכל אתר שנוסף לעץ הקטגוריות ( או "עץ-הנושאים" ).

אינדקס הוא רשימה של קטגוריות ונועד להציע לגולש חיפוש מונחה ברשת האינטרנט.

דף האינדקס בנוי בצורת עץ נושאים, המכיל תחילה קטגוריות כלליות ואח"כ קטגוריות משנה.אתרי אינדקס ניתן למצוא בעמוד הפורטלים.

באינדקסים של אתרים מתחלק התהליך לשניים:  איסוף ותצוגה.

תהליך האיסוף מתבצע על ידי אנשים שתפקידם למצוא אתרים חדשים, לכתוב עליהם תיאור קצר ולסווג אותם במבנה היררכי.

באינדקסים של אתרים אפשר גם לבצע חיפוש לפי מילות חיפוש , אך צריך לזכור שהחיפוש מתבצע על שמות הקטגוריות, האתרים או התיאור שלהם ולא על התכנים בתוך האתר.

דוגמאות מעודכנות של אינדקסים , נובמבר 2014

 דוגמא לאינדקס בעברית של מקורות מידע על מלחמת העצמאות

דוגמא לאינדקס של כלים מתוקשבים לניהול תוכן וניהול מידע (content curation  )

אינדקס נושאי ויזאולי לתחום אוצרות תוכן ואוצרות דיגיטאלית ( סינון , מיון וארגון מקורות מידע)

דוגמא לאינדקס על טיולים באזור טוסקנה , איטליה

דוגמא לאינדקס על טיולים ותיור בויטנאם

אינדקס אתרים לילדים ( ישראל)

האינדקס משמש מעין מפת התמצאות מהירה , כאשר רואים את כל תמונת האתרים ביריעה אחת , כאשר החלוקה היא לנושאי משנה ( קטגוריות)

"מתי/למה אינדקס"?

  • השימוש בהיררכיות לארגון מידע מקל על מציאתו אחר כך.

  • המידע המופיע על האתרים הוא מידע מסודר שנכתב על ידי אנשים.

  • מתואר בו תוכן האתר, מבנהו , וניתן גם להשוותו לאתרים אחרים על פי קריטריונים כמו: רייטינג, ציון וכו'.

keyword in green  2012

הליכים בבניית אינדקס מקצועי

באינדקס אתרים  קיים קטלוג קישורים אל אתרי אינטרנט הממויין על-פי עץ נושאים היררכי. הכנסת אתר חדש לקטלוג מבוצעת בעקבות הצעת האתר על ידי אחד ממשתמשי האינדקס.

בעת הרישום מגיש מציע האתר את שם האתר ותיאור קצר של תוכנו. בשלב הבא האתר נסקר על ידי אחד מעורכי האינדקס, ובמידה והוא נמצא ראוי להופיע, הוא יתווסף לאינדקס האתרים.

המידע המופיע באינדקס לגבי האתר הוא שילוב של המידע אותו הגיש מציע האתר, עם שינויים אותם ביצע העורך.  אינדקס אתרים מסוג זה יהיה מבוסס על עריכה אנושית, וידרוש משאבים רבים על מנת לשמור על עדכניות המידע. דוגמא לאינדקס מסוג זה היא אינדקס דמוז (dmoz.org).

הדוגמא המוכרת ביותר של אינדקס הוא ה – Yahoo אשר מכסה כ 5  מיליון אתרים. קיימים עוד אינדקסים בגודל דומה ( לדוגמא: ׂhttp://dmoz.org,)   ואלפי אינדקסים קטנים המתמחים בנושאים ספציפיים. במקרים רבים האינדקסים הספציפיים הם יותר מקצועיים וממוקדים בתחום אותו הם מכסים וכדאי להקדיש זמן לאיתור אינדקס טוב בתחום בו מתעניינים או חוקרים.

קישור ישיר לDMOZ

אינדקס DMOZ  , עברית ( עדיין בשלבים ראשונים , אבל אפשר להשתמש) .

DMOZ

הנה לדוגמא, האינדקס של DMOZ העוסק בנושאי בריאות

הנה לדוגמא , האינדקס של מDMOZ  המוקדש לתולדות האמנות

ניתן ישירות מתוך האינדקס להריץ חיפוש  באותו נושא באחד ממנועי החיפוש העיקריים

לדוגמא :

"Art History" search on: AOLAskBingBlekkoDuckDuckGoGigablastGoogleixquickYahooYandexYipp

 

מטלה מס' 1

התנסות קצרה באינדקס DMOZ

עליכם לבחור נושא כלשהו באינדקס הממויין של DMOZ ולשוטט שם .

אפשר גם מתוך האינדקס בעברית .

עוד על האינדקס של DMOZ

 שייך  למעשה לארגון ממפתחים ידני בשם  DMOZ .ORG

http://dmoz.org

זהו , למעשה, ארגון אינדקסים המתחרה ליאהו ועתה הוא המוביל באינטרנט . הוא מבוסס על עבודת מתנדבים בלבד . לכן , יש לעתים שהכיסוי שלו טוב ויש לעתים שהכיסוי  שטחי .

עכשיו גשו לאינדקס והתרשמו מצורתו וממתכונת הסיווג שלו :  http://dmoz.org

חיפוש מתקדם באינדקס  DEMOZ

חיפוש מתקדם בDmoz

ראו צילום מסך של חיפוש מתקדם בdmoz

DMOZ ADvanced

במנגנון חיפוש מתקדם של DMOZ אפשר למקד את החיפוש בקטגוריה ( categories only ) של נושא מסויים כגון  REFERENCE , חינוך  או בריאות .

חיפוש מתקדם באינדקס  DEMOZ

keyword in green  2012

האינדקס המפואר שירד מגדולתו : YAHOO 

האינדקס של יאהו היה בזמנו החשוב בעולם  זהו ה-DIRECTORY  של יאהו YAHOO  הנמצא בכתובת הבאה :

http://dir.yahoo.com

קישור

חיפוש מתקדם באינדקס של  YAHOO

הקטגוריה של אתרי חינוך ( באנגלית) באינדקס יאהו

לצערנו  הרב , ביולי 2014 הודיעה חברת יאהו כי היא מפסיקה לעדכנו .

אינדקסים עיקריים בישראל

א. אינדקס נענע

מפעל של צוות אנשי המידע המסורים באתר נענע העובד כבר למעלה מ10 שנים על סיווג ידני והיררכי של האתרים הישראליים העיקריים .

ב. פרוייקט ת.א.ר

"מטרתו של פרוייקט ת.א.ר – תו איכות רשת הוא להביא את תשומת לב הגולשים לאתרים איכותיים.
היות ואין ב"עולם האינטרנט הישראלי" תקן או אתר המצביע על אתרים איכותיים, לקחנו על עצמינו להצביע על אתרים אלו.
לא מדובר בהכרח באתרים יוצאי דופן בעיצובם או בתכניהם, אלא באתרים המציגים את התכנים אותם הם התיימרים להציג, בצורה טובה וברורה".

דוגמא לאינדקס שלהם בנושאי בריאות ורפואה

research1

דגמים מומלצים של אינדקסים בישראל

האינדקס הממוין הישראלי של נענע 10

  האינדקס של YNET

 קישור ישיר לאינדקס של YNET

אינדקס אתרי יהדות :: בבא קמא

 דוגמא לאינדקס צמחי מרפא

אינדקס צמחי הבריאות של ברא

אינדקס אחזקה ובטיחות תעשייה בישראל – דוגמא לאינדקס נגלל

אינדקס משולב עם מסד נתונים פרמטרי ( חיפוש עפ"י סיווגים) , אינדקס מטפים פסיכולוגים בישראל

מטלה מס' 2

עליכם לבחור נושא כלשהו באינדקס של YNET ולשוטט בו

סיכום  השיעור

מנוע חיפוש יוצר אינדקסים אוטומטיים לכל מילה בטקסט ובכותר ללא שיקול דעת , ואילו אינדקס מבוסס על סינון ומיון של אנשים. כלומר מידענים הם אלו שבוחרים באופן מבוקר וידני את האתרים שיופיעו באינדקס ויוצגו בפניכם.

האינדקס ממקד את החיפוש לאתרים הרלבנטיים בלבד . תמיד נקבל מידע רלבנטי ומדויק כאשר נחפש באינדקס  המבוקר.

לעומת זאת במנוע חיפוש אוטומאטי כגון GOOGLE  רק חלק מהמידע ( בסביבות 20 אחוזים) רלבנטי וממוקד.

מערך שיעור, המיועד לקורס מידענות בלמידה מרחוק,  נכתב ע"י עמי סלנט, עודכן בנובמבר 2014

· · ·

תגובות

כתוב תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *