שמישות מנקודת מבט מידענית: כמה נקודות מבט

1008

 

מאת: עמי סלנט

סקירה זו נכתבה על יסוד הניסיון שצברתי כמידען במכוני מחקר , בארגוני עתירי ידע ובחברות טכנולוגיות.

המשולש הנצחי של עבודת המידענות

בעיקרון,  שלושת הנדבכים של עבודת המידען הם :

  • איסוף מידע
  • עיבוד מידע
  • והפצת מידע .

לא כל המידענים נדרשים להתמודד עם שלושת מרכיבים אלו , אבל מידענים שעובדים במכוני מחקר , בארגונים עתירי ידע ובהייטק נדרשים להתמודד כל הזמן בכל שלושת המישרים , לדוגמא : לאסוף מידע אחרי כיווני פיתוח חדשים או התפתחויות טכנולוגיות , לקרוא את החומרים ולתקצר אותם , להעלות את הסיכומים לאתר אינטרנט או מאגר מידע פנימי , ולעתים גם להפיץ את הממצאים בניוזלטר שבועי או חודשי.

ככל שעומס המידע הדיגיטלי הולך וגובר נודעת חשיבות למושג החדש הנקרא שמישות מידענית (Informatics Usability).

שמישות נמדדת ביחס למטרות ספציפיות, ולא באופן עצמאי, בלתי-תלוי.

השמישות מנקודת מבט המידען היא האפקטיביות שלו בעבודה נוכח אתרי איטרנט ונוכח מאגרי מידע מקוונים . עד כמה המאגר מבצע בצורה טובה את מה שהוא אמור לעשות? עד כמה תהליך האיסוף מבצע את המטרות שלשמן הוא מופעל.

שלושת הנדבכים של שמישות מידענית

השמישות (usability) בתחומי המידענות באה לידי ביטוי בשלושה מישורים עיקריים :

א. יכולות  איסוף : כמה קל לאתר פריטי מידע חדשים באתר?

ב. שמישות של מנוע החיפוש והיכולות הפרמטריות שלו (האם מנוע החיפוש מאפשר גיבוש  והפעלת אסטרטגיית חיפוש מורכבת? )

ג. השמישות הטקסונומית : הפריטים באתר מאורגנים בצורה טקסנומית (קטגוריות ומבנה היררכי בתוך הקטגוריות) .

 סוגיית האיסוף

מנוע החיפוש כגון גוגל מסייע לנו רבות באיחזור מידע , אבל פעולת איסוף מחייבת מתודלוגיה שיטתית יותר . יש צורך להכין רשימת איסוף של אתרים ולעקוב אחריהם כל יום. ניתן להכין רשימה כזו באמצעות קורא RSS שמדווחים על מאמרים חדשים באתר או בבלוג .

RSS (פידים) זוהי טכנולוגיה המשתמשת בפורמט XML המשמש לפרסם תוכן מעודכן בתדירות גבוהה מהאינטרנט. ה-RSS מכיל רק את הכותרות, גוף הטקסט והתמונות של הכתבה.

היתרון של RSS (פידים) הוא איסוף של אתרי האינטרנט המועדפים עליך, ממקורות מרובים, במקום אחד. העדכונים מגיעים מבלוגים, אתרי חדשות ובכלל כל אתר התומך ב- RSS
את תוכן ה- RSS ניתן לקרוא באמצעות תוכנות "קורא RSS" (קורא פידים), אשר נמצאות ב"ענן" על רשת האינטרנט וניתן לצפות בעידכונים דרך הדפדפן. אפשרות אחרת היא להשתמש בתוכנות יעודיות במחשב שלך.

הנה קישור למאמר שכתבתי בזמנו על קוראי RSS

אני לדוגמא , משתמש בקורא RSS בענן הנקרא The Old Reader והוא מדווח על מאמרים , מחקרים וסקירות חדשות . הבעייה כאן מבחינת שמישות מידענית היא לא האפקטיביות אלא טווח הכיסוי . אני מקבל עדכוני RSS  בעיקר של בלוגים או מחקרים בתחומי החינוך , אבל מרבית אתרי התוכן והחדשות בארץ (וגם בעולם ) אינם בנויים לעדכוני RSS . כלומר , אני צריך להרכיב רשימת איסוף  שיטתית ולעקוב אחרי מידע חדש באתרים אלו .

איסוף באמצעות רשימת מעקב :  הקושי במעקב אחר פריטי תוכן חדשים באתרי אינטרנט

 הקושי מבחינה מידענית הולך ונעשה מורכב למדי כי מרבית אתרי התוכן נראים מעניינים אך הם לא מאורגנים היטב מבחינה טקסנומית וקשה לעקוב אחרי מאמרים או מידע חדש באתר .

אחד האתרים הבודדים בארץ שעונה על דרישות השמישות המידענית הוא אתר גלובס שמציג בראש האתר רשימה מתעדכנת של הדיווחים החדשים . הנה צילום מסך של  אתר גלובס :

גם לאתר החדשות של NBC בארה"ב יש באתר האינטרנט שלו (בעמודה מצד ימין) רשימת דיווחים של המאמרים החדשים ועדכוני החדשות (קישור) .

 לסיכום הנדבך של איסוף מידע ניתן לומר כי מערכת האיסוף מסוג RSS פותרת רק כ40 אחוז של בעיית האיסוף ועבודת האיסוף באמצעות רשימת מעקב סובלת מבעיית שמישות נמוכה של אתרי אינטרנט בארץ ובעולם.  מרבית אתרי התוכן נועדו לייצור עניין ומשיכת  גולשים. שאלת הבניית המידע היא שולית עבורם .

שמישות של מנועי החיפוש

המידען בניגוד למשתמשים מושכלים רגילים חייב להיות הרבה יותר אפקטיבי בתהליך דליית המידע ולנסות לדלות מידע יעיל באופן שעונה על שאלת החיפוש . המידען נדרש להבניית מידע יותר גבוהה בחיפוש ומנוע חיפוש כגון גוגל הוא רק אחד האמצעים.

המידען תמיד ינסה לאתר את מנגנון החיפוש המתקדם באתר או במאגר המידע המקוון . מנוע חיפוש מתקדם מאפשר חיפוש עפ"י שדות או פרמטרים או על פי תאריכים.

המידענים מצפים למצוא מנוע חיפוש מתקדם כפי שהם רגילים במאגרי המידע המקוונים אך רק באתרי תוכן בודדים בארץ ובעולם יש מנגנון של חיפוש מתקדם .  

דוגמא  בודדת למנוע חיפוש שיטתי באתר תוכן ניתן לראות בפורטל הגורם האנושי (קישור) .

בכל מאגרי המידע המקוונים המקצועיים כגון PROQUEST  או EBSCOb  יש מנגנון חיפוש מתקדם על פי שדות .

הנה כמה דוגמאות : 

גם באתרי הספריות האקדמיות בישראל יש מנגנון של חיפוש מתקדם עפ"י שדות , פרמטרים , סוגי פרסום ,ותאריכים .

הנה כמה דוגמאות :

במערכת הגילוי של PRIMO ניתן לא רק לחפש ע"י מנגנון של שדות אלא לסנן  מראש את המידע על פי סוגי המאגרים כגון : אוסף הספרייה ,  מאמרים מדעיים, חיפוש משולב

מבחינתי כמידען יש למאגר המידע המקצועי של  PROQUEST CENTRAL  את  שמישות המידע הגבוהה ביותר כי לצד חיפוש מובנה עפ"י שדות ופרממטרים הוא מציע בו-זמנית חיפוש שיטתי גם על פי  4 תיזראוסים אפשריים

Proquest Central

Thesaurus List

ERIC Thesaurus

MeSH 2019 Thesaurus

ProQuest Thesaurus

Sociological Thesaurus

ומה עם ספריות דיגיטליות ?

סוגיה אחרת של  שמישות מידע בפרק זה נוגעת לאפקטיביות החיפוש בספריות דיגיטליות הכוללות בעיקר מיליוני מסמכי טקסט חופשיים המאוחסנים דיגיטלית בספרייה (full text)

במרבית הספריות דיגיטליות  שמישות החיפוש היא נמוכה , כלומר  מקבלים הרבה "רעש" ( מסמכים לא רלוונטים)  בתוצאות החיפוש . באף לא אחת מספריות  הדיגיטליות יש אינדקס והבניית המידע על פי שדות . יש ספריות דיגיטליות כגון ספריית "כותר" של מט"ח שפיתחו מנגנון של איחזור מידע הקשרי , כלומר ניתן לראות את מילת החיפוש בהקשר של הקטע הרלבנט בטקסט או במיקום של תוכן העניינים . הנה לדוגמא , צילום מסך של החיפוש ההקשרי בספריית "כותר" :

מנוע החיפוש המתקדם של גוגל

יש מידענים המנסים להתמודד באופן אפקטיבי באמצעות מנוע החיפוש המתקדם של גוגל על מנת לקבל תוצאות גבוהות ומדוייקות יותר בחיפוש .

גוגל פיתחו טופס תבנית לחיפוש מתקדם וניתן למצוא אותה כאן בקישור . מנגנון החיפוש  המתקדם מאפשר סינון עפ"י תאריכים , סינון עפ"י מילים בכותרת/TITLE וסינון עפ"י תאריכים וסוגי קבצים .  אנחנו משתמשים במנוע החיפוש המתקדם של גוגל על מנת להתגבר על השמישות המידענית הנמוכה של רשתות חברתיות כגון פייסבוק שם החיפוש גרוע במיוחד. כלומר , מציבים בשדה אתר או דומיין את הכתובת של פייסבוק.

ראו גם :

יעילות מנועי החיפוש הפנימיים באתרי העיתונים הישראליים ואתרי החדשות

סוגיית השמישות הטקסונומית

חלק מבעיית עומס המידע הדיגיטלי נובעת מכך שאתרי התוכן בארץ ובעולם אינם עקביים ביחס להבניית המידע עפ"י קטגוריות/ נושאים ובוודאי לא נושאי משנה . המידען שהתחנך משחר הכשרתו האקדמית לשיטה וארגון שיטתי של מידע  מתמודד כתוצאה מכך עם שמישות מידענית נמוכה העשוייה לפגוע באפקטיביות שלו גם באיסוף המידע וגם באיחזור המידע .

אתרי התוכן בארץ אינן עקביים בסיווג המאמרים והחומרים לקטגוריות ואפילו אתרי התוכן המכובדים מקבוצת "הארץ" אינם עקביים בכך ואתרי הממשלה נמצאים בסוף הרשימה מבחינה עקביות טקסנומית.

אתר YNET הוא אחד הבודדים השומר על מבנה טקסונומי ברור ויכול להיות שזו אחת הסיבות להצלחתו . בכל קטגוריה ראשית יש סיווג  ברור לנושאי משנה, הנה לדוגמא צילום מסך :

בכל אתר אינטרנט העקרון המנחה צריך להיות תיוג כל פריט מידע לקטגוריה קבועה ואם אפשר לקטגוריית משנה , כך שהמחפש או המידען יוכלו לנווט בקלות בתוך הררי התוכן באתר.  לא פחות חשוב הוא העקביות במבנה היררכי , כלומר להיצמד לאורך כל השנים לאותה רשימת קטגוריות ראשית ומשנית .

הנה דוגמא מתוך אתר התוכן פורטל הגורם האנושי :

על אף המצב העגום של אתרי תוכן בארץ  מבחינת המבנה הטקסונומי בשנה האחרונה כבר מתחילים לראות שיפור בעקבות רה-הארגון של אתר הלשכה המרכזית לסטטיסטיקה ( למ"ס) .

באתר הישן של הלמ"ס היו 10 רשימות נושאים ובאתר החדש מיינו ומיפו לרשימת נושאים אחת שכוללת 28 נושאים ראשיים, מתחתם כ300  נושאי משנהכאשר צמצמו למינימום.
קודם לכן  היה האתר היה מאורגן לפי המבנה הארגוני והיום לפי צרכי המשתמש.
לאחר שישבו עם צרכני מידע, הבינו ששיטות החיפוש הן שונות והציפו את מימדי החיפוש בדף הבית. הם הבינו שאנשים מחפשים לפי נושא, סוג מידע, אזור גיאוגרפי או לפי סקר.

הם עבדו על האתר החדש במשך 6 שנים וארגנו מחדש את כל הנושאים והשיטה לריכוז מידע סטטיסטי . הם ערכן מיפוי תוכן וארגנו מחדש את הנושאים העיקריים על פי צרכי המשתמשים ולא על פי צרכי המדורים השונים בלמ"ס כפי שהיה באתר הישן.

הם יצרו תבנית אחידה לכל הנושאים והכניסו את התוכן הישן עפ"י התבנית המאוחדת החדשה באתר החדש

בדקתי את האתר החדש של הלמ"ס במשך יומיים והוא אכן יעיל יותר מהאתר הקודם . הם הוסיפו גם מנוע חיפוש משופר אשר מאפשר גם לסנן מידע עפ"י נושאים ועפ"י סוגי פרסומים וסוגי פריטים . ניתן גם לייצור סינון בחיפוש עפ"י תאריכים.

קישור לאתר החדש של הלמ"ס

 

 סיכום

בסקירה זו נבחן המושג שמישות מידענית ביחס לשלושה מישורי פעולה בעבודת המידען : איסוף מידע , דליית מידע במנועי חיפוש ומבנה התוכן באתרי תוכן .

נמצא כי המידען חצוי כיום בין השיטתיות של מאגרי המידע המקוונים ומערכות הגילוי בספריות האקדמיות לבין אתרי התוכן בארץ ובעולם הסובלים מאפקטיביות נמוכה של שמישות מידענית.

הואיל ולא כל המידע הדיגיטלי נמצא במאגרי מידע מקצועיים , הרי המידען נאלץ להשקיע לא מעט מאמצים בהתמודדות עם עולם התוכן הלא-מובנה.

מקורות

עמי סלנט , כלים להתעדכנות מקצועית : RSS למתחילים וגם למתקדמים, ידע וסקרנות דיגיטלית , 2015

עמי סלנט , יסודות באיסוף מידע בענף המידענות : אגרגטורים ותפקידם, ידע וסקרנות דיגיטלית , 2016

usability – Apply advanced filters for search content – User 

 Best Practices for Search | UX Boot

 11 Tips for Advanced Search Usability – Get Elastic

 How To Improve Advanced Search UX? – UX Design World

 

· · ·

תגובות

  • מעניין מאוד.
    למרות שלדעתי האתגר הגדול ביותר הוא לייצר בעצמך DB שישרת אותך ועליו לבצע חיתוכים.

    אמיר 6 ביולי 2019 4:26

כתוב תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *