בחיפוש אחר צוותים מגוונים ומקושרים: גישה חישובית להרכבת צוותים מגוונים על בסיס חברים חלק 5
Jan 25, 2024
שלב מיון מהיר שאינו נשלט. לאחר מכן, האלגוריתם חייב לבחור את הכרומוזומים r הטובים ביותר מהאיחוד הזה בגודל 2r. כדי למצוא את הסט הזה, האלגוריתם מבצע מיון לא נשלט בין כל הכרומוזומים הקיימים מ-P.
מיון דומיננטיות הוא טכניקת זיכרון נפוצה שעוזרת לנו לזכור ולהבין דברים טוב יותר. הוא יוצר בעיקר קשרים לוגיים בין ידע על ידי סיווג, מיון וסיכום מידע קשור, מה שמקל עלינו להבין ולזכור את הידע הזה.
השלבים של שליטה במיון כוללים בעיקר סיווג, מיון, אינדוקציה וסיכום. בשלב הסיווג צריך לסווג מידע רלוונטי ולחלק אותו לקטגוריות שונות; בשלב המיון, עלינו לקבוע את הרמה והחשיבות של כל קטגוריה כך שניתן יהיה לסדר אותה בסדר מסוים; בשלב האינדוקציה, יש צורך לשלב ולחלץ את הקשרים בין קטגוריות שונות כדי להבין ולזכור טוב יותר את הידע הזה; בשלב הסיכום, עלינו לסקור ולהרהר בכל תהליך מיון הדומיננטיות כדי לגלות ולתקן את החסרונות שלנו.
מיון הדומיננטיות קשור קשר הדוק לזיכרון. זה יכול לעזור לנו לארגן ולמיין ידע טוב יותר, ובכך לשפר את יעילות הזיכרון. באמצעות שליטה ומיון, אנו יכולים לשלב ולסדר מידע מגוון באופן שיטתי, ולבסס היררכיות ואסוציאציות של ידע, ובכך ליצור רשת זיכרון, מה שהופך את הזיכרונות שלנו לחזקים ומעמיקים יותר. יחד עם זאת, מיון הדומיננטיות יכול גם לעזור לנו לחקור טוב יותר את הערך והיישום של הידע, ובכך לשפר את החשיבה ויכולות פתרון הבעיות שלנו.
בקיצור, מיון דומיננטיות הוא טכניקת זיכרון מעשית מאוד שיכולה לעזור לנו להבין טוב יותר ולזכור ידע שונים. באמצעות תרגול ויישום מתמשכים, אנו יכולים להיות מיומנים יותר בשליטה במיומנות זו, ובכך להניח בסיס איתן ללמידה ולהתפתחות שלנו. ניתן לראות שאנו צריכים לשפר את הזיכרון, ו-Cistanche deserticola יכול לשפר משמעותית את הזיכרון מכיוון ש-Cistanche deserticola הוא חומר רפואי סיני מסורתי בעל השפעות ייחודיות רבות, אחת מהן היא שיפור הזיכרון. היעילות של בשר טחון מגיעה מהמרכיבים הפעילים השונים שהוא מכיל, לרבות חומצה, פוליסכרידים, פלבנואידים ועוד. מרכיבים אלו יכולים לקדם את בריאות המוח בדרכים שונות.

לחץ על דע זיכרון לטווח קצר כיצד לשפר
המטרה היא לזהות פתרונות בעלי ביצועים טובים יותר מאחרים ולסווג אותם לפי ביצועיהם בחזיתות פארטו שונות F. האלגוריתם בודק תחילה את יחסי הדומיננטיות בין כל הכרומוזומים. נתון שני כרומוזומים, T ו-T{{0}}, T שולט ב-T0 אם ורק אם Cc(T)�Cc(T0) ו-V(T)�V( T0) עם אי שוויון קפדני אחד לפחות.
במילים אחרות, T טוב לפחות כמו T{{0}} עבור כל היעדים ולכל הפחות טוב יותר עבור אחד לפחות. יחס דומיננטי זה מסומן כ-T � T0. אם אחת מהמטרות של T אינה טובה יותר מ-T0 ולא ניתן לשפר אותה בערכה מבלי לגרוע חלק מהערכים האובייקטיביים האחרים, אז T אינו נשלט על ידי T0
דוגמה אחת לפתרון שאינו דומיננטי היא T בעל ציוני גיוון גבוהים יותר אך עלויות תקשורת גבוהות יותר מאשר T0. במקרה זה שאינו דומיננטי, או T ו-T0 הם פתרונות אפשריים עבור הדור הבא.
ברגע שהאלגוריתם ממפה את כל יחסי הדומיננטיות של הכרומוזומים, הוא יוצר חזית פארטו ראשונה של פתרונות המורכבים מכל הפתרונות הלא-נשלטים (F1). סט זה נקרא גם כפארטו אופטימלי.
לאחר מכן, האלגוריתם יוצר חזית שנייה של פתרונות Pareto אופטימליים (F2) שהתעלמו מהם בחזית הראשונה, וכן הלאה. כתוצאה מכך, האלגוריתם ממיין את הכרומוזומים של האוכלוסייה להיררכיה של תת-אוכלוסיות. המיון ממשיך למצוא חזיתות פארטו עוקבות עד שכל הכרומוזומים מוקצים לחזית פארטו.
אוכלוסיה חדשה. לאחר מכן האלגוריתם בוחר את כרומוזומי r הטובים ביותר עבור הדור הבא. בזמן נתון, ישנם כרומוזומים 2 ממוינים בחזית Pareto ההיררכית F. האלגוריתם יוצר את האוכלוסייה החדשה P0מוסיף את הכרומוזומים המאוחסנים בחזיתות Pareto.
אם הגודל הכולל של חזית פארטו הראשונה קטן מ-r, אז האלגוריתם מוסיף את כל הכרומוזומים של חזית זו ל-P{{0}}. לאחר מכן, האלגוריתם מוסיף את הפתרונות הנותרים עבור האוכלוסייה החדשה מהחזיתות הלא-נשלטות הבאות. האלגוריתם ממשיך בהליך זה עד שאינו יכול להוסיף חזיתות נוספות ל-P0.
מרחק צפיפות. האלגוריתם חייב להוסיף כרומוזומים לאוכלוסיה החדשה עד שיהיו כרומוזומים r בדיוק. אם לחזית Pareto שנבחרה הלא-נשלטת האחרונה Fk יש יותר כרומוזומים מהמותר להוסיף ל-P0, האלגוריתם חייב לבחור קבוצה קטנה יותר מ-Fk כדי להשלים את הכרומוזומים r.
תן d ¼ r SizeðPÞ, מספר הכרומוזומים החסרים כדי להשלים את r. האלגוריתם מזהה את כרומוזומי δ הטובים ביותר מהחזית האחרונה Fk על ידי חישוב מרחק הצפיפות בין הכרומוזומים.

מדד זה קובע עד כמה הכרומוזומים דומים מבחינת ביצועים בבעיה רב-אובייקטיבית. לאחר חישוב המרחק הזה, האלגוריתם מדרג את הכרומוזומים לפי המרחקים שלהם ומבטל כרומוזומים שפועלים באופן דומה לכרומוזומים אחרים. הליך זה שומר על חזית פתרונות בחו"ל ומסיר כרומוזומים מיותרים.
לאחר מכן, δ הכרומוזומים הטובים ביותר מ-Fk מתווספים ל-P{{0}}. כתוצאה מכך, P0 סופר עם הכרומוזומים הטובים ביותר והופך להורה של הדור הבא, ומתחיל איטרציה חדשה.

נתונים
בחלק זה, אנו מעריכים את האלגוריתם המוצע לבעיית גיבוש הצוות שלנו באמצעות שלושה מערכי נתונים מהעולם האמיתי. מקורות הנתונים הם MyDreamTeam (פלטפורמה לגיבוש צוות), Bibsonomy (אתר סימניות חברתיות) ו-GHTorrent (בסיס נתונים של מאגר GitHub).
שימוש במערכי נתונים אלה כדי לדמות צוותים לבעיית גיבוש צוות זו ממחיש את יעילות המסגרת שלנו בתרחישים אמיתיים. אנו מציגים נתונים סטטיסטיים מסכם ממערכי נתונים אלה בטבלה 2. הנתונים המתקבלים והתסריטים לעיבוד מוקדם של הנתונים הגולמיים זמינים בכתובתhttp://nusoniclab.github.io/.

מערך הנתונים של MyDreamTeam. אנו מעריכים את האלגוריתם המוצע שלנו באמצעות נתונים ממקרים אמיתיים של גיבוש צוות. חילפנו את מערך הנתונים הזה מ-My Dream Team Builder [33], מערכת ממליצים כדי לעזור לאנשים להרכיב צוותים בעצמם.
מערך נתונים זה מכיל מקרים של משתתפים בהרכבה עצמית של הצוותים שלהם. מקרים מתוארכים ל-2014 עד 2020. במערכת ממליצים זו, המשתתפים יוצרים פרופילים, מחפשים חברים לצוות ושולחים הזמנות ליצירת צוותים.
המקרים מורכבים משיעורים מאוניברסיטאות בארצות הברית. מערך הנתונים כולל תכונות, נתונים דמוגרפיים ורשתות חברתיות של המשתתפים, עליהם דיווחו בסקר ראשוני. בחרנו שלושה מקרים לבדיקת האלגוריתם שלנו: קורס לתואר ראשון, קורס לתואר שני וקורס anMBA. המשתתפים השתמשו במערכת כדי להרכיב צוותים לדיונים בקבוצות קטנות.
ההרשאה לאסוף נתונים מהמשתתפים אושרה על ידי Northwestern University Institutional Review Board (#STU00078513). כל התקנות המוסדיות והממשלתיות החלות הנוגעות לשימוש אתי בנבדקים אנושיים בוצעו במהלך מחקר זה.
הסכמה אלקטרונית התקבלה ממשתתפי המחקר באמצעות מכשיר סקר מקוון. המשתתפים התבקשו להסכים להשתמש בנתונים שנאספו באמצעות My Dream Team Builder למטרות מחקר. גיבשנו את מזהי המשתמשים כדי ליצור מערך נתונים לא מזוהה.
BibSonomy. מערך הנתונים השני מופק מ-BibSonomy [34], מערכת סימניות חברתית ושיתוף פרסומים. בחרנו ב-bibsonomy מכיוון שמסמכים קודמים של גיבוש צוות בדקו את האלגוריתמים שלהם באמצעות מסד נתונים זה [58].

מערך נתונים זה מנוהל על ידי קבוצת Knowledgeand Data Engineering, אוניברסיטת קאסל. מערך הנתונים של bibsonomy זמין במסגרת הסכם רישיון, וניתן לבקש אותו בכתובת https://www.kde.cs.uni-kassel.de/wp-content/uploads/bibsonomy/. מערך נתונים זה מכיל מספר רב של פרסומים הקשורים למדעי המחשב. כל פרסום נכתב על ידי קבוצת מחברים.
משתמשים רבים מבקרים באתר Bibsonomy באמצעות תגיות להוספת הערות לפרסומים. בעקבות ההליך המתואר על ידי Anagnostopoulos et al. [58], השתמשנו בתגים הקשורים למאמרים של כל מחבר כדי לייצג את כישוריו. המיומנות של כל מחבר מייצגת את מספר המאמרים שפורסמו עם התג המתאים לו. בחרנו שלושה כתבי עת הקשורים לניתוח רשתות חברתיות כדי לבדוק את האלגוריתם שלנו: "טבע", "מדע" ו"פיזיקה א': מכניקה סטטיסטית ויישומיה".
ספרנו את תדירות התגים בכל אחד מכתבי העת הללו ובחרנו כמה תגים פופולריים הקשורים למחקר שלנו. עבור שני כתבי העת הראשונים, בחרנו מאמרים שכללו את התגים 'רשת', 'רשת חברתית' ו'עולם קטן'.
לאחר מכן, זיהינו את מחברי המאמרים הללו, יצרנו את רשת המחברים המשותפת ובחרנו מחברים מהמרכיב הגדול ביותר. באופן דומה, עשינו את ההליך הזה עבור היומן השלישי באמצעות התגים 'רשת', 'גרף', 'מודל' ו'מערכת'. שטף את שמות המחברים כדי ליצור מערך נתונים לא מזוהה.
GHtorrent. השתמשנו בנתוני GitHub שסופקו על ידי פרויקט GHTorrent [35], שיקוף לא מקוון של הנתונים המוצעים דרך GitHub API. ניתן להוריד את מערך הנתונים הזה בכתובת https://ghtorrent.org/downloads.html. מערך הנתונים של GHTorrent מכסה מגוון רחב של פעילויות פיתוח ב-Github, כולל מאגרים, בקשות משיכה ומשתמשים. הורדנו את קובץ הנתונים dump "06/01/2019" כדי לבנות את מערך הבדיקות שלנו.
סיננו משתמשים שתרמו בין 40 ל-80 פרויקטים כדי לשמור על משתמשים חציוניים בניתוח שלנו. בעקבות גישה דומה למערך הנתונים של BibSonomy, השתמשנו בשפות תכנות הקשורות למאגרים של כל משתמש כדי לייצג את כישורי המשתמשים.
המיומנות של כל משתמש מייצגת את מספר הפרויקטים שתרמו שנכתבו בשפה ספציפית. מכיוון שלמאגרים יכולים להיות קבצים במספר שפות, בחרנו את השפה הנפוצה ביותר של המאגר כשפת המאגר.
בחרנו שלוש מהשפות הפופולריות ביותר במערך הנתונים הזה: Java, Python ו-Ruby. לאחר מכן, זיהינו את המשתמשים במאגרים אלה ויצרנו את רשת שיתוף הפעולה. בדוגמה זו, למשתמשים יש atie אם הם תרמו לאותו מאגר לפחות פעמיים. לבסוף, בחרנו משתמשים מהרכיב הגדול ביותר. גיבשנו את שמות המחברים כדי ליצור מערך נתונים לא מזוהה.
הַעֲרָכָה
אנו משווים את האלגוריתם המוצע לבעיית גיבוש הצוות (המסומנת כ-NSGA-II) אל מול שלוש שיטות אופטימיזציה רב-אובייקטיביות ידועות המשמשות למטרות בנצ'מרק [62, 72]:
שיטת חיפוש מקומי Pareto (PLS). אלגוריתם איטרטיבי זה מתחיל עם קבוצה של פתרונות אקראיים כאוכלוסיה הראשונית וחוקר את השכנים של כל פתרון [73, 74]. האלגוריתם מעדכן את האוכלוסייה בהתבסס על דומיננטיות פארטו: הוא יוסיף שכנים לא נשלטים לאוכלוסיה ויסיר פתרונות קיימים שנשלטים על ידי הפתרונות החדשים שנוספו.
ברגע שהשכונה של פתרון נחקרה במלואה, הפתרון מסומן כנחקר. האלגוריתם חוקר באופן איטרטיבי פתרונות חדשים כשהם מתווספים לאוכלוסיה עד שלא נמצא פתרונות טובים יותר. אחרי שכל הפתרונות נחקרו, ולא ניתן לגלות עוד פתרונות לא נשלטים, האלגוריתם נעצר. יישמנו את הגרסה שהוצעה על ידי זיחיאת ואח'. [72] לבעיות שילוב.
ביישום זה, השכנים של הפתרון הם כל שילובי הצוותים האפשריים מהפתרון עם שני חברים המחליפים צוותים. מכיוון ש-PLS אינו תלוי במספר קבוע של דורות, אנו מפעילים רק איטרציה אחת של אלגוריתם זה כדי להשוות את התוצאות שלו עם השיטות האחרות.

בהינתן n פרטים, ושהאלגוריתם יחקור n2 שכנים של כל פתרון, המורכבות החישובית של יישום זה היא O(n3) בתרחיש הטוב ביותר.
For more information:1950477648nn@gmail.com






