מודל משאבים-רציונלי של עיבוד אנושי של מבנה לשוני רקורסיבי חלק 3
Jan 23, 2024
ניסוי 2: השפעת רמזים סמנטיים
לאחר מכן שכפלנו ניסוי 1 על סט שני של פריטים ובו זמנית בדקנו את ההשפעה החזויה של תאימות סמנטית.
תאימות סמנטית מתייחסת להבנה ושליטה של אנשים בתאימות וביחסי הגומלין בין יחידות שונות בשפה, מילים או סמלים. זיכרון מתייחס ליכולת של אנשים לזכור ולאחסן מידע.
קיים קשר הדוק בין תאימות סמנטית לזיכרון. תאימות סמנטית טובה יכולה לשפר את איכות הזיכרון של אנשים, בעוד שתאימות סמנטית לקויה תפריע להבנת המידע ולהשפעות הזיכרון של אנשים.
ראשית, תאימות סמנטית יכולה לשפר את הרלוונטיות של המידע, ובכך לעזור לאנשים להבין ולזכור מידע טוב יותר. אם יש מתאם ברור בין יחידות שונות, אנשים יכולים להשתמש במתאם זה כדי לבנות קשרים בין מידע וליצור מבנה רשת בין מידע. מבנה רשת זה יכול לשפר את אפקט הזיכרון של מידע ולשפר את יכולת אחסון המידע של אנשים.
שנית, תאימות סמנטית טובה יכולה לשפר את ההבנה של מידע, ולהקל על אנשים לזכור. אם יש קשר תאימות ברור בין מידע, אנשים יכולים להבין בקלות את הקשר בין המידע, ובכך ליצור הבנה וזיכרון של המידע. להיפך, אם קיימת אי התאמה ברורה בין המידע, אנשים ירגישו מבולבלים ומבולבלים ויתקשו להבין ולזכור את המידע.
לבסוף, תאימות סמנטית לקויה יכולה להשפיע לרעה על ביצועי הזיכרון של אנשים. אם יש יותר מדי הבדל בין יחידות שונות, יהיה קשה לאנשים להבין ולזכור את המידע, ובכך לאבד את ערך הזיכרון. לכן, בתהליך הכתיבה וההפצה של מידע, יש לשמור על התאמה סמנטית ככל האפשר כדי לשפר את ההבנה והזיכרון של אנשים.
לסיכום, יש קשר חזק בין תאימות סמנטית לזיכרון. תאימות סמנטית טובה יכולה לשפר את הרלוונטיות וההבנה של המידע, ובכך לשפר את יכולת אחסון המידע ואת אפקט הזיכרון של אנשים. לכן, בחיי היומיום ובעבודה, יש לשמור על התאמה סמנטית ככל האפשר כדי לשפר את ההבנה והזיכרון של המידע. ניתן לראות שאנו צריכים לשפר את הזיכרון, ו-Cistanche deserticola יכול לשפר משמעותית את הזיכרון מכיוון ש-Cistanche deserticola הוא חומר רפואי סיני מסורתי בעל השפעות ייחודיות רבות, אחת מהן היא שיפור הזיכרון. היעילות של בשר טחון מגיעה מהמרכיבים הפעילים השונים שהוא מכיל, לרבות חומצה, פוליסכרידים, פלבנואידים ועוד. מרכיבים אלו יכולים לקדם את בריאות המוח בדרכים שונות.

לחץ על יודע תוספי מזון כדי לשפר את הזיכרון
מעבר לשתי המניפולציות מניסוי 1, בתנאים TWO ו-THREE, שינינו בנוסף את ביטוי הפועל השני עד האחרון: במצב COMPATIBLE, השם הראשון היה נושא סביר (למשל, "עצבן את המטופל"); במצב ה-INCOMPATIBLE, זה לא היה (למשל, "ריפא את המטופל"). במצב COMPATIBLE, גרסאות לא-אמיתיות כגון "הדיווח מאת..." צריכות להיות בעלות הסתברות אפריורית גבוהה יותר, תוך ביצוע חיזוי של הפועל האחרון פחות מדויק. בנינו 42 פריטי גירוי.
איור 3B מציג תחזיות מהמודלים הרציונליים של משאבים ותיאוריות קודמות עבור פריטים אלה. בנוסף להשפעות מניסוי 1, המודל מנבא קושי גבוה יותר במצב ה-COMPATIBLE, במיוחד בתוך THREE. לא תיאוריית הפתעות ולא DLT מנבאות השפעה כלשהי של תאימות.
אספנו נתוני זמן קריאה מ-200 משתתפים, כולל גרסאות תואמות ובלתי תואמות בתנאים TWO ו-THREE. מכל הבחינות האחרות, הניסוי וניתוח הנתונים היו זהים לניסוי 1. זמני הקריאה מוצגים באיור 3B.
תוצאות ניסוי 1 שוכפלו: ראשית, זמני הקריאה היו גבוהים יותר ב-THREE מאשר ב-TWO(=0.29, 95% CrI [0.24, 0.35], P( < 0) < 0.0001; זמני קריאה פנימית השפעה: 337 אלפיות השנייה, 95% CrI [267, 411] אלפיות השנייה).
שנית, הייתה אינטראקציה בין הטיית הטמעה לבין נוכחותו של "זה"-סעיף (= −0.06, 95% CrI [-0.1{ {9}}, −0.024],P( > 0)=0.0007). כמו בניסוי 1, ההשפעה של הטיית הטבעה הייתה חיובית במצב ONE (הבדל בין "עובדה" ל"דיווח": 193 אלפיות השנייה, 95% CrI [37, 357] אלפיות השנייה), ושליליות בין שני התנאים והשלושה (הבדל בין " עובדה" ו"דוח": −105 אלפיות השנייה, 95% CrI [−194, −18] אלפיות השנייה).
שלישית, בהסכמה עם תחזיות המודל, זמני הקריאה היו גבוהים יותר במצב ה-COMPATIBLE מאשר במצב ה-INCOMPATIBLE ({{0}}.083, 95% CrI [0.031, 0.136 ],P( < 0)=0.0014; השפעה בזמני קריאה גולמיים: 96 ms, 95% CrI[36, 156] ms). ראה נספח SI, סעיף S3 לניתוחים נוספים.
שים לב שההשפעות של הטיית הטבעה ותאימות גדולות מספרית בשלושת התנאים מאשר בתנאים TWO; מטה-אנליזה מראה שההבדלים הללו הם בעלי משמעות סטטיסטית הן בזמני הקריאה והן בחלקים ממרחב הפרמטרים של המודל (נספח SI, סעיפים S2.1 ו-S6.6).
הבדלים מספריים בשיפוע הטיית הטמעה בין COMPATIBLE ו-INCOMPATIBLE לא היו בעלי משמעות סטטיסטית (נספח SI, איור S23), וגם הבדלים מספריים ביירט של תחזיות המודל בין שני הניסויים (נספח SI, איור S6).
ראה נספח SI, סעיף S6 לראיות מתכנסות ממחקרי זמן קריאה קודמים (סה"כ n=501). עוד שיחזרנו את ההשפעה של הטמעת הטיה על ההבנה בשני מחקרי דירוג (סה"כ n=335; נספח SI, סעיף S5).
ניסוי 3: מחקר הפקה
עד כה, אישרנו את תחזיות המודל בזמני קריאה. קושי שנמדד בזמני קריאה מצביע על כך שהציפיות של בני אדם מופרות, אך לא מצביע ישירות מהן הציפיות האנושיות.
כדי לספק מבחן שני של ציפיות אנושיות, פנינו לפרדיגמת ייצור - השלמת Cloze (40,41) - ששימשה במחקר שפה כדי להעריך אילו מילים צפויות מיד לאחר ההקדמה. אנו משתמשים בשיטה זו כדי להעריך את המורכבות של מבנים מרובים ולמדוד כמה פעלים אנו מצפים בעקבות הקדמה מורכבת.*
ביקשנו מהמשתתפים להשלים את ההקשרים של הטופס "הדיווח שהרופא שהדיפלומט..." למשפט שלם. ציפינו מהמשתתפים להפיק השלמות דקדוקיות עם שלושה פעלים, כגון "...לא אמון ריפא את המטופל היה מפתיע", או גרסאות לא דקדוקיות עם פחות פעלים, כגון "...לא אמון בו היה מפתיע". משאבים-רציונלי אובדן-הקשר הפתעה מנבאת ששיעור השלמות לא דקדוקיות כאלה צריך להיות נמוך יותר עבור שמות עצם עם הטיית הטבעה גבוהה (למשל, "עובדה"), שכן אלו מקלים על שחזור ההקשר האמיתי מייצוגי זיכרון לא מושלם (איור 4A). המודלים הקיימים מבוססי ציפיות ומבוססי זיכרון אינם מנבאים ששיעור ההשלמות הדקדוקיות תלוי בהטיה הטמעה.

גייסנו 80 משתתפים. איור 4 מציג את שיעור ההשלמות הלא שלמות (פחות משלושה פעלים) כפונקציה של הטיית הטבעה. כפי שנחזה, הייתה השפעה של הטיית הטבעה על שיעור התגובות הלא דקדוקיות (= −0.32, 95% CrI[−0.60, −0.05 ], P( > 0)=0.0123) בניתוח לוגיסטיקה מעורבת של ניסוי-לניסוי.
שכפלנו את המחקר הזה בשתי שפות נוספות (ספרדית וגרמנית), כולל אחת (גרמנית) שבה הקושי של הטמעות מרכזיות חלש משמעותית מאשר באנגלית (42).

בספרדית, התמקדנו בסעיפים יחסיים של נושא (el hechode que el director que, "העובדה שהמנהל מי") כדי להימנע מהסעיפים היחסיים הפחות טבעיים של סובייקט-אובייקט ראשוני, ובו זמנית בודקים הכללה לתצורה תחבירית אחרת. בגרמנית, התמקדנו במבנים משובצים (לדוגמה, Klaus hat erzahlt, ¨dass die Behauptung, dass der Student, den der Professor, "קלאוס אמר שהטענה שהתלמיד שהוא הפרופסור"), מכיוון שהם ידועים כמגבירים את הקושי לרמות הקרובות יותר ל אנגלית (35).
גייסנו 60 משתתפים בכל שפה. בשתי השפות, ההשפעה של קצב ההטמעה הוערכה כשלילית, כאשר גדלי אפקט משוערים דומים לתוצאה האנגלית (ספרדית:=−0.23, 95% CrI [-{{7 }}.34, −0.12], P( > 0)< 0.0003; German: β = −0.28, 95% CrI [−0.56, −0.03], P(β > 0) = 0.01738). These results suggest that the-previously undocumented-effect of embedding bias on human expectations holds across different languages, even when they vary in the overall difficulty of center embeddings.
דִיוּן
הצגנו מודל של עיבוד שפה אנושית כחיזוי משאבים רציונלי, בקנה מידה לקלט שרירותי תוך שימוש בשיטות למידת מכונה עכשוויות. מתוך כוונה ליישב נקודות מבט מבוססות זיכרון וציפיות על עיבוד תחבירי אנושי, המודל לא רק משחזר תחזיות של אותן תיאוריות קדומות שבהן הן נכונות, אלא גם מנבא אינטראקציות שלא תועדו בעבר בין מגבלות זיכרון וציפיות הסתברותיות, אשר אישרנו בשלושה ניסויים התנהגותיים הבודקים עיבוד אנושי של רקורסיביות. מבנים.
התוצאות שלנו מגלות שהקושי המתועד היטב בשילוב תלות לשונית ארוכה, העומד בלב המודלים הקיימים מבוססי זיכרון (5, 7, 36), מאופנן במידה ניכרת על ידי ציפיות הסתברותיות: ההשוואה בין תנאי ה-ONE ל-THREE מראה שכאלה השפעות מקומיות יכולות להיחלש או אפילו להתהפך כאשר למבנה התחבירי הלא-מקומי יש הסתברות אפריורית גבוהה, תחזית שנופלת באופן טבעי מהאיחוד המוצע שלנו של נקודות מבט מבוססות זיכרון וציפיות.
עבודתנו מתעדת עוד שלוש משפחות בולטות של אפקטים מהספרות הפסיכו-לשונית בניסוי יחיד ועם מודל יחיד: השפעות מקומיות (הגדלת הקושי של שלוש), השפעות חיזוי (השפעת הטיית הטבעה במצב ONE), והשפעות הפרעות סמנטיות (השפעת תאימות סמנטית). ).
היה עניין רב בטיפול תיאורטי מאוחד של משפחות ההשפעות הללו; העבודה שלנו מציגה כיצד מודל יחיד יכול לתאר, באופן מפורט, איך הם מקיימים אינטראקציה. קבוצה אחת של תופעות שאינן ממוקדות על ידי הניסויים שלנו היא התערבות מבוססת דמיון (43, 44). חקירה אם אפשר להסביר את זה גם עם מסגרת המודלים הזו היא בעיה מעניינת למחקר עתידי.
מודל המשאבים-רציונלי שלנו קשור רשמית למודלים בתחומים שונים. עבודה קלאסית הראתה שניתוח רציונלי של הסתברויות שימור יכול להסביר את המאפיינים הבסיסיים של הזיכרון האנושי (28, 29). בעבודות אחרונות (45-48) יש מודלים רציונליים של זיכרון עבודה אנושי בתחומים מסוימים, כגון זיכרון עבודה חזותי, תוך שימוש בתיאוריית קצב-עיוות, מסגרת תיאורטית-מידע הנובעת קידודים בעלי נאמנות גבוהה תחת אילוצי משאבים.
ההבדל העיקרי בין תיאוריית הקצב-עיוות למודל שלנו הוא שהמדד של הכלכלה הוא חלקיק המילים הזמינות כאן, בעוד שזה מספר הביטים המקודדים בתורת הקצב-עיוות. מיושם על הבנת משפטים, תיאוריית שיעור-עיוות תוביל לייצוגים "עיקריים" דחוסים לחלוטין של הקשר העבר. ייצוגים דחוסים כאלה אינם מובילים לדפוסי הקושי שנצפו בניסויים שלנו (ראה נספח SI, סעיף S8 לפרטים).
מצד שני, המודל שלנו הוא גם פשט בכך שהוא מדגמן את ההקשר האחרון כרצף של מילים, מה שעשוי לזלזל בתפקיד ייצוגי הזיכרון של ההקשר הארוך יותר שבו אולי נשכחו מילים בודדות אך זיכרון המשמעות נשאר. התקדמות נוספת במכונה למידה עשויה לאפשר להסיק פורמט מתוחכם יותר של ייצוגי זיכרון מתוך אופטימיזציה רציונלית של משאבים.
במדעי המחשב, מבנה רקורסיבי מעובד בדרך כלל באמצעות מבני נתונים מבוססי מחסנית. בהתאם, מודלים מוקדמים של עיבוד תחבירי אנושי הניחו גבולות על גודל המחסנית, או מספר הצמתים שניתן להחזיק בזיכרון בו-זמנית (2, 24).
מודלים כאלה מנבאים שהטמעה עמוקה יותר קשה יותר, אך אינם מנבאים שהקושי מווסת על ידי רמזים סטטיסטיים או סמנטיים. שלא כמו ארכיטקטורות מבוססות מחסנית, התיאוריה שלנו מייחסת תפקיד מרכזי לרמזים הסתברותיים בהקמת מבנה רקורסיבי. מהבחינה הזו, היא מסכימה עם תיאוריות עדכניות יותר מבוססות זיכרון, בהנחה שבני אדם אינם שומרים על מבני נתונים כגון ערימות, ובמקום זאת, מקימים מבנים תחביריים באמצעות שליפה מבוססת רמזים אסוציאטיביים (5, 7, 49, 50). מודלים של אחזור אסוציאטיבי כפי מיושם כעת (7) אינם מסבירים את דפוסי הקושי הייחודיים שנחזה על ידי המודל שלנו ונצפו בניסויים שלנו. אף על פי כן, אנו רואים בתיאוריה שלנו תואמת רעיונות מאותה ספרות.
התיאוריה שלנו מספקת מודל ברמה חישובית שהופך את התחזיות לתואמות את המודלים הקיימים מבוססי זיכרון, אך בניגוד למודלים הללו - מותאמת באופן רציונלי למבנה הסטטיסטי העשיר של השפה, ומאפשרת לה לחזות כיצד מגבלות זיכרון מתקשרות עם ציפיות הסתברותיות. התוצאות שלנו מצביעות על כך שזיהוי גרסאות הסתברותיות של מודלים של אחזור אסוציאטיביים, כהטמעות ברמה אלגוריתמית של מודל המשאב-רציונלי המתואר כאן, היא בעיה מעניינת עבור מחקר פסיכו-לשוני. ראה נספח SI, סעיף S7.2 למידע נוסף על ההשלכות של התוצאות שלנו עבור מודלים של זיכרון מבוססי שליפה.
האיחוד המוצע שלנו של מודלים מבוססי ציפיות ומבוססי זיכרון נשען על הרעיון שייצוגים לא מושלמים של זיכרון עבודה משוחזרים באופן רציונלי - אם כי לפעמים שגוי - תוך שימוש בידע של הסטטיסטיקה של השפה. לרעיון זה יש תקדים חשוב בעבודה על אינטגרציה מחדש בזיכרון העבודה המילולי ( למשל, ר' 51-55), תהליך שבו זיכרון לטווח קצר משוחזר באמצעות ידע מהזיכרון לטווח ארוך. זה הוחל על זיכרון עבור רשימות מילים (למשל, ref. 52-55), ולאחרונה, זיכרון עבור דפוסי תחביר (56). המודל שלנו מספק תיאור של תהליכים כאלה המבוססים על מסקנות בייסיאניות מוגבלות על ידי רציונליות משאבים. ישנם גם מודלים שבהם מתייחסים לזיכרון העבודה כאל רכיב של זיכרון משלו, אך כנובע מהאינטראקציה של עיבוד וזיכרון לטווח ארוך (57, 58). עבור מודלים כאלה, התוצאות שלנו מספקות נתונים על האופן שבו ידע לטווח ארוך מודיע לעיבוד. .
הניסויים שלנו מנצלים מתאמים סטטיסטיים של מבנים תחביריים כדי לבחון כיצד ציפיות הסתברותיות מתקשרות עם אילוצי זיכרון. יש לזה כמה הקבלות במודלים קודמים המבוססים על ציפיות שהראו כיצד מתאמים, כגון בין אנימציה לסוג סעיף יחסי, משפיעים על עיבוד בדרכים שאינן מובאות בחשבון על ידי חשבונות קיימים מבוססי זיכרון (למשל, נקודות 59-61). עבודתנו מרחיבה על קו עבודה זה על ידי ניסוח תיאוריה מיושמת של האינטראקציה בין אילוצי זיכרון וציפייה הסתברותית.
למודל שלנו יש פרמטר חופשי δ, המספר הממוצע של מילים שנשמרו. הנחנו ערך יחיד בגזירת התחזיות והשוואתם לזמני קריאה אנושיים. התאמתו לנבדקים בודדים והבנת הקשר שלו למדדים מבוססים של הבדלים אינדיבידואליים היא בעיה מעניינת עבור מחקר עתידי.
מודלים קונקציוניסטיים של עיבוד תחבירי אנושי (8, 62-64) שואפים לתאר עיבוד אנושי תוך שימוש בציפיות הנגזרות מייצוגי רשת עצבית והוצעו למודל של השפעות הקשורות הן למגבלות הזיכרון והן לציפיות הסתברותיות. עם זאת, ההבדלים בין הפתעה רגילה שמחושבת על ידי GPT-2 לבין הפתעה רציונלית של אובדן-הקשר במשאבים מראים שמגבלות זיכרון דמויות אדם אינן צריכות להופיע אוטומטית במודלים קונקשניסטיים.
הראינו כיצד ניתן להתאים מודל של עיבוד שפה רציונלי במשאבים למבנה הסטטיסטי העשיר של השפה הטבעית. השיטה שלנו המבוססת על למידת מכונה עשויה לפתוח את הדלת להתאמת מודלים רציונליים מתוחכמים על סטטיסטיקות תשומות טבעיות וגם בתחומים אחרים של קוגניציה אנושית.
הכלליות של המודל שלנו גם מעידה על כך שתופעות דומות עשויות להתקיים מחוץ לשפה: בכל פעם שבני אדם מעבדים קלט שהוא מורכב מדי מכדי שניתן יהיה לטפל בכל חלקיו בו-זמנית, העיבוד צריך להיות מושפע מהמבנה הסטטיסטי של תשומות דומות.

חומרים ושיטות
שמות עצם. אספנו שמות עצם שיכולים לקבל השלמה משפטית, באמצעות thePenn Treebank (65), בנק העץ האנגלי (66), בנק העצים של AnCoRA (67) בספרדית, ו-HDT Treebank (68) בגרמנית. הערכנו הטיה בהטמעה את ההסתברות ביומן ש"ה-NOUN" מלווה ב"זה" באמצעות ויקיפדיה באנגלית (2.3 מיליארד מילים), ויקיפדיה הגרמנית (800 מיליון מילים) וויקיפדיה הספרדית (500 מיליון מילים). ראה נספח SI, סעיף S11 לפרטים. אימתנו את האומדנים באנגלית באמצעות שני גופים גדולים אחרים של אנגלית אמריקאית ובריטית (נספח SI, סעיף S10.1).
דֶגֶם. הפתעה רציונלית של אובדן-הקשר של משאבים מוגדרת על ידי משפחה של הסתברויות לשמירה θ={qw, i: i, w}, כאשר w נע על פני מילים andi=1, ..., N, כאשר N=20 הוא אורך ההקשר המקסימלי שנחשב, ארוך מספיק כדי להכיל את כל ההקשרים המופיעים בניסויים. אנו מפרמטרים את qw, אני משתמש ברשת עצבית המשלבת זהות של מילת עבר ומספר המילים המתערבות, כדי להפיק שימור הסתברות (נספח SI, סעיף S1.1). המודל θ יוצר את הסבירות p(c|c) ובכך את p(c|c) האחורי. זה נבחר כדי למזער את ההפתעה הממוצעת של המילה הבאה עבור המילה הבאה האחורית p(w|c):

מערך ניסוי ללימודי זמן קריאה. עבור כל המחקרים, פרוטוקול הניסוי אושר על ידי מועצת הביקורת המוסדית באוניברסיטת סטנפורד. התקבלה הסכמה מדעת מכל המשתתפים.
לכל משתתף הוצגו 10 ניסויים קריטיים. בשני הניסויים, שני ניסויים היו ב-ONE, וארבעה ניסויים היו בשניים ושלושה כל אחד. בניסוי 2, מחצית משני הניסויים והשלושה היו כל אחד במצב תואם (לא תואם). בחרנו במספר קטן של ניסויים קריטיים, כדי למזער כל השפעה של התאמה סטטיסטית להטבעות במרכז במהלך המשימה.
כדי למקסם את הדיוק הסטטיסטי, בחרנו 15 שמות עצם עם הטיית הטבעה גבוהה מאוד ו-15 שמות עצם עם הטיית הטבעה נמוכה מאוד (נספח SI, איור S36). עבור כל משתתף, דגמנו חמישה שמות עצם עם הטיית הטבעה גבוהה וחמישה שמות עצם בעלי ערך נמוך והתאמנו אותם עם 10 הניסויים הקריטיים. עבור כל משתתף, דגמנו גם 30 חומרי מילוי ממאגר של 56 חומרי מילוי ממחקר זמן קריאה קודם של הטבעות מרכזיות (42).
כדי להסיר חריגות סמנטיות הנובעות מהפרות של הנחות מוקדמות (למשל, "העובדה הייתה שגויה"), סיווגנו את שמות העצם לגורמים גוררים (למשל, "עובדה"), נייטרליים שאינם כוללים (למשל, "טענה"), ושליליים שאינם כוללים (למשל, " האשמה") שמות עצם, ופריטים מסווגים לצורך התאמה לכל אחד משלושת המעמדות הללו (נספח SI, סעיף S11). עבור כל משתתף, התאמנו את 10 שמות העצם עם פריטים תואמים מבחינה סמנטית.
עבור משימת המבוך, יצרנו מסיחים באופן אוטומטי (39) באמצעות מודל השפה Gulordava (69): למסיחים אלה יש הסתברות הקשרית נמוכה ביותר בזמן שהם מתאימים למילת המטרה בתדירות ובאורך. ביטוי מילולי אחרון בתנאים (IN)COMPATIBLE בניסוי 2. בפרט, מסיחים הותאמו במילה הקריטית בכל התנאים.
כאשר המשתתפים עשו טעות (כלומר, בחרו במסיח הדעת), הם התבקשו לנסות שוב את המילה הנוכחית (70). זמני תגובה בניסויים כאלה לא נכללו; בחירה זו לא השפיעה על המסקנות (נספח SI, סעיף S3.6).
עבור כל נבדק הוצגו ניסויים בסדר אקראי כך שלא היו שני ניסויים קריטיים צמודים. המשתתפים, שגויסו בפלטפורמה האקדמית Prolific, לקחו חציון של 13 דקות וקיבלו £2.20 (≈3 USD).
ניתוח נתונים לזמני קריאה. לא כללנו ניסויים 1) עם תשובה שגויה, 2) ממשתתפים שעשו שגיאות ביותר מ-20% מהמילים, ו-3) מתחת או מעל 99% מכל זמני הקריאה. ראה נספח SI, סעיף S3.6 עבור עמידה בתנאי 1, וראה נספח SI, סעיף S3.7 עבור חוסנות לתנאי 3. לאחר מכן ניתחנו זמני קריאה שעברו טרנספורמציה על המודלים הסופיים של אפקטים מעורבים בייסיאניים המיושמים ב- Stan (71) באמצעות זרועות (72). ראה נספח SI, סעיף S3.3 לקודמים וחוסן לבחירות קודמות. השתמשנו בקידוד ניגודיות עם נוכחות של סעיף "זה" (ONE מול TWO/THREE), עומק (TWO מול THREE) ומניפולציה של תאימות (COMPATIBLE לעומת INCOMPATIBLE) כניגודים. הטיית הטבעה הייתה מרוכזת, וכל האינטראקציות הבינאריות הלא ריקניות נוספו כאפקטים קבועים (נספח SI, סעיף S3.2).
כללנו את מבנה ההשפעות האקראיות המקסימליות המוצדקות על ידי התכנון הניסיוני, הזנת פריטים, שמות עצם ומשתתפים כהשפעות אקראיות. כדי להעריך את ההשפעות בזמני קריאה גולמיים (מילישניות), חישבנו תחילה את זמן הקריאה החזוי של יומן ההמרה בשני התנאים (למשל, תואם ובלתי תואם), ולאחר מכן הפכנו את שתיהן לאלפיות שניות על ידי אקספוננציה וחישבנו את ההפרש (ראה נספח SI, סעיף S3.4 לפרטים נוספים). באיור 3, אנו משרטטים את הממוצע האחורי של זמן הקריאה החזוי בכל התנאים עבור שמות עצם עם הטיה תואמת "עובדה" או "דיווח". פסי שגיאה מייצגים את ה-SD האחורי.
פרטים למחקר הפקה. בנינו 28 פריטים מהצורה "הדיפלומט שהוא הסנאטור", ובחרנו 12 שמות עצם, 6 כל אחד מהם עם הטיית הטבעה גבוהה מאוד או נמוכה מאוד. עבור כל משתתף, שילבנו באופן אקראי פריטים ושמות עצם. 12 הניסויים הקריטיים הוצגו בסדר אקראי עם 27 חומרי מילוי. Alinguist הערה ידנית, עבור כל השלמה שסופקה, אם הופק המספר הנכון של ביטויי הפועל (שלושה). הכותב היה עיוור לזהות שם העצם.
בספרדית ובגרמנית, בחרנו 20 שמות עצם עם הטיית הטמעה גבוהה מאוד או נמוכה מאוד בכל שפה, ודגמנו 6 שמות מוטעים גבוהים ו-6 נמוכים עבור כל משתתף. כמו בגרסה האנגלית, התאמנו באופן אקראי 12 פריטים עם 12 שמות העצם שנדגמו עבור כל משתתף. חומרי מילוי תורגמו מהניסוי באנגלית.
בגרמנית, בנינו עוד 12 משפטים מטריצות (למשל, "קלאוס אמר את זה"), והתאמנו אותם באופן אקראי לפריטים ושמות עצם עבור כל משתתף. ערכנו ניתוח ניסוי-אחר-ניסוי לוגיסטי של אפקטים מעורבים עם הטיה של הטמעה כאפקט קבוע. , והשפעות אקראיות של שמות עצם, פריטים, משתתפים ומשפטי מטריקס (בגרמנית). ראה נספח SI, סעיף S4 לפרטים.
זמינות נתונים, חומרים ותוכנה. הסתברויות שמירה מותאמות וחיזוי מודלים הופקדו ב-Zenodo (https://zenodo.org/record/6602698) (73), (https://zenodo.org/record/6988696) (74). זמני קריאה אנונימיים, נתוני ייצור שפה וקוד מקור הופקדו ב-GitLab (https://gitlab.com/m-hahn/resource-rational-surprisal) (75).
תודות. אנו מודים לעורך ולסוקרים על המשוב הבונה שלהם, שעזר לשפר את כתב היד. אנו אסירי תודה גם לג'ודית דגן, Tiwalayo Eisape, Hailin Hao, Jennifer Hu, Dan Jurafsky, PengQian, Cory Shain, Shravan Vasishth, Tom Wasow, Ethan Wilcox, והקהל בכנס CUNY לעיבוד משפטים לשנת 2020 לדיון ומשוב מועילים.

התייחסות
1. נ' חומסקי, מבנים תחביריים (מוטון, האג, 1957).
2. GA Miller, N. Chomsky, "מודלים פינטריים של משתמשי שפה" ב-Handbook of MathematicalPsychology, RD Luce, RR Bush, G. Galanter, Eds. (ג'ון ווילי, 1963), עמ' 269–321.
3. L. Frazier, "מורכבות תחבירית" בניתוח שפה טבעית: פרספקטיבות פסיכולוגיות, חישוביות ותיאורטיות, DR Dowty, L. Karttunen, AM Zwicky, Eds. (הוצאת אוניברסיטת קמברידג', ניו יורק, 1985), עמ' 129–189.
4. E. Gibson, Linguistic Complexity: Locality of dependencies תחבירי. Cognition 68, 1–76 (1998).
5. B. McElree, S. Foraker, L. Dyer, Memory structures that subserve the comprehension.J. Mem.Lang. 48, 67–91 (2003).
6. W. Tabor, B. Galantucci, DC Richardson, Effects of only local coherence תחבירי על עיבוד משפטים.J. מ. לאנג. 50, 355–370 (2004).
7. RL Lewis, S. Vasishth, מודל מבוסס הפעלה של עיבוד משפטים כמו אחזור זיכרון מיומן.Cogn. Sci. 29, 375–419 (2005).
8. MH Christiansen, MC MacDonald, גישה מבוססת שימוש לרקורסיה בעיבוד משפטים.Lang. לִלמוֹד. 59, 126–161 (2009).
9. J. Hale, (2001) "A probabilistic early parser as a psycholinguistic model" ב-Proceedings of the Second Meeting of the North American Chapter של האגודה לבלשנות חישובית, NAACL 2001,L. לוין, K. Knight, Eds. (האגודה לבלשנות חישובית, Stroudsburg, PA), עמ' 1–8.
10. ר' לוי, הבנה תחבירית מבוססת ציפיות. קוגניציה 106, 1126–1177 (2008).
11. K. Rayner, AD ובכן, השפעות של אילוץ הקשר על תנועות עיניים בקריאה: בדיקה נוספת. פסיכון. שׁוֹר. Rev. 3, 504–509 (1996).
12. A. Staub, השפעת חיזוי מילוני על תנועות עיניים בקריאה: סקירה ביקורתית ופרשנות תיאורטית. Lang. בַּלשָׁן. מצפן 9, 311–327 (2015).
For more information:1950477648nn@gmail.com






