מפעלי מחקר

ניתוח לשוני של קורפוסים בערבית יהודית אלג'ראית בעזרת למידת מכונה
פרויקט שממומן ע"י הקרן הלאומית למדע ומנוהל בידי פרופ' עפרה תירוש-בקר

המחקר הפילולוגי והבלשני המקובל של טקסטים כתובים (או מדוברים) בערבית-יהודית, כמו בשפות אחרות, מוגבל בדרך כלל בהיקפו משום שהוא מתבצע באופן ידני בידי החוקרים. כתוצאה מכך רק חלק קטן מהטקסטים הללו זוכים למחקר מעמיק. כדי להתגבר על בעיה זו ולאפשר ניתוח בלשני של קורפוסים נרחבים, במסגרת מחקר זה יפותחו כלים לניתוח לשוני אוטומטי באמצעות שיטות חישוביות של למידת מכונה. הלמידה של המכונה תתבסס על קורפוס ממוחשב ומתויג גדול יחסית של טקסטים בערבית-יהודית מאלג'יריה, שכבר נבנה במסגרת פרויקט מחקר קודם שלנו. לאחר שלב הפיתוח, נשתמש בכלים החישוביים החדשים לשם ניתוח של קורפוס גדול של טקסטים לא-מנותחים בערבית-יהודית מאלג'יריה, וזאת כדי לאפשר תמונה רחבת היקף של לשון זו. 

מפעל הלאדינו
פרויקט מחקר שמנוהל בידי פרופ' דוד בוניס

לאדינו הוא השם הנפוץ ביותר כיום ללשון "הספרדית-היהודית" המסורתית של היהודים הספרדים. הלשון ידועה גם כג'ודזמו, ג'ודיו, ספניול(ית), ספרדית-יהודית ובמרוקו חכתיה. נהוג היה לכתוב אותה באלף-בית העברי אולם כיום היא נכתבת לרוב בתעתיק לכתב לטיני. הלשון מורכבת מיסודות שמקורם באיברו-רומאנית עתיקה, עברית וארמית, ערבית-יהודית, יוונית-יהודית, לשונות מגע מלאחר הגירוש כגון תורכית באיזורים העות'מאניים לשעבר וערבית במרוקו, ולשונות יוקרה מערב-אירופיות כצרפתית, איטלקית וקסטילינית.