פתרון ל-Stemmer בעברית
אני מחפש פתרון ל-stemmer בעברית.
אני מבין שזו בעיה קשה, ואפילו האתר הזה לא תומך ב-stemming. לאנגלית ושלל שפות אחרות יש פתרונות בתוך דרופל (porter stemmer, de_stemmer וכו'), אבל לעברית לא.
חיפוש בלי stemmer הוא חיפוש די מוגבל - צריך לחפש את הטקסט במדויק כפי שהוא מופיע בפוסטים. אם מחפשים את המילה "אפשרות" לא מוצאים פוסטים שבהם כתוב "אפשרויות".
הפתרון הכי קרוב שמצאתי הוא לנסות לכתוב מודול דרופל חדש שמבוסס על היכולות של החבילה hspell , למרות שהיא לא נותנת בדיוק stemming - אבל די קרוב. למישהו יש רעיון אחר או מכיר חבילה חיצונית טובה יותר שאפשר להשתמש בה כדי לייצר מודול של דרופל לצורך זה?
אני צריך משהו די בדחיפות, אז כל עזרה תתקבל מאד בברכה.
תודה

מתוך ההודעה שלך אני מנחש שכבר
מתוך ההודעה שלך אני מנחש שכבר ראית את זה, נכון?
אני יודע שבפרוייקט השו"ת יש יכולת כזו (חיפוש על פי שורש) אבל אני בספק
א. כמה היא מוצלחת
ב. האם יתירו להשתמש בפיסת הקוד הזו בחינם.
חתיכת אתגר, יש לציין
לנו יש נסיון בעבודה עם lucene
לנו יש נסיון בעבודה עם lucene וההרחבה שלה לעברית: hebmorph.
מציע לקרוא עוד כאן: http://www.code972.com/blog/
זהר סטולר, לינווייט
לינווייט תשתיות תוכן קהילתיות