בקרב מומחי NLP קיימים מבחנים מוסכמים לבחינה מדעית סטטיסטית של תוצאות של אלגוריתמים לניתוח שפה טבעית. בהנחה שמה שאתם בעצם מחפשים הוא פלטפורמה מקצועית שתאפשר לכם לבנות צ'אטבוט לאתר שלכם, ולא תואר אקדמאי בבלשנות או מתמטיקה, סביר להניח שלא תשקיעו את הזמן והאנרגיה לבחון מערכות לבניית צ'אטבוטים בכלים מדעיים.
אך האם משמעות הדבר שאי אפשר לבדוק אותם כלל? בשוק קיימות מספר פלטפורמות המציעות אפשרות לבניית צ'אטבוטים באופן עצמאי. לחלק מהפלטפורמות אין יכולת לניתוח שפה טבעית, לחלקן יכולות בסיסיות ביותר, וחלקן מציעות אפשרויות מתקדמות מאוד שקשה מאוד להעריך את טיבן. האפשרויות הנ״ל מעוררות חוסר ודאות ובכך מקשות על הלקוח בקבלת החלטה.
אנו מציעים שיטה פשוטה והגיונית לבחון במהירות את יכולות ניתוח השפה הטבעית של פלטפורמות לבניית צ'אטבוטים. אמנם זה אינו תהליך מדעי, ובוודאי שלא ניתן להגיש על סמך שיטה זו עבודה אקדמית, אבל השיטה שלהלן יכולה בהחלט לעזור למי שכבר ירד לשורש העניין ונמצא בשלב שבו הוא חייב לקבל החלטה בנוגע לרמת היכולות של הפלטפורמה לבניית צ'אטבוט.
שיטה לבדיקת הבנה של שפה טבעית
נתחיל מהבסיס: מילים הן כימות (מהמילה כמות) של משמעות. אין לנו למעשה דרך אחרת לדעת אם מישהו הבין את משמעות הנאמר, אלא אם יש לו, או לה, יכולת לחזור על אותה המשמעות במילים אחרות. הצגת המשמעות באותן המילים אינה מעידה בהכרח על הבנה.
כלומר, היכולת לחזור על המשמעות במילים אחרות היא השיטה הנהוגה אצל בני אדם לוודא הבנה. קחו לדוגמה בחינה בהיסטוריה. אם התלמיד/ה חוזרת על כל מילה ומילה בדיוק כפי שנאמר בשיעור, אנו מסיקים שהיא לא הבינה דבר. גם אם התלמידה כלל אינה יודעת לחזור על החומר הנלמד, אנו מסיקים שלא הבינה דבר. אבל אם התלמידה יכולה לחזור על החומר הנלמד תוך שימוש במילים שונות, אנו יודעים שהיא אכן הבינה את החומר הנלמד.
צ'אטבוט הינו תוכנה שבחלקה עוסקת בהבנת הטקסט שהוזן על ידי המשתמש. ישנן מספר דרכים לעשות זאת, ותוכלו לקרוא עליהן בהרחבה במאמר שיטות מקובלות להבנת שפה טבעית בצ'אטבוט . השאלה היא: כיצד אנו יכולים למדוד את רמת "ההבנה" של האלגוריתמיקה? או במילים אחרות, איך אנחנו יכולים לבדוק מה הצ'טבוט באמת הבין?
התשובה היא: עלינו לבחון את ההבנה של הצ'אטבוט בדיוק כמו שנבחן הבנה של אדם. אם הצ'אטבוט מסוגל לחזור על המשמעות של הנאמר במשפט במילים אחרות, אזי הוא הבין את משמעות המשפט.
I want to rent a car => Intent rent car
במערכת שלנו יש מנגנון הבנה שעובד בצורה הזאת.
ליכולת להבין יש משמעות אדירה כי בסופו של יום, צ'אטבוט הוא רובוט הפועל לפי מנגנוני גירוי-תגובה. היכולת של הצ'טבוט ״להבין" משפט אחד בעצם מרחיבה את מנגנון התגובה שלו בצורה משמעותית. מכיוון שעכשיו משפט דומה, אך לא זהה - יניב את אותה ה"הבנה"
I need to rent a red car => intent red car
ויקבל את אותה התגובה, בהתאם ליכולת התאמת התשובה המתאימה ביותר.
וזה למעשה מנגנון הלימוד. ניתן לקרוא על כך במאמר: "יכולת ניהול השיח של הצ'טבוט משתפרת עם השימוש בו".
סיכום:
לפעמים היגיון פשוט הוא הדרך הטובה ביותר לקבלת החלטה בין מספר אלמנטים מורכבים. היכולת לבחון אם מנוע הבנת השפה הטבעית של המערכת מצליח לחזור על משפט נתון במילים שלו היא קריטריון פשוט שמאפשר לבדוק כל מערכת בפשטות ובמהירות.