הצטרפו לקבוצות שלנו לקבלת עדכונים מרוכזים פעם בשבוע:

ווטסאפ:
http://wa.dwh.co.il
טלגרם:
http://telegram.dwh.co.il

צ'אטבוטים המופעלים על ידי בינה מלאכותית נעשים טובים למדי באבחון מחלות מסוימות, אבל איך צ'אטבוטים עובדים כשהשאלות פחות שחור-לבן?

לדוגמה, כמה זמן לפני הניתוח על מטופל להפסיק ליטול מדללי דם שנקבעו? האם פרוטוקול הטיפול של מטופל צריך לשנות אם היו לו תגובות שליליות לתרופות דומות בעבר? לשאלות מסוג זה אין ספר לימוד תשובה נכונה או שגויה - זה תלוי ברופאים להשתמש בשיקול הדעת שלהם.

Jonathan H. Chen, MD, PhD, עוזר פרופסור לרפואה וצוות חוקרים בוחנים האם צ'אטבוטים, סוג של מודל שפה גדול, או LLM, יכולים לענות ביעילות על שאלות כה ניואנסיות, והאם רופאים הנתמכים על ידי צ'אטבוטים מתפקדים טוב יותר.

התשובות, מסתבר, הן כן וכן. צוות המחקר בדק כיצד צ'אטבוט פעל כשהוא מתמודד עם מגוון של צומת דרכים קלינית. צ'אט בוט בפני עצמו גבר על רופאים שיכלו לגשת רק לחיפוש באינטרנט ולהפניות רפואיות, אך חמושים ב-LLM משלהם, הרופאים, ממספר אזורים ומוסדות ברחבי ארצות הברית, עקבו אחר הצ'אטבוטים.

"במשך שנים אמרתי שבשילוב, מחשב אנושי פלוס יצליח יותר מכל אחד בפני עצמו", אמר צ'ן. "אני חושב שהמחקר הזה מאתגר אותנו לחשוב על זה בצורה יותר ביקורתית ולשאול את עצמנו, 'במה מחשב טוב? במה אדם טוב?' אולי נצטרך לחשוב מחדש היכן אנו משתמשים ולשלב את המיומנויות הללו ולאילו משימות אנו מגייסים בינה מלאכותית".

מחקר המפרט את התוצאות הללו שפורסם ב-Nature Medicine ב-5 בפברואר. חן ואדם רודמן, MD, עוזר פרופסור באוניברסיטת הרווארד, הם מחברים בכירים. החוקרים הפוסט-דוקטורנטים איתן גו, MD, ורוברט גאלו, MD, הם מחברים מובילים.

מוגבר על ידי צ'אטבוטים

באוקטובר 2024, הצוות ערך מחקר, שפורסם ב-JAMA Network Open, שבדק את ביצועי הצ'טבוט בעת אבחון מחלות ומצא שהדיוק שלו גבוה יותר מזה של הרופאים, גם אם הם השתמשו בצ'טבוט. המאמר הנוכחי חופר על הצד היותר של הרפואה, ומעריך את ביצועי הצ'אטבוטים והרופאים בשאלות שנכללות בקטגוריה הנקראת "היגיון ניהולי קליני".

Goh מסביר את ההבדל כך: תאר לעצמך שאתה משתמש באפליקציית מפות בטלפון שלך כדי להדריך אותך ליעד מסוים. שימוש ב-LLM כדי לאבחן מחלה הוא בערך כמו שימוש במפה כדי לאתר את המיקום הנכון. איך אתה מגיע לשם הוא החלק של הנמקת הניהול - האם אתה לוקח דרכים לאחור כי יש תנועה? להישאר במסלול, פגוש אל פגוש? או לחכות ולקוות שהכבישים יתפנו?

בהקשר רפואי, החלטות אלה יכולות להיות מסובכות. נניח שרופא מגלה במקרה שלמטופל מאושפז יש מסה גדולה בחלק העליון של הריאה. מה יהיו השלבים הבאים? הרופא (או הצ'אטבוט) צריך להכיר בכך שלגוש גדול באונה העליונה של הריאה, סטטיסטית יש סיכוי גבוה להתפשט בכל הגוף. הרופא יכול לקחת מיד ביופסיה של המסה, לתזמן את ההליך למועד מאוחר יותר, או להזמין הדמיה כדי לנסות ללמוד עוד.

קביעה איזו גישה המתאימה ביותר למטופל מסתכמת בשלל פרטים, החל מהעדפותיו הידועות של המטופל. האם הם נרתעים לעבור הליך פולשני? האם ההיסטוריה של המטופל מראה על חוסר מעקב אחר פגישות? האם מערכת הבריאות של בית החולים אמינה בעת ארגון פגישות מעקב? מה לגבי הפניות? סוגים אלה של גורמים הקשריים חיוניים לשקול, אמר צ'ן.

הצוות תכנן ניסוי לחקר ביצועי חשיבה ניהולית קלינית בשלוש קבוצות: הצ'טבוט לבדו, 46 רופאים עם תמיכה בצ'טבוט ו-46 רופאים עם גישה רק לחיפוש באינטרנט והפניות רפואיות. הם בחרו חמישה מקרים של מטופלים לא מזוהים ומסרו אותם לצ'אטבוט ולרופאים, כולם סיפקו תגובה בכתב שפירטה מה הם יעשו בכל מקרה, למה, ומה הם שקלו בעת קבלת ההחלטה.

בנוסף, החוקרים התקשרו לקבוצה של רופאים מוסמכים כדי ליצור רובריקה שתכשיר שיקול דעת או החלטה רפואית כפי שהוערכה כראוי. לאחר מכן הובחנו ההחלטות מול הרובריקה.

להפתעת הצוות, הצ'אט בוט עלה על הרופאים שהיו להם גישה לאינטרנט בלבד ולהפניות רפואיות, וסמן יותר פריטים ברריקה מאשר הרופאים. אבל הרופאים שהיו מזווגים עם צ'טבוט ביצעו טוב כמו הצ'טבוט לבדו.

עתיד של רופאי צ'טבוט?

מה בדיוק נתן דחיפה לשיתוף הפעולה בין הרופא לצ'טבוט, עומד לדיון. האם השימוש ב-LLM מאלץ את הרופאים להיות מתחשבים יותר לגבי המקרה? או שה-LLM מספק הדרכה שהרופאים לא היו חושבים עליה בעצמם? זה כיוון עתידי של חקר, אמר צ'ן.

התוצאות החיוביות של צ'אטבוטים ורופאים בשילוב עם צ'אטבוטים מעלים שאלה פופולרית: האם רופאי בינה מלאכותית בדרך?

"אולי זו נקודה לטובת הבינה המלאכותית", אמר צ'ן. אבל במקום להחליף רופאים, התוצאות מצביעות על כך.

 

המקור: בית הספר לרפואה של סטנגפורד בכתובת הזאת.