תודה שצפית ב-Google I/O! צפייה בתוכן על פי דרישה.

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

AI שמותאם לצרכים: טוב לעסקים, למשתמשים ולכדור הארץ

Rachel Lee Nabors

תאריך פרסום: 10 בנובמבר 2025

כשיוצרים אתרים ואפליקציות אינטרנט באמצעות AI, יכול להיות שיצרתם אב טיפוס באמצעות מודל שפה גדול (LLM), כמו ChatGPT,‏ Gemini או Claude, ואז פרסתם את ההטמעה הזו בסביבת הייצור. מודל LLM הוא סוג של מודל בסיס, מודל גדול מאוד שעבר אימון מראש, שדורש הרבה משאבים, יקר ולרוב הוא לא הכלי הכי טוב למשימה. מודלים קטנים ומקומיים שמתמקדים במשימה מסוימת צורכים פחות משאבים, ולרוב מספקים תשובות טובות ומהירות יותר בעלות נמוכה יותר בהשוואה למודלים בסיסיים שמתאימים לכל המשימות.

כשבוחרים מודל טוב יותר, בוחרים גישה בת קיימא יותר, שאנחנו קוראים לה AI מותאם. השימוש ב-AI שמותאם לצרכים שלכם מאפשר לכם:

זמן אחזור נמוך יותר למשתמשים כשמודלים פועלים באופן מקומי, במקום לבצע הלוך ושוב לשרתים מרוחקים.
הפחתה בעלויות ה-API כשלא משלמים על יכולות שלא נעשה בהן שימוש.
גישה לאפליקציות במצב אופליין למודלים בצד הלקוח ובמכשיר, כדי ליצור חוויות אמינות יותר.

מודלים בסיסיים מצטיינים בהסקה כללית ובשיחות, אבל השימוש בהם למשימות ספציפיות (כמו סיווג טקסט או חילוץ נתונים) הוא כמו שימוש במכונית פורמולה 1 כדי להגיע למקדונלדס. זה אפשרי מבחינה טכנית, אבל מאוד לא יעיל (ולא נוח לנוסעים). במקום זאת, כדאי להתאים את ההטמעה לצרכים בפועל.

שיטות עבודה מומלצות בתחום ה-AI וחוויית משתמש אופטימלית הן לא סדרי עדיפויות סותרים. הן מייצגות את אותה עדיפות, אבל בצורה שונה.

דרך אחת להערכת ההשפעה הסביבתית של AI היא:

אימון: אימון ראשוני של המודל דורש משאבים משמעותיים. האופטימיזציה והלמידה האלה מנוהלות על ידי ספק המודל.
הסקת מסקנות: אתם מבצעים הסקת מסקנות כשאתם מספקים למודל מאומן קלט חדש (הנחיה) כדי ליצור פלט (טקסט התשובה). בהשוואה לאימון, הסקת מסקנות משתמשת בהרבה פחות משאבים.

ההדרכה היא עלות קבועה, אבל עלות ההסקה משתנה בהתאם לשימוש, ולכן בחירת המודל היא גורם חשוב שאתם יכולים לשלוט בו. כך תוכלו לקבל החלטות מושכלות לגבי תרחיש השימוש שלכם ולגבי כדור הארץ, ולתמוך בפיתוח אחראי של AI.

הטמעה של AI שמתמקד במשתמשים

במקום לבנות AI שמתמקד במודל, כדאי לבנות AI שמתמקד במשתמש. כדאי לחשוב אילו משימות יכולה ה-AI לבצע כדי להקל על השימוש באפליקציה או לצמצם את עומס העבודה של המשתמשים או את מספר הפעמים שהם צריכים לעבור בין הקשרים.

לדוגמה, נניח שאתם מנהלים עסק בשם Rewarding Eats, שמעניק נקודות למשתמשים על אכילה במסעדות מסוימות. לדוגמה, אפשר להשתמש ב-AI כדי לסרוק תמונה של קבלה ולמצוא את שם המסעדה ואת סכום ההוצאה הכולל, במקום לבקש מהלקוחות להזין את הפרטים האלה באופן ידני. התכונה הזו צפויה לשפר את חוויית המשתמש באפליקציה.

כשמפתחים AI שמתמקד במשתמשים:

הגדרת הדרישות של המשימה. אילו משימות הבינה המלאכותית צריכה לבצע? האם הם מבוססים על טקסט בלבד או שהם כוללים רכיבי אודיו או רכיבים חזותיים?
בוחרים את המודל המתאים. מודלים שונים יעילים יותר במשימות שונות, ולרוב יש להם טביעת רגל קטנה יותר.
הסבר על מגבלות הפריסה. איפה כדאי למקם את המודל? איפה הנתונים יהיו ממוקמים? האם למשתמש יהיה חיבור אמין?
הטמעה עם שיפורים הדרגתיים כדי ליהנות מחוויית משתמש מהירה ומאובטחת.

הגדרת הדרישות של המשימה

במקום לחפש "מקומות לשימוש ב-AI" או "תכונות AI שאפשר להוסיף", כדאי לשאול: "איך תיראה חוויה חלקה?" בהתאם לגודל החברה, כדאי לנהל שיחה בנושא עם מנהלי המוצרים.

ניקח לדוגמה את אפליקציית Rewarding Eats. השאלה הראשונה שצריך לשאול היא: 'האם אנחנו צריכים AI בשביל זה?'

מודל בסיס יכול לנסח הוצאה מקבלה, עם הנחיות מסוימות. אבל כדי לטפל בזה בצורה יעילה יותר לא צריך מודל גדול בכלל. משתמשים בזיהוי תווים אופטי (OCR) כדי לנתח את הטקסט מהתמונה ולהעביר אותו למודל ספציפי למשימה, כמו מודל לסיווג טקסט, כדי לזהות את הפריטים והעלויות מהטקסט המנותח. אפשר לעשות את זה במכשיר של המשתמש, בלי לשלוח נתונים לשרתים.

ברוב המקרים, אם אתם חושבים שאתם צריכים מודל בסיסי, כנראה שאתם צריכים לפצל את הבעיה למשימות נפרדות.

בחירת המודל המתאים

אחרי שתדעו אילו משימות אתם מנסים לבצע, תוכלו לבחור את סוג המודל ואת המודל המתאימים למשימה. יותר קל להשתמש במודל בסיסי, אבל מודלים קטנים יותר מבצעים את העבודה מהר יותר ובזול יותר. כשמבינים את המשימה, אפשר לבחור את המודל הקטן והמתאים לטיפול בעבודה.

יש הרבה סוגים שונים של מודלים, ולכן מומלץ לקרוא את המאמר המפורט על בחירת מודלים כדי להבין מהי הבחירה הנכונה לפרויקט שלכם.

בחירת המיקום הנכון למודל

מודלים בסיסיים הם גדולים מדי כדי לפעול גם במחשבים שולחניים חזקים מאוד, אבל אפשר להריץ במכשירים רבים מודלים קטנים יותר של שפה (LLM), מודלים קטנים של שפה (SLM) ומודלים ספציפיים למשימות.

סוג המודל	כבר במכשיר (בצד הלקוח)	הורדה למכשיר	מודל שמתארח בשרת
מודל ספציפי למשימה	לא מומלץ	לא מומלץ	מומלץ
מודל שפה קטן (SLM)	מומלץ	מומלץ	מומלץ
מודלים בסיסיים	לא מומלץ	לא מומלץ	מומלץ

מודלים קטנים של שפה נוחים אבל לא נפוצים. יש מיליארדי טלפונים ניידים, אבל רק הדגמים החדשים והיקרים ביותר יכולים להריץ מודלים מקומיים של SLM. זהו אחוז קטן מהשוק.

אפשר להשתמש במטריצה הזו כדי לקבוע את המיקום הכי טוב למודל:

מדד	בצד הלקוח / מקומי	צד השרת / מרוחק
קישוריות	נדרש מצב אופליין, רשתות לא יציבות, מתקנים מאובטחים	סביבות שפועלות תמיד אונליין
מיקום הנתונים	עיבוד תמונות של משתמשים, קלט טקסט וקבצים אישיים	עבודה עם מסמכים ומסדי נתונים בצד השרת
דפוס שימוש	שיחות בתדירות גבוהה (תרגום צ'אט, ניתוח בזמן אמת)	משימות מורכבות מדי פעם
רוחב פס	משתמשים בניידים, אזורים כפריים, פלט של קבצים גדולים	פס רחב ללא הגבלה, תגובות קצרות
פרטיות ואבטחה	נתונים מפוקחים (בריאות, פיננסים), עמידה מחמירה בדרישות	נתונים עסקיים סטנדרטיים, תשתיות אבטחה מבוססות
השפעה על הסוללה	אפליקציות למחשב, תרחישים לדוגמה שבהם יש סבילות להפסקות חשמל	אפליקציות לנייד עם סוללה מוגבלת

הסקה מצד הלקוח, שיפור הדרגתי והיברידי

באמצעות ספריות כמו TensorFlow.js,‏ Transformers.js ו-ONNX.js, האפליקציות שלכם יכולות לבצע הסקה בצד הלקוח עם נתוני משתמשים. אתם ממירים את המודל לפורמט המתאים, ואז מאחסנים אותו מרחוק או מטמיעים אותו ישירות באפליקציה. כדי להשיג את חוויית המשתמש הטובה ביותר, כדאי להשתמש בשילוב חלק של מודלים שנטענו מראש, מודלים שאפשר להוריד ומודלים מרחוק, כדי שהמשתמשים יוכלו לבצע את העבודה בלי להתפשר.

גם אם עדיף להשתמש במודל מרוחק שמתארח בענן מטעמי אבטחה (או בגלל גודל המודל), כדאי להפוך מודלים מקומיים מספיקים לזמינים למקרה של אובדן קישוריות, כדי ליצור חוויה גמישה.

בסופו של דבר, יש שלוש גישות לפריסת מודלים. בוחרים את האפשרות שהכי מתאימה לצרכים שלכם.

גישה מקומית קודמת: לאפליקציה יש דרישות אופליין, היא נמצאת בשימוש בתדירות גבוהה והיא מכילה נתונים רגישים.
הפעלה מרחוק: מודלים גדולים, שימוש לא תדיר, נימוקים מורכבים.
גישה היברידית: הורדה של מודלים קטנים בזמן השימוש בממשקי API, מעבר למודלים גדולים יותר כשמוכנים.

השלבים הבאים שלכם

הטכנולוגיה לרוב מגיעה אחרי ההטמעה. הדרך הטובה ביותר למפתחים להשפיע על הכיוון של התעשייה, לטובת חוויית משתמש טובה יותר ותוצאה טובה יותר לעולם שלנו, היא:

בחירת הכלי המתאים למשימה. מודלים קטנים יותר צורכים פחות משאבים, ולרוב הם פועלים טוב כמו מודלים גדולים, בעזרת הנדסת הנחיות. יש להם זמן טעינה קצר יותר.
דרישה לשקיפות בנוגע לעלויות של הסקת מסקנות ואימון. חשוב להמליץ לחברה שלך לתת עדיפות למודלים שחושפים את המספרים האלה.
ממקמים את המודל קרוב לנתונים כדי להפחית את העלות של הלוך ושוב לשרת.
שימוש בנתונים שכבר זמינים. אם כבר יש מודלים במכשיר, המערכת תעדיף להשתמש בהם קודם.

משאבים

אם אתם רוצים לקרוא עוד על הנושאים האלה, השתמשתי במקורות המידע הבאים כדי לכתוב את המאמר הזה. הם מספקים חוויית קריאה מצוינת.

ביצועי המודל ומחקר

מודלים קטנים של שפה הם העתיד של AI מבוסס-סוכנים (מאמר מחקר של NVIDIA): מחקר תומך על יכולות SLM
ביקורת של Mistral בנושא השפעה סביבתית: שקיפות לגבי עלויות של אימון והסקת מסקנות
מחקר על עלויות הסקת מסקנות של Google: מדידת ההשפעה על הסביבה
Nature Study: AI versus Human Environmental Impact: Comparative analysis of AI and human task completion
AI Environmental Impact Discussion: Context on environmental discourse

כלים להטמעה ולפיתוח

טעינת מודל TensorFlow.js: פריסת מודל בצד הלקוח
דוגמאות ל-Transformers.js: הסקת מסקנות לגבי מודל שמבוסס על דפדפן
‫ONNX.js Runtime: פריסת מודלים חוצה פלטפורמות
מדריך ל-Firebase Hybrid AI: שילוב של מודלים מקומיים ומרוחקים