מילון מונחים ומושגים

המקור העיקרי למונחים רבים של למידת מכונה (ML) הוא מילון המונחים של ML. במקום לשכפל את העבודה שלהם, אנחנו כוללים רק מילים ומונחים שמצוטטים בדרך כלל ושלא מופיעים במילון המונחים של למידת מכונה.

תוכנית מערכת AI

כשמפתחים תכונות או מוצרים חדשים מבוססי-AI, צריך להגדיר את תוכנית האב של מערכת ה-AI, ולמפות את ההזדמנות לשימוש ב-AI לאופן שבו תבנו פתרון. אתם צריכים להגדיר:

  • למה אתם בונים? אילו תרחישי שימוש ב-AI זמינים ומה הערך שלהם למשתמשים?
  • איך האפליקציה שלך תפעל?
  • איך אפשר לוודא שכל חלק במערכת מפותח בצורה אחראית?

מידע על השרטוט מופיע במבוא ל-AI באינטרנט.

ארכיטקטורת AI מורכבת

ארכיטקטורות מורכבות של AI, שילובים של מודל אחד או יותר ורכיבים אחרים כמו מסדי נתונים, ממשקי API ואמצעי הגנה שפועלים יחד כדי לספק התנהגות חזקה ומודעת-הקשר

הנדסת הקשר

הנדסת הקשר היא תהליך של בחירה דינמית של המידע (האסימונים) הרלוונטי ביותר לבקשה נתונה, כדי למקסם את הסיכוי לקבל תוצאה בעלת ערך.

סחף נתונים

סחף נתונים מתרחש כשנתוני האימון כבר לא מייצגים את המציאות. התנהגות המשתמשים, איסוף הנתונים וסביבת הנתונים יכולים להשתנות בכל שלב, וזה עלול להוביל לירידה בביצועי המודל.

תוכנה דטרמיניסטית

כשמזינים קלט מסוים, תוכנה דטרמיניסטית תמיד תפעל לפי אותה סדרת שלבים כדי להגיע לאותו פלט. אלה סוגי התוכנות הכי אמינים, כי הן צפויות ופועלות ביעילות.

בינה מלאכותית היא לא דטרמיניסטית. הנתיבים והתוצאות יכולים להיות שונים מאוד, גם אם ההנחיות זהות.

פיתוח מבוסס-הערכה (EDD)

מסגרת הפיתוח מבוסס-ההערכה (EDD) מציעה תהליך שניתן לחזור עליו ולבדוק אותו כדי לשפר את התוצאות בשלבים קטנים ובטוחים, לזהות רגרסיות ולהתאים את התנהגות המודל לציפיות של המשתמשים והמוצר לאורך זמן.

אפשר לחשוב על זה כעל פיתוח מונחה-בדיקות (TDD), שמותאם לחוסר הוודאות של AI. בניגוד לבדיקות יחידה דטרמיניסטיות, אי אפשר לקודד מראש הערכות של AI כי הפלט, גם אם הוא תקין וגם אם הוא לא תקין, יכול להיות במגוון צורות שאי אפשר לצפות מראש.

‫AI גנרטיבי

בינה מלאכותית גנרטיבית היא מערכת למידת מכונה שיכולה ליצור תוכן. המשמעות היא שהמודל יכול לכתוב טקסט, ליצור תמונות, ליצור קוד או אפילו לעצב ממשקי משתמש מלאים.

ניהול

אנחנו מתייחסים לשלושה היבטים של פיקוח על AI:

  • פרטיות: טיפול אחראי בנתונים, הסבר על הנתונים שנאספים וצמצום כמות הנתונים שיוצאים מהדפדפן.
  • הוגנות: כדאי לבדוק את המודלים שלכם כדי לוודא שהם לא מפלים (הטיה), וליצור לולאות שמאפשרות למשתמשים לסמן בעיות.
  • אמינות ושקיפות: חשוב לעצב את המערכת כך שתהיה שקופה ואמינה, כדי שהמשתמשים ימשיכו ליהנות ממנה למרות אי-הוודאות והטעויות הפוטנציאליות.

המימד האחרון, אבטחה, הוא מימד חשוב בניהול AI. אנחנו מתכוונים לספק מידע נוסף על אבטחה במודולים עתידיים.

בינתיים, מומלץ לקרוא על Secure AI Framework של Google ‏ (SAIF) ועל בלוג האבטחה של Google.

דגם

מודלים הם הבסיס החשוב ביותר של מערכת AI. בבסיסו, מודל הוא קבוצה של פרמטרים ומבנה שתומכים במערכת שמבצעת חיזויים. אופן הפעולה של המודל יכול להיות שונה בהתאם לסגנון האימון (מפוקח או לא מפוקח) ולמטרת המודל (חיזוי או יצירה).

כרטיס מודל

כרטיסי מודל הם סקירות כלליות מובנות של תהליך התכנון וההערכה של מודל. הם משמשים כארטיפקטים מרכזיים שתומכים בגישה של Google לשימוש אחראי ב-AI.

משקלים של מודלים

משקלים של מודלים הם ערכים מספריים שקובעים את החשיבות של מידע מסוים. הערכים האלה מתעדכנים באופן רציף במהלך אימון המודל, עד שנקבע משקל אידיאלי. אפשר לשנות את המשקלים של מודלים פתוחים, כמו Gemma.

הזדמנויות לשימוש ב-AI

יש כמה קטגוריות שבהן אפשר למסגר פתרונות AI:

  • תובנות: שיפור תהליך קבלת ההחלטות.
  • נוחות: צמצום החיכוך.
  • אוטומציה: החלפת עבודה שחוזרת על עצמה.
  • הגדלה: עזרה למשתמשים במשימות מורכבות או יצירתיות.
  • התאמה אישית: התאמת המוצר לצרכים ולהעדפות של משתמשים ספציפיים.

הנושא הזה מוסבר בהרחבה במאמר התנסות בתרחישים לדוגמה.

פלטפורמות

AI בצד הלקוח פועל ישירות בדפדפן. המשמעות היא שהנתונים יכולים להישאר פרטיים, במכשיר של המשתמש, ואין השהיה ברשת. עם זאת, כדי שה-AI בצד הלקוח יפעל בצורה טובה, צריך תרחישי שימוש מוגדרים היטב וספציפיים מאוד.

AI בצד השרת כולל מודלים שמתארחים בענן ומריצים הסקה בענן. האפשרות הזו יעילה מאוד וניתנת להרחבה, אבל היא יכולה להיות יקרה יותר ונדרש חיבור לרשת.

AI לחיזוי

AI חיזוי (או אנליטי) הוא אוסף של אלגוריתמים שעוזרים להבין נתונים קיימים ולחזות מה צפוי לקרות בהמשך. על סמך דפוסים היסטוריים, מודלים של AI חיזוי לומדים לחזות תוצאות, להציג תובנות ולעזור לקבל החלטות חכמות יותר.

הנדסת הנחיות

הנדסת הנחיות היא פעולה של כתיבה ושכתוב של הנחיות כדי ליצור פלט שתואם לציפיות של המשתמשים. הנחיה כתובה היטב:

  • מציינת איך מודל ה-LLM צריך לבנות את התשובה שלו.
  • הפתרון מורכב מכמה רכיבים שאפשר ליצור להם גרסאות, לבדוק אותם ולשפר אותם לאורך זמן.
  • יכול לשמש כארטיפקט משותף לשיתוף פעולה בין צוותים.

יש מספר טכניקות שאפשר להשתמש בהן בהנדסת הנחיות, ואפשר לקרוא עליהן במודול בנושא הנדסת הנחיות.

סוגי הנחיות

אפשר לחשוב על סוג ההנחיה כקהל של ההנחיה. מידע נוסף על כך זמין במודול בנושא הנדסת הנחיות.

הנחיה למערכת

ההנחיה למערכת מסופקת על ידי מפתחי האפליקציה ומגדירה את ההתנהגות הכוללת של המודל. אפשר להגדיר את התפקיד של המודל ("אתה עוזר בכתיבה"), את הטון הרצוי, את פורמט הפלט (למשל סכימת JSON מדויקת) ואילוצים גלובליים. ההנחיה הזו נשארת יציבה בין הבקשות.

הנחיית משתמש

ההנחיה למשתמש מכילה את הבקשה המיידית שמובילה לפלט. המשתמש מספק משתני קלט כלשהם (כמו בחירת טקסט או סגנון צפוי) ומבקש לבצע משימה ספציפית. לדוגמה, "תציע לי שלושה שמות לפוסט הזה", "תמשיך את הפסקה הזו" או "תנסח את זה בצורה רשמית יותר".