30 באוקטובר 2024
הצגת סוכני AI בסביבת הייצור באמצעות Gemini API

פיתוח ופריסה של סוכני AI הם תחום מרגש, אבל כדי לנהל את המערכות המורכבות האלה בסביבת ייצור נדרשת ניראות (observability) חזקה. AgentOps הוא ערכת SDK ל-Python למעקב אחר סוכנים, למעקב אחר עלויות של LLM, לבדיקת ביצועים ועוד. בעזרת AgentOps, מפתחים יכולים להעביר את הסוכנים שלהם מתכנון ראשוני לייצור, במיוחד בשילוב עם העוצמה והיעילות של Gemini API.

היתרון של Gemini
אדם סילברמן (Adam Silverman), מנהל התפעול הראשי של Agency AI, הצוות שמאחורי AgentOps, מסביר שהעלות היא גורם קריטי לארגונים שמפרסים סוכני AI בקנה מידה נרחב. "ראינו ארגונים שמוציאים 80,000 $בחודש על קריאות LLM. ב-Gemini 1.5, עלות הפלט הזה הייתה עומדת על כמה אלפי דולרים".
היעילות הזו, בשילוב עם יכולות היצירה וההבנה החזקות של השפה של Gemini, הופכות אותו לאפשרות אידיאלית למפתחים שמפתחים סוכני AI מתוחכמים. "Gemini 1.5 Flash מספק לנו איכות דומה למודלים גדולים יותר, בחלק קטן מהעלות, והוא מהיר מאוד", אומר סילברמן. כך המפתחים יכולים להתמקד ביצירת תהליכי עבודה מורכבים של סוכני תמיכה עם כמה שלבים, בלי לדאוג לגבי עלויות גבוהות מדי.
"ראינו שהפעלה של סוכן בודד אצל ספקי LLM אחרים עולה יותר מ-500 $להפעלה. אותה הפעלה עם Gemini (1.5 Flash-8B) עולה פחות מ-50$".

הפעלת סוכני AI
AgentOps מתעד נתונים לגבי כל אינטראקציה של סוכן, ולא רק קריאות ל-LLM, ומספק תצוגה מקיפה של אופן הפעולה של מערכות עם סוכנים מרובים. רמת הפירוט הזו חיונית לצוותים של מהנדסים ותאימות, ומספקת תובנות חיוניות לניפוי באגים, לאופטימיזציה ולנתיבי ביקורת.
שילוב של מודלים של Gemini עם AgentOps הוא פשוט להפליא, ובדרך כלל נמשך רק כמה דקות באמצעות LiteLLM. המפתחים יכולים לקבל במהירות תובנות לגבי הקריאות שלהם ל-Gemini API, לעקוב אחרי העלויות בזמן אמת ולהבטיח את האמינות של הסוכנים שלהם בסביבת הייצור.
במבט קדימה
צוות AgentOps מחוייב לתמוך במפתחי נציגים בזמן שהם מרחיבים את הפרויקטים שלהם. ה-AI לסוכנויות עוזר לארגונים להתמודד עם המורכבות של פיתוח סוכני תמיכה נוחים ומותאמים לעומס, ומחזק את היתרונות של השילוב בין AgentOps ל-Gemini API. כפי שסיימון מדגיש, "הדבר מעודד מפתחים שמתחשבים במחירים ליצור סוכנים".
למפתחים ששוקלים להשתמש ב-Gemini, העצה של Silverman ברורה: "תנסו, ותתרשמים".