חברת Elastic הודיעה על זמינות jina-embeddings-v5-text, משפחה של שני דגמי embedding קטנים ורב-לשוניים המיועדים ל־Elasticsearch, עם 0.2 מיליארד ו־0.6 מיליארד פרמטרים, שמספקים ביצועים מהשורה הראשונה במגוון משימות חיפוש וסמנטיקה.
למרות גודלם הקומפקטי, דגמים אלו עולים באופן משמעותי על מודלים גדולים בהרבה (7B–14B פרמטרים) ומגיעים לתוצאות מהשורה הראשונה במדד MMTEB (Multilingual MTEB) עבור דגמים בגודל ובמטרה דומים. הגודל הקטן שלהם מאפשר חיפוש היברידי מעולה בעלות תשתית נמוכה יותר, תגובות מהירות יותר לשאילתות ותסריטי פריסה חדשים במצבים של מגבלות זיכרון ומחשב – כולל התקנים בקצה (Edge) וסביבות מוגבלות במשאבים.
דגמי jina-embeddings-v5-text זמינים בערוצים שונים:
-
כמודלים פתוחים ב־HuggingFace לפריסה עצמאית באמצעות vLLM, llama.cpp או MLX
-
ב־Elastic Inference Service (EIS) – שירות inference מהיר ומואץ GPU שמאפשר הרצת מודלים איכותיים ללא הגדרות מורכבות
באמצעות הבאת משפחת Jina v5 ל־EIS, משתמשים מקבלים פלטפורמת נתונים מלאה המאחדת מודלים רב-לשוניים מתקדמים, מסד נתונים וקטורי מהיר ועוד, בתוך סטק אנטרפרייז אחד – בענן או באתר המקומי.
"חיפוש וקטורי, RAG וסוכני AI תלויים באחזור איכותי," אמר Steve Kearns, מנהל כללי, Search, ב־Elastic. "עם הוספת ה־Embeddings הרב-לשוניים של Jina v5, Elasticsearch נשאר הפלטפורמה המובילה להנדסת הקשר מקצה לקצה."
המשפחה כוללת שני דגמים:
-
jina-embeddings-v5-text-small (239M פרמטרים)
-
jina-embeddings-v5-text-nano (677M פרמטרים)
שני הדגמים מותאמים במיוחד לארבע משימות נפוצות ביישומי חיפוש וסוכני AI:
-
אחזור (Retrieval): מאפשר למשתמשים לבצע שאילתות בשפה טבעית ולמצוא את המסמכים הרלוונטיים ביותר
-
התאמת טקסט (Text Matching): מאפשר זיהוי כפילויות, פaraphrases ותיאום תרגומים
-
סיווג (Classification): מאפשר קטלוג מסמכים, זיהוי רגשות, וזיהוי חריגות
-
קיבוץ (Clustering): מאפשר קיבוץ מסמכים לפי נושא, תחום או משמעות
זמינות
דגמי Jina v5 זמינים כעת ב־Elastic Inference Service (EIS) ב־Elastic Cloud Serverless ו־Elastic Cloud Hosted. כל ניסוי Elastic Cloud כולל גישה ל־EIS. לפרטים נוספים: עיין בתיעוד Elastic Inference Service (EIS).
המודלים זמינים גם דרך API מקוון, וניתנים לפריסה מקומית באמצעות vLLM, llama.cpp ו־MLX. הוראות מפורטות זמינות ב־HuggingFace.
אודות Elastic
Elastic (NYSE: ESTC), חברת ה־Search AI, משלבת מומחיות עמוקה בטכנולוגיות חיפוש עם בינה מלאכותית כדי לסייע לכולם להפוך נתונים לתשובות, פעולות ותוצאות. פלטפורמת Search AI של Elastic משמשת אלפי חברות, כולל יותר מ־50% מחברות Fortune 500. למידע נוסף: elastic.co.