Native CLI i18n: The TrustGraph CLI has built-in translation support that dynamically loads language strings. You can test and use different languages by simply passing the --lang flag (e.g., --lang es for Spanish, --lang ru for Russian) or by configuring your environment's LANG variable. Automated Docs Translations: This PR introduces autonomously translated Markdown documentation into several target languages, including Spanish, Swahili, Portuguese, Turkish, Hindi, Hebrew, Arabic, Simplified Chinese, and Russian.
6.8 KiB
| layout | title | parent |
|---|---|---|
| default | יסודות ארכיטקטורת גרף ידע | Hebrew (Beta) |
יסודות ארכיטקטורת גרף ידע
Beta Translation: This document was translated via Machine Learning and as such may not be 100% accurate. All non-English languages are currently classified as Beta.
יסוד 1: מודל גרף נושא-תכונה-אובייקט (SPO)
החלטה: לאמץ את מודל SPO/RDF כמודל הייצוג הבסיסי של ידע.
הצדקה: מספק גמישות מרבית ותאימות עם טכנולוגיות גרף קיימות. מאפשר המרה חלקה לשפות שאילתות גרף אחרות (לדוגמה, SPO → Cypher, אך לא להיפך). יוצר בסיס ש"פותח הרבה" יכולות נלוות. תומך הן בקשרים בין צמתים (SPO) והן בקשרים בין צמתים לערכים (RDF).
יישום:
מבנה נתונים מרכזי: node → edge → {node | literal}
שמירה על תאימות לתקני RDF תוך תמיכה בפעולות SPO מורחבות.
יסוד 2: שילוב גרף ידע מותאם למודלי שפה גדולים (LLM)
החלטה: אופטימיזציה של מבנה ותפעול גרף ידע לאינטראקציה עם LLM.
הצדקה: מקרה שימוש עיקרי כולל LLM באינטראקציה עם גרפי ידע. בחירות טכנולוגיות גרף חייבות לתעדף תאימות ל-LLM על פני שיקולים אחרים. מאפשר זרימות עבודה של עיבוד שפה טבעית המנצלות ידע מובנה.
יישום: תכנון סכימות גרף ש-LLM יכולים להסיק מהן בצורה יעילה. אופטימיזציה לדפוסי אינטראקציה נפוצים של LLM.
יסוד 3: ניווט גרף מבוסס הטבעות (Embeddings)
החלטה: יישום מיפוי ישיר משאילתות בשפה טבעית לצמתים בגרף באמצעות הטבעות.
הצדקה: מאפשר את הנתיב הפשוט ביותר משאילת NLP לניווט בגרף. נמנע משלבי יצירת שאילתות ביניים מורכבים. מספק יכולות חיפוש סמנטיות יעילות בתוך מבנה הגרף.
יישום:
NLP Query → Graph Embeddings → Graph Nodes
שמירה על ייצוגי הטבעות עבור כל ישויות הגרף.
תמיכה בהתאמת דמיון סמנטי ישירה לפתרון שאילתות.
יסוד 4: פתרון ישויות מבוזר עם מזהים דטרמיניסטיים
החלטה: תמיכה בחילוץ ידע מקבילי עם זיהוי ישויות דטרמיניסטי (כלל 80%).
הצדקה: אידיאלי: חילוץ בתהליך יחיד עם נראות של מצב מלא מאפשר פתרון ישויות מושלם. מציאות: דרישות סקיילביליות מחייבות יכולות עיבוד מקבילי. פשרה: תכנון לזיהוי ישויות דטרמיניסטי בכל תהליכים מבוזרים.
יישום: פיתוח מנגנונים ליצירת מזהים עקביים וייחודיים בכל חולצי הידע. אותה ישות המוזכרת בתהליכים שונים חייבת להתפרש לאותו מזהה. יש להכיר בכך ש~20% מהמקרים המיוחדים עשויים לדרוש מודלי עיבוד חלופיים. תכנון מנגנוני ברירת מחדל עבור תרחישי פתרון ישויות מורכבים.
יסוד 5: ארכיטקטורה מונעת אירועים עם פרסום-מנוי
החלטה: יישום מערכת הודעות מבוססת פרסום-מנוי לתיאום מערכות.
הצדקה: מאפשר צימוד רופף בין רכיבי חילוץ, אחסון ושאילתות ידע. תומך בעדכונים והתראות בזמן אמת ברחבי המערכת. מקל על זרימות עבודה מבוזרות וניתנות להרחבה.
יישום: תיאום מונחה הודעות בין רכיבי מערכת. זרמי אירועים לעדכוני ידע, השלמת חילוץ ושליחת תוצאות שאילתות.
יסוד 6: תקשורת סוכנים חוזרת
החלטה: תמיכה בפעולות פרסום-מנוי חוזרות לעיבוד מבוסס סוכנים.
הצדקה: מאפשר זרימות עבודה מורכבות של סוכנים שבהם סוכנים יכולים להפעיל ולהגיב זה לזה. תומך בצינורות עיבוד ידע מורכבים, רב-שלביים. מאפשר דפוסי עיבוד רקורסיביים ואיטרטיביים.
יישום: מערכת הפרסום-מנוי חייבת לטפל בשיחות חוזרות בצורה בטוחה. מנגנוני תיאום סוכנים שמונעים לולאות אינסופיות. תמיכה בתיאום זרימות עבודה של סוכנים.
יסוד 7: שילוב עם חנות נתונים טבלאית
החלטה: הבטחת תאימות שאילתות למערכות אחסון טבלאיות.
הצדקה: מאפשר שאילתות אנליטיות יעילות על פני מערכי ידע גדולים. תומך במקרי שימוש של מודיעין עסקי ודיווח. גשר בין ייצוג ידע מבוסס גרף לבין זרימות עבודה אנליטיות מסורתיות.
יישום: שכבת תרגום שאילתות: שאילתות גרף → שאילתות טבלאיות. אסטרטגיית אחסון היברידית התומכת הן בפעולות גרף והן בעומסי עבודה אנליטיים. שמירה על ביצועי שאילתות בשני הפרדיגמות.
--
סיכום עקרונות ארכיטקטורה
- גמישות ראשית: מודל SPO/RDF מספק יכולת הסתגלות מרבית.
- אופטימיזציה ל-LLM: כל החלטות התכנון מתייחסות לאינטראקציה עם LLM.
- ניווט יעיל: שימוש בטבעות (Embeddings) לניווט יעיל בגרף.
- פתרון ישויות מבוזר: תמיכה בחילוץ ידע מקבילי עם מזהים דטרמיניסטיים.
- תיאום מערכות: שימוש במערכת הודעות מבוססת פרסום-מנוי.
- עיבוד סוכנים חוזר: תמיכה בפעולות פרסום-מנוי חוזרות לעיבוד מבוסס סוכנים.
- תאימות שאילתות: הבטחת תאימות שאילתות למערכות אחסון טבלאיות.
יסודות אלה מציבים ארכיטקטורת גרף ידע המאזנת בין דיוק תיאורטי לדרישות מדרגיות מעשיות, ומותאמת לאינטגרציה עם מודלי שפה גדולים (LLM) ולעיבוד מבוזר.