trustgraph/docs/tech-specs/architecture-principles.he.md
Alex Jenkins 8954fa3ad7 Feat: TrustGraph i18n & Documentation Translation Updates (#781)
Native CLI i18n: The TrustGraph CLI has built-in translation support
that dynamically loads language strings. You can test and use
different languages by simply passing the --lang flag (e.g., --lang
es for Spanish, --lang ru for Russian) or by configuring your
environment's LANG variable.

Automated Docs Translations: This PR introduces autonomously
translated Markdown documentation into several target languages,
including Spanish, Swahili, Portuguese, Turkish, Hindi, Hebrew,
Arabic, Simplified Chinese, and Russian.
2026-04-14 12:08:32 +01:00

6.8 KiB

layout title parent
default יסודות ארכיטקטורת גרף ידע Hebrew (Beta)

יסודות ארכיטקטורת גרף ידע

Beta Translation: This document was translated via Machine Learning and as such may not be 100% accurate. All non-English languages are currently classified as Beta.

יסוד 1: מודל גרף נושא-תכונה-אובייקט (SPO)

החלטה: לאמץ את מודל SPO/RDF כמודל הייצוג הבסיסי של ידע.

הצדקה: מספק גמישות מרבית ותאימות עם טכנולוגיות גרף קיימות. מאפשר המרה חלקה לשפות שאילתות גרף אחרות (לדוגמה, SPO → Cypher, אך לא להיפך). יוצר בסיס ש"פותח הרבה" יכולות נלוות. תומך הן בקשרים בין צמתים (SPO) והן בקשרים בין צמתים לערכים (RDF).

יישום: מבנה נתונים מרכזי: node → edge → {node | literal} שמירה על תאימות לתקני RDF תוך תמיכה בפעולות SPO מורחבות.

יסוד 2: שילוב גרף ידע מותאם למודלי שפה גדולים (LLM)

החלטה: אופטימיזציה של מבנה ותפעול גרף ידע לאינטראקציה עם LLM.

הצדקה: מקרה שימוש עיקרי כולל LLM באינטראקציה עם גרפי ידע. בחירות טכנולוגיות גרף חייבות לתעדף תאימות ל-LLM על פני שיקולים אחרים. מאפשר זרימות עבודה של עיבוד שפה טבעית המנצלות ידע מובנה.

יישום: תכנון סכימות גרף ש-LLM יכולים להסיק מהן בצורה יעילה. אופטימיזציה לדפוסי אינטראקציה נפוצים של LLM.

יסוד 3: ניווט גרף מבוסס הטבעות (Embeddings)

החלטה: יישום מיפוי ישיר משאילתות בשפה טבעית לצמתים בגרף באמצעות הטבעות.

הצדקה: מאפשר את הנתיב הפשוט ביותר משאילת NLP לניווט בגרף. נמנע משלבי יצירת שאילתות ביניים מורכבים. מספק יכולות חיפוש סמנטיות יעילות בתוך מבנה הגרף.

יישום: NLP Query → Graph Embeddings → Graph Nodes שמירה על ייצוגי הטבעות עבור כל ישויות הגרף. תמיכה בהתאמת דמיון סמנטי ישירה לפתרון שאילתות.

יסוד 4: פתרון ישויות מבוזר עם מזהים דטרמיניסטיים

החלטה: תמיכה בחילוץ ידע מקבילי עם זיהוי ישויות דטרמיניסטי (כלל 80%).

הצדקה: אידיאלי: חילוץ בתהליך יחיד עם נראות של מצב מלא מאפשר פתרון ישויות מושלם. מציאות: דרישות סקיילביליות מחייבות יכולות עיבוד מקבילי. פשרה: תכנון לזיהוי ישויות דטרמיניסטי בכל תהליכים מבוזרים.

יישום: פיתוח מנגנונים ליצירת מזהים עקביים וייחודיים בכל חולצי הידע. אותה ישות המוזכרת בתהליכים שונים חייבת להתפרש לאותו מזהה. יש להכיר בכך ש~20% מהמקרים המיוחדים עשויים לדרוש מודלי עיבוד חלופיים. תכנון מנגנוני ברירת מחדל עבור תרחישי פתרון ישויות מורכבים.

יסוד 5: ארכיטקטורה מונעת אירועים עם פרסום-מנוי

החלטה: יישום מערכת הודעות מבוססת פרסום-מנוי לתיאום מערכות.

הצדקה: מאפשר צימוד רופף בין רכיבי חילוץ, אחסון ושאילתות ידע. תומך בעדכונים והתראות בזמן אמת ברחבי המערכת. מקל על זרימות עבודה מבוזרות וניתנות להרחבה.

יישום: תיאום מונחה הודעות בין רכיבי מערכת. זרמי אירועים לעדכוני ידע, השלמת חילוץ ושליחת תוצאות שאילתות.

יסוד 6: תקשורת סוכנים חוזרת

החלטה: תמיכה בפעולות פרסום-מנוי חוזרות לעיבוד מבוסס סוכנים.

הצדקה: מאפשר זרימות עבודה מורכבות של סוכנים שבהם סוכנים יכולים להפעיל ולהגיב זה לזה. תומך בצינורות עיבוד ידע מורכבים, רב-שלביים. מאפשר דפוסי עיבוד רקורסיביים ואיטרטיביים.

יישום: מערכת הפרסום-מנוי חייבת לטפל בשיחות חוזרות בצורה בטוחה. מנגנוני תיאום סוכנים שמונעים לולאות אינסופיות. תמיכה בתיאום זרימות עבודה של סוכנים.

יסוד 7: שילוב עם חנות נתונים טבלאית

החלטה: הבטחת תאימות שאילתות למערכות אחסון טבלאיות.

הצדקה: מאפשר שאילתות אנליטיות יעילות על פני מערכי ידע גדולים. תומך במקרי שימוש של מודיעין עסקי ודיווח. גשר בין ייצוג ידע מבוסס גרף לבין זרימות עבודה אנליטיות מסורתיות.

יישום: שכבת תרגום שאילתות: שאילתות גרף → שאילתות טבלאיות. אסטרטגיית אחסון היברידית התומכת הן בפעולות גרף והן בעומסי עבודה אנליטיים. שמירה על ביצועי שאילתות בשני הפרדיגמות.

--

סיכום עקרונות ארכיטקטורה

  1. גמישות ראשית: מודל SPO/RDF מספק יכולת הסתגלות מרבית.
  2. אופטימיזציה ל-LLM: כל החלטות התכנון מתייחסות לאינטראקציה עם LLM.
  3. ניווט יעיל: שימוש בטבעות (Embeddings) לניווט יעיל בגרף.
  4. פתרון ישויות מבוזר: תמיכה בחילוץ ידע מקבילי עם מזהים דטרמיניסטיים.
  5. תיאום מערכות: שימוש במערכת הודעות מבוססת פרסום-מנוי.
  6. עיבוד סוכנים חוזר: תמיכה בפעולות פרסום-מנוי חוזרות לעיבוד מבוסס סוכנים.
  7. תאימות שאילתות: הבטחת תאימות שאילתות למערכות אחסון טבלאיות.

יסודות אלה מציבים ארכיטקטורת גרף ידע המאזנת בין דיוק תיאורטי לדרישות מדרגיות מעשיות, ומותאמת לאינטגרציה עם מודלי שפה גדולים (LLM) ולעיבוד מבוזר.