mirror of
https://github.com/trustgraph-ai/trustgraph.git
synced 2026-04-26 00:46:22 +02:00
120 lines
7.9 KiB
Markdown
120 lines
7.9 KiB
Markdown
|
|
---
|
|||
|
|
layout: default
|
|||
|
|
title: "שינויים ב-CLI: מ-v1.8 ל-v2.1"
|
|||
|
|
parent: "Hebrew (Beta)"
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
# שינויים ב-CLI: מ-v1.8 ל-v2.1
|
|||
|
|
|
|||
|
|
> **Beta Translation:** This document was translated via Machine Learning and as such may not be 100% accurate. All non-English languages are currently classified as Beta.
|
|||
|
|
|
|||
|
|
## סיכום
|
|||
|
|
|
|||
|
|
ה-CLI (`trustgraph-cli`) כולל שינויים משמעותיים המתמקדים בשלוש תחומים:
|
|||
|
|
**הסבר/מקוריות**, **גישה להטמעות**, ו**שאילתות גרף**.
|
|||
|
|
שני כלי ישנים הוסרו, אחד שונה שמו, ורבים מכלי קיימים קיבלו יכולות חדשות.
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## כלים חדשים ב-CLI
|
|||
|
|
|
|||
|
|
### הסבר ומקוריות
|
|||
|
|
|
|||
|
|
| פקודה | תיאור |
|
|||
|
|
|---|---|
|
|||
|
|
| `tg-list-explain-traces` | רשימת כל סשנים של הסבר (GraphRAG ו-Agent) בקולקציה, המציגים מזהי סשן, סוג, טקסט שאלה, וחותמות זמן. |
|
|||
|
|
| `tg-show-explain-trace` | מציג את הרשומת ההסבר המלאה לסשן. עבור GraphRAG: שלב השאלה, החקירה, ההתמקדות, והסינתזה. עבור Agent: שלב הסשן, איטרציות (מחשבה/פעולה/תצפית), התשובה הסופית. מזהה אוטומטית את סוג הרשומת. תומך באפשרות `--show-provenance` כדי לעקוב אחר קצוות בחזרה לתיקי המסמך המקוריים. |
|
|||
|
|
| `tg-show-extraction-provenance` | בהתבסס על מזהה מסמך, עובר על שרשרת המקוריות: מסמך -> עמודים -> קטעים -> קצוות, תוך שימוש ביחסים של `prov:wasDerivedFrom`. תומך באפשרויות `--show-content` ו-`--max-content`. |
|
|||
|
|
|
|||
|
|
### הטמעות
|
|||
|
|
|
|||
|
|
| פקודה | תיאור |
|
|||
|
|
|---|---|
|
|||
|
|
| `tg-invoke-embeddings` | ממיר טקסט לייצוג וקטורי באמצעות שירות ההטמעות. מקבל אחד או יותר של קלדי טקסט, ומחזיר וקטורים כרשימות של מספרים ממשיים. |
|
|||
|
|
| `tg-invoke-graph-embeddings` | שאילת ישויות גרף באמצעות טקסט על סמך ייצוגים וקטוריים. מחזיר ישויות תואמות עם ציוני דמיון. |
|
|||
|
|
| `tg-invoke-document-embeddings` | שאילת קטעי מסמך באמצעות טקסט על סמך ייצוגים וקטוריים. מחזיר מזהי קטעים תואמים עם ציוני דמיון. |
|
|||
|
|
| `tg-invoke-row-embeddings` | שאילת שורות של נתונים מובנים על סמך טקסט על שדות מסומנים. מחזיר שורות תואמות עם ערכי אינדקס וציון. דורש `--schema-name` ומקבל תמיכה ב-`--index-name`. |
|
|||
|
|
|
|||
|
|
### שאילתות גרף
|
|||
|
|
|
|||
|
|
| פקודה | תיאור |
|
|||
|
|
|---|---|
|
|||
|
|
| `tg-query-graph` | שאילתת אחסון טריפלים מבוססת תבנית. בניגוד ל-`tg-show-graph` (שמציג הכל), זה מאפשר שאילתות סלקטיביות באמצעות כל שילוב של נושא, תחביר, אובייקט וגרף. מזהה באופן אוטומטי סוגי ערכים: IRI (`http://...`, `urn:...`, `<...>`), טריפלים מוטבעים (`<<s p o>>`), וערכים. |
|
|||
|
|
| `tg-get-document-content` | אחזר תוכן מסמך מהספרייה על סמך מזהה מסמך. יכול להפיק לתיק או ל-stdout, ומטפל גם בתוכן טקסט וגם בתוכן בינארי. |
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## כלים שהוסרו ב-CLI
|
|||
|
|
|
|||
|
|
| פקודה | הערות |
|
|||
|
|
|---|---|
|
|||
|
|
| `tg-load-pdf` | הוסר. טעינת מסמך מטופלת כעת באמצעות הספריה/צינור העיבוד. |
|
|||
|
|
| `tg-load-text` | הוסר. טעינת מסמך מטופלת כעת באמצעות הספריה/צינור העיבוד. |
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## שמות כלים חדשים
|
|||
|
|
|
|||
|
|
| שם ישן | שם חדש | הערות |
|
|||
|
|
|---|---|---|
|
|||
|
|
| `tg-invoke-objects-query` | `tg-invoke-rows-query` | משקף את השינוי בשם המושג מ"אובייקטים" ל"שורות" עבור נתונים מובנים. |
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## שינויים משמעותיים בכלים קיימים
|
|||
|
|
|
|||
|
|
### `tg-invoke-graph-rag`
|
|||
|
|
|
|||
|
|
- **תמיכה בהסבר**: תומך כעת בפונקציית הסבר של 4 שלבים (שאלה, חקירה/התמקדות, סינתזה) עם הצגת אירועי מקוריות מקומיים.
|
|||
|
|
- **זרם**: משתמש בזרם WebSocket עבור פלט בזמן אמת.
|
|||
|
|
- **מעקב אחר מקוריות**: יכול לעקוב אחר קצוות שנבחרו בחזרה למסמכים מקוריים באמצעות ריפוי ושרשראות של `prov:wasDerivedFrom`.
|
|||
|
|
- גדל מ-~30 שורות ל-~760 שורות כדי להסב את כל פונקציית ההסבר.
|
|||
|
|
|
|||
|
|
### `tg-invoke-document-rag`
|
|||
|
|
|
|||
|
|
- **תמיכה בהסבר**: הוספה של מצב `question_explainable()` המפיק תגובות של RAG עבור מסמכים עם אירועי מקוריות מקומיים (שלבי שאלה, חקירה, התמקדות, סינתזה).
|
|||
|
|
|
|||
|
|
### `tg-invoke-agent`
|
|||
|
|
|
|||
|
|
- **תמיכה בהסבר**: הוספת מצב `question_explainable()` המציג אירועי מקוריות במהלך ביצוע סוכן (שלבי שאלה, ניתוח, מסקנה, AgentThought, AgentObservation, AgentAnswer).
|
|||
|
|
- מצב מפורט מציג זרימות של מחשבה/תצפית עם קידומים של סמלים.
|
|||
|
|
|
|||
|
|
### `tg-show-graph`
|
|||
|
|
|
|||
|
|
- **מצב זרימה**: משתמש כעת ב-`triples_query_stream()` עם גדלי אצווה מוגדרים כדי להפחית את זמן התגובה הראשון ולהקטין את צריכת הזיכרון.
|
|||
|
|
- **תמיכה בגרף משמות**: אפשרות חדשה `--graph`. מזהה גרפים משמות:
|
|||
|
|
- גרף ברירת מחדל (ריק): עובדות ידע בסיסיות
|
|||
|
|
- `urn:graph:source`: מקוריות של הסתרה
|
|||
|
|
- `urn:graph:retrieval`: הסבר בזמן שאילתה
|
|||
|
|
- **הצגת עמוד גרף**: תגית חדשה `--show-graph` להצגת הגרף המשמות לכל טריפל.
|
|||
|
|
- **גבולות ניתנים להתאמה**: אפשרויות חדשות `--limit` ו-`--batch-size`.
|
|||
|
|
|
|||
|
|
### `tg-graph-to-turtle`
|
|||
|
|
|
|||
|
|
- **תמיכה ב-RDF-star**: מטפל בטריפלים מוטבעים (ריפוי RDF-star).
|
|||
|
|
- **מצב זרימה**: משתמש בזרם להפחתת זמן התגובה הראשון.
|
|||
|
|
- **טיפול בפורמט חוטי**: מעודכן כדי להשתמש בפורמט החוט החדש (`{"t": "i", "i": uri}` עבור IRI, `{"t": "l", "v": value}` עבור ערכים, `{"t": "r", "r": {...}}` עבור טריפלים מוטבעים).
|
|||
|
|
- **תמיכה בגרף משמות**: אפשרות חדשה `--graph`.
|
|||
|
|
|
|||
|
|
### `tg-set-tool`
|
|||
|
|
|
|||
|
|
- **סוג כלי חדש**: `row-embeddings-query` לשאילתות סמנטיות על אינדקסים של נתונים מובנים.
|
|||
|
|
- **אפשרויות חדשות**: `--schema-name`, `--index-name`, `--limit` כדי להגדיר כלים לשאילתות הטמעות שורות.
|
|||
|
|
|
|||
|
|
### `tg-show-tools`
|
|||
|
|
|
|||
|
|
- מציג את סוג הכלי החדש `row-embeddings-query` עם השדות שלו `schema-name`, `index-name`, ו-`limit`.
|
|||
|
|
|
|||
|
|
### `tg-load-knowledge`
|
|||
|
|
|
|||
|
|
- **דיווח התקדמות**: סופר ומדווח על מספר הטרפולים ועל הקטעי של ישויות המועמסים, לפי קובץ וגם בסך הכל.
|
|||
|
|
- **עדכון פורמט מונח**: קטעי ישויות משתמשים כעת בפורמט המונח החדש (`{"t": "i", "i": uri}`) במקום בפורמט הערך הישן (`{"v": entity, "e": True}`).
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## שינויים שבורים
|
|||
|
|
|
|||
|
|
- **שינוי שמות**: הסכימה `Value` שונתה לשם `Term` בכל המערכת (PR #622). זה משפיע על הציוד שמשתמש בכלי ה-CLI שמתקשר עם מאגר הגרף. הפורמט החדש משתמש ב-`{"t": "i", "i": uri}` עבור IRI ו-`{"t": "l", "v": value}` עבור ערכים, במקום הפורמט הישן `{"v": ..., "e": ...}`.
|
|||
|
|
- **השינוי בשם של `tg-invoke-objects-query`** ל- `tg-invoke-rows-query`.
|
|||
|
|
- **הוסרו `tg-load-pdf` ו-`tg-load-text`.
|