mirror of
https://github.com/trustgraph-ai/trustgraph.git
synced 2026-04-26 00:46:22 +02:00
120 lines
11 KiB
Markdown
120 lines
11 KiB
Markdown
|
|
---
|
|||
|
|
layout: default
|
|||
|
|
title: "Изменения в CLI: v1.8 to v2.1"
|
|||
|
|
parent: "Russian (Beta)"
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
# Изменения в CLI: v1.8 to v2.1
|
|||
|
|
|
|||
|
|
> **Beta Translation:** This document was translated via Machine Learning and as such may not be 100% accurate. All non-English languages are currently classified as Beta.
|
|||
|
|
|
|||
|
|
## Обзор
|
|||
|
|
|
|||
|
|
CLI (`trustgraph-cli`) включает в себя значительные дополнения, ориентированные на три основные темы:
|
|||
|
|
**объяснимость/происхождение**, **доступ к вложениям** и **запросы к графу**.
|
|||
|
|
Два устарелых инструмента были удалены, один был переименован, а несколько существующих инструментов получили новые возможности.
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## Новые инструменты CLI
|
|||
|
|
|
|||
|
|
### Объяснимость и происхождение
|
|||
|
|
|
|||
|
|
| Команда | Описание |
|
|||
|
|
|---------|-------------|
|
|||
|
|
| `tg-list-explain-traces` | Перечисляет все сеансы объяснения (GraphRAG и Agent) в коллекции, показывая идентификаторы сеансов, тип, текст вопроса и временные метки. |
|
|||
|
|
| `tg-show-explain-trace` | Отображает полный трас сеанса объяснения. Для GraphRAG: этапы Вопрос, Исследование, Фокусировка, Синтез. Для Agent: этапы Сеанс, Итерации (мысль/действие/наблюдение), Конечный ответ. Автоматически определяет тип траса. Поддерживает опцию `--show-provenance` для отслеживания связей обратно к исходным документам. |
|
|||
|
|
| `tg-show-extraction-provenance` | Принимает идентификатор документа, проходящего по цепочке происхождения: Документ -> Страницы -> Блоки -> Связи, используя отношения `prov:wasDerivedFrom`. Поддерживает опции `--show-content` и `--max-content`. |
|
|||
|
|
|
|||
|
|
### Вложения
|
|||
|
|
|
|||
|
|
| Команда | Описание |
|
|||
|
|
|---------|-------------|
|
|||
|
|
| `tg-invoke-embeddings` | Преобразует текст в векторное представление посредством сервиса вложений. Принимает один или несколько текстовых входных данных, возвращает векторы в виде списков чисел с плавающей точкой. |
|
|||
|
|
| `tg-invoke-graph-embeddings` | Запрашивает сущности графа по текстовому сходству с использованием векторных представлений. Возвращает соответствующие сущности со значениями сходства. |
|
|||
|
|
| `tg-invoke-document-embeddings` | Запрашивает текстовые блоки документа по текстовому сходству с использованием векторных представлений. Возвращает идентификаторы соответствующих текстовых блоков со значениями сходства. |
|
|||
|
|
| `tg-invoke-row-embeddings` | Запрашивает структурированные данные строк по текстовому сходству в индексированных полях. Возвращает соответствующие строки со значениями индексов и значениями сходства. Требует опции `--schema-name` и поддерживает `--index-name`. |
|
|||
|
|
|
|||
|
|
### Запросы к графу
|
|||
|
|
|
|||
|
|
| Команда | Описание |
|
|||
|
|
|---------|-------------|
|
|||
|
|
| `tg-query-graph` | Запрос хранилища троек на основе шаблона. В отличие от `tg-show-graph` (который отображает всё), это позволяет осуществлять выборочные запросы с использованием любой комбинации субъекта, предиката, объекта и графа. Автоматически определяет типы значений: URI (`http://...`, `urn:...`, `<...>`), закодированные тройки (`<<s p o>>`) и литералы. |
|
|||
|
|
| `tg-get-document-content` | Получает содержимое документа из библиотеки по идентификатору документа. Может отображать в файл или stdout, обрабатывает как текст, так и двоичные данные. |
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## Удаленные инструменты CLI
|
|||
|
|
|
|||
|
|
| Команда | Примечания |
|
|||
|
|
|---------|-------|
|
|||
|
|
| `tg-load-pdf` | Удалено. Загрузка документов теперь осуществляется через библиотеку/процессную цепочку. |
|
|||
|
|
| `tg-load-text` | Удалено. Загрузка документов теперь осуществляется через библиотеку/процессную цепочку. |
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## Переименованные инструменты CLI
|
|||
|
|
|
|||
|
|
| Старое имя | Новое имя | Примечания |
|
|||
|
|
|----------|----------|-------|
|
|||
|
|
| `tg-invoke-objects-query` | `tg-invoke-rows-query` | Отражает изменение терминологии с "объектов" на "строки" для структурированных данных. |
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## Значительные изменения существующих инструментов
|
|||
|
|
|
|||
|
|
### `tg-invoke-graph-rag`
|
|||
|
|
|
|||
|
|
- **Поддержка объяснимости:** Поддерживает четырехэтапную пайплайн объяснения (Вопрос, Поиск/Исследование, Фокусировка, Синтез) с отображением событий происхождения.
|
|||
|
|
- **Стриминг:** Использует стриминг WebSocket для получения результатов в реальном времени.
|
|||
|
|
- **Отслеживание происхождения:** Может отслеживать выбранные связи обратно к исходным документам с использованием рефикации и цепочек `prov:wasDerivedFrom`.
|
|||
|
|
- Увеличился размер кода с ~30 строк до ~760 строк, чтобы вместить полный пайплайн объяснения.
|
|||
|
|
|
|||
|
|
### `tg-invoke-document-rag`
|
|||
|
|
|
|||
|
|
- **Поддержка объяснимости:** Добавлен режим `question_explainable()`, который отображает ответы RAG для документов со встроенными событиями происхождения (этапы Вопрос, Поиск, Исследование, Синтез).
|
|||
|
|
|
|||
|
|
### `tg-invoke-agent`
|
|||
|
|
|
|||
|
|
- **Поддержка объяснимости:** Добавлен режим `question_explainable()`, который отображает происхождение во время выполнения агента (этапы Вопрос, Анализ, Вывод, AgentThought, AgentObservation, AgentAnswer).
|
|||
|
|
- Режим "verbose" показывает потоки мыслей/наблюдений с префиксами эмодзи.
|
|||
|
|
|
|||
|
|
### `tg-show-graph`
|
|||
|
|
|
|||
|
|
- **Режим стриминга:** Теперь использует `triples_query_stream()` с настраиваемыми размерами пакетов для более быстрого получения первого результата и снижения использования памяти.
|
|||
|
|
- **Поддержка именованного графа:** Новая опция `--graph`. Распознает именованные графы:
|
|||
|
|
- Основной граф (пустой): Основные факты знаний
|
|||
|
|
- `urn:graph:source`: Происхождение извлечения
|
|||
|
|
- `urn:graph:retrieval`: Объяснение в момент запроса
|
|||
|
|
- **Отображение столбца графа:** Ножная опция `--show-graph` для отображения именованного графа для каждой тройки.
|
|||
|
|
- **Конфигурируемые лимиты:** Новые опции `--limit` и `--batch-size`.
|
|||
|
|
|
|||
|
|
### `tg-graph-to-turtle`
|
|||
|
|
|
|||
|
|
- **Поддержка RDF-star:** Теперь обрабатывает закодированные тройки (рефикация RDF-star).
|
|||
|
|
- **Режим стриминга:** Использует стриминг для более быстрого получения первого результата.
|
|||
|
|
- **Обработка формата wire:** Обновлено для использования нового формата wire (`{"t": "i", "i": uri}` для URI, `{"t": "l", "v": value}` для литералов, `{"t": "r", "r": {...}}` для закодированных троек).
|
|||
|
|
- **Поддержка именованного графа:** Новая опция `--graph`.
|
|||
|
|
|
|||
|
|
### `tg-set-tool`
|
|||
|
|
|
|||
|
|
- **Новый тип инструмента:** `row-embeddings-query` для семантического поиска по индексированным структурированным данным.
|
|||
|
|
- **Новые опции:** `--schema-name`, `--index-name`, `--limit` для настройки инструментов запроса вложений строк.
|
|||
|
|
|
|||
|
|
### `tg-show-tools`
|
|||
|
|
|
|||
|
|
- Отображает новый тип инструмента `row-embeddings-query` с его полями `schema-name`, `index-name` и `limit`.
|
|||
|
|
|
|||
|
|
### `tg-load-knowledge`
|
|||
|
|
|
|||
|
|
- **Отчет о прогрессе:** Теперь считает и отображает количество загруженных троек и контекстов сущностей в файл и в целом.
|
|||
|
|
- **Обновление формата термина:** Контексты сущностей теперь используют новый формат термина (`{"t": "i", "i": uri}`) вместо старого формата значения (`{"v": ..., "e": ...}`).
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## Разрывные изменения
|
|||
|
|
|
|||
|
|
- **Переименование терминологии:** Схема `Value` была переименована в `Term` во всей системе (PR #622). Это влияет на формат wire, используемый инструментами CLI, взаимодействующими с хранилищем графов. Новый формат использует `{"t": "i", "i": uri}` для URI и `{"t": "l", "v": value}` для литералов, заменяя старый формат `{"v": ..., "e": ...}`.
|
|||
|
|
- **`tg-invoke-objects-query` переименовано** в `tg-invoke-rows-query`.
|
|||
|
|
- **`tg-load-pdf` и `tg-load-text` удалены**.
|