trustgraph/docs/cli-changes-v1.8-to-v2.1.ru.md

120 lines
11 KiB
Markdown
Raw Normal View History

---
layout: default
title: "Изменения в CLI: v1.8 to v2.1"
parent: "Russian (Beta)"
---
# Изменения в CLI: v1.8 to v2.1
> **Beta Translation:** This document was translated via Machine Learning and as such may not be 100% accurate. All non-English languages are currently classified as Beta.
## Обзор
CLI (`trustgraph-cli`) включает в себя значительные дополнения, ориентированные на три основные темы:
**объяснимость/происхождение**, **доступ к вложениям** и **запросы к графу**.
Два устарелых инструмента были удалены, один был переименован, а несколько существующих инструментов получили новые возможности.
---
## Новые инструменты CLI
### Объяснимость и происхождение
| Команда | Описание |
|---------|-------------|
| `tg-list-explain-traces` | Перечисляет все сеансы объяснения (GraphRAG и Agent) в коллекции, показывая идентификаторы сеансов, тип, текст вопроса и временные метки. |
| `tg-show-explain-trace` | Отображает полный трас сеанса объяснения. Для GraphRAG: этапы Вопрос, Исследование, Фокусировка, Синтез. Для Agent: этапы Сеанс, Итерации (мысль/действие/наблюдение), Конечный ответ. Автоматически определяет тип траса. Поддерживает опцию `--show-provenance` для отслеживания связей обратно к исходным документам. |
| `tg-show-extraction-provenance` | Принимает идентификатор документа, проходящего по цепочке происхождения: Документ -> Страницы -> Блоки -> Связи, используя отношения `prov:wasDerivedFrom`. Поддерживает опции `--show-content` и `--max-content`. |
### Вложения
| Команда | Описание |
|---------|-------------|
| `tg-invoke-embeddings` | Преобразует текст в векторное представление посредством сервиса вложений. Принимает один или несколько текстовых входных данных, возвращает векторы в виде списков чисел с плавающей точкой. |
| `tg-invoke-graph-embeddings` | Запрашивает сущности графа по текстовому сходству с использованием векторных представлений. Возвращает соответствующие сущности со значениями сходства. |
| `tg-invoke-document-embeddings` | Запрашивает текстовые блоки документа по текстовому сходству с использованием векторных представлений. Возвращает идентификаторы соответствующих текстовых блоков со значениями сходства. |
| `tg-invoke-row-embeddings` | Запрашивает структурированные данные строк по текстовому сходству в индексированных полях. Возвращает соответствующие строки со значениями индексов и значениями сходства. Требует опции `--schema-name` и поддерживает `--index-name`. |
### Запросы к графу
| Команда | Описание |
|---------|-------------|
| `tg-query-graph` | Запрос хранилища троек на основе шаблона. В отличие от `tg-show-graph` (который отображает всё), это позволяет осуществлять выборочные запросы с использованием любой комбинации субъекта, предиката, объекта и графа. Автоматически определяет типы значений: URI (`http://...`, `urn:...`, `<...>`), закодированные тройки (`<<s p o>>`) и литералы. |
| `tg-get-document-content` | Получает содержимое документа из библиотеки по идентификатору документа. Может отображать в файл или stdout, обрабатывает как текст, так и двоичные данные. |
---
## Удаленные инструменты CLI
| Команда | Примечания |
|---------|-------|
| `tg-load-pdf` | Удалено. Загрузка документов теперь осуществляется через библиотеку/процессную цепочку. |
| `tg-load-text` | Удалено. Загрузка документов теперь осуществляется через библиотеку/процессную цепочку. |
---
## Переименованные инструменты CLI
| Старое имя | Новое имя | Примечания |
|----------|----------|-------|
| `tg-invoke-objects-query` | `tg-invoke-rows-query` | Отражает изменение терминологии с "объектов" на "строки" для структурированных данных. |
---
## Значительные изменения существующих инструментов
### `tg-invoke-graph-rag`
- **Поддержка объяснимости:** Поддерживает четырехэтапную пайплайн объяснения (Вопрос, Поиск/Исследование, Фокусировка, Синтез) с отображением событий происхождения.
- **Стриминг:** Использует стриминг WebSocket для получения результатов в реальном времени.
- **Отслеживание происхождения:** Может отслеживать выбранные связи обратно к исходным документам с использованием рефикации и цепочек `prov:wasDerivedFrom`.
- Увеличился размер кода с ~30 строк до ~760 строк, чтобы вместить полный пайплайн объяснения.
### `tg-invoke-document-rag`
- **Поддержка объяснимости:** Добавлен режим `question_explainable()`, который отображает ответы RAG для документов со встроенными событиями происхождения (этапы Вопрос, Поиск, Исследование, Синтез).
### `tg-invoke-agent`
- **Поддержка объяснимости:** Добавлен режим `question_explainable()`, который отображает происхождение во время выполнения агента (этапы Вопрос, Анализ, Вывод, AgentThought, AgentObservation, AgentAnswer).
- Режим "verbose" показывает потоки мыслей/наблюдений с префиксами эмодзи.
### `tg-show-graph`
- **Режим стриминга:** Теперь использует `triples_query_stream()` с настраиваемыми размерами пакетов для более быстрого получения первого результата и снижения использования памяти.
- **Поддержка именованного графа:** Новая опция `--graph`. Распознает именованные графы:
- Основной граф (пустой): Основные факты знаний
- `urn:graph:source`: Происхождение извлечения
- `urn:graph:retrieval`: Объяснение в момент запроса
- **Отображение столбца графа:** Ножная опция `--show-graph` для отображения именованного графа для каждой тройки.
- **Конфигурируемые лимиты:** Новые опции `--limit` и `--batch-size`.
### `tg-graph-to-turtle`
- **Поддержка RDF-star:** Теперь обрабатывает закодированные тройки (рефикация RDF-star).
- **Режим стриминга:** Использует стриминг для более быстрого получения первого результата.
- **Обработка формата wire:** Обновлено для использования нового формата wire (`{"t": "i", "i": uri}` для URI, `{"t": "l", "v": value}` для литералов, `{"t": "r", "r": {...}}` для закодированных троек).
- **Поддержка именованного графа:** Новая опция `--graph`.
### `tg-set-tool`
- **Новый тип инструмента:** `row-embeddings-query` для семантического поиска по индексированным структурированным данным.
- **Новые опции:** `--schema-name`, `--index-name`, `--limit` для настройки инструментов запроса вложений строк.
### `tg-show-tools`
- Отображает новый тип инструмента `row-embeddings-query` с его полями `schema-name`, `index-name` и `limit`.
### `tg-load-knowledge`
- **Отчет о прогрессе:** Теперь считает и отображает количество загруженных троек и контекстов сущностей в файл и в целом.
- **Обновление формата термина:** Контексты сущностей теперь используют новый формат термина (`{"t": "i", "i": uri}`) вместо старого формата значения (`{"v": ..., "e": ...}`).
---
## Разрывные изменения
- **Переименование терминологии:** Схема `Value` была переименована в `Term` во всей системе (PR #622). Это влияет на формат wire, используемый инструментами CLI, взаимодействующими с хранилищем графов. Новый формат использует `{"t": "i", "i": uri}` для URI и `{"t": "l", "v": value}` для литералов, заменяя старый формат `{"v": ..., "e": ...}`.
- **`tg-invoke-objects-query` переименовано** в `tg-invoke-rows-query`.
- **`tg-load-pdf` и `tg-load-text` удалены**.