mirror of
https://github.com/trustgraph-ai/trustgraph.git
synced 2026-04-25 16:36:21 +02:00
Native CLI i18n: The TrustGraph CLI has built-in translation support that dynamically loads language strings. You can test and use different languages by simply passing the --lang flag (e.g., --lang es for Spanish, --lang ru for Russian) or by configuring your environment's LANG variable. Automated Docs Translations: This PR introduces autonomously translated Markdown documentation into several target languages, including Spanish, Swahili, Portuguese, Turkish, Hindi, Hebrew, Arabic, Simplified Chinese, and Russian.
147 lines
8.5 KiB
Markdown
147 lines
8.5 KiB
Markdown
---
|
|
layout: default
|
|
title: "संरचित डेटा पल्सर स्कीमा परिवर्तन"
|
|
parent: "Hindi (Beta)"
|
|
---
|
|
|
|
# संरचित डेटा पल्सर स्कीमा परिवर्तन
|
|
|
|
> **Beta Translation:** This document was translated via Machine Learning and as such may not be 100% accurate. All non-English languages are currently classified as Beta.
|
|
|
|
## अवलोकन
|
|
|
|
`STRUCTURED_DATA.md` विनिर्देश के आधार पर, यह दस्तावेज़ आवश्यक पल्सर स्कीमा परिवर्धन और संशोधन प्रस्तावित करता है ताकि ट्रस्टग्राफ में संरचित डेटा क्षमताओं का समर्थन किया जा सके।
|
|
|
|
## आवश्यक स्कीमा परिवर्तन
|
|
|
|
### 1. कोर स्कीमा संवर्द्धन
|
|
|
|
#### उन्नत फ़ील्ड परिभाषा
|
|
`core/primitives.py` में मौजूदा `Field` वर्ग में अतिरिक्त गुण होने चाहिए:
|
|
|
|
```python
|
|
class Field(Record):
|
|
name = String()
|
|
type = String() # int, string, long, bool, float, double, timestamp
|
|
size = Integer()
|
|
primary = Boolean()
|
|
description = String()
|
|
# नए फ़ील्ड:
|
|
required = Boolean() # क्या फ़ील्ड अनिवार्य है
|
|
enum_values = Array(String()) # एनम प्रकार के फ़ील्ड के लिए
|
|
indexed = Boolean() # क्या फ़ील्ड को अनुक्रमित किया जाना चाहिए
|
|
```
|
|
|
|
### 2. नई ज्ञान स्कीमा
|
|
|
|
#### 2.1 संरचित डेटा सबमिशन
|
|
नई फ़ाइल: `knowledge/structured.py`
|
|
|
|
```python
|
|
from pulsar.schema import Record, String, Bytes, Map
|
|
from ..core.metadata import Metadata
|
|
|
|
class StructuredDataSubmission(Record):
|
|
metadata = Metadata()
|
|
format = String() # "json", "csv", "xml"
|
|
schema_name = String() # कॉन्फ़िगरेशन में स्कीमा का संदर्भ
|
|
data = Bytes() # संसाधित करने के लिए कच्चा डेटा
|
|
options = Map(String()) # प्रारूप-विशिष्ट विकल्प
|
|
```
|
|
|
|
### 3. नई सेवा स्कीमा
|
|
|
|
#### 3.1 एनएलपी से संरचित क्वेरी सेवा
|
|
नई फ़ाइल: `services/nlp_query.py`
|
|
|
|
```python
|
|
from pulsar.schema import Record, String, Array, Map, Integer, Double
|
|
from ..core.primitives import Error
|
|
|
|
class NLPToStructuredQueryRequest(Record):
|
|
natural_language_query = String()
|
|
max_results = Integer()
|
|
context_hints = Map(String()) # क्वेरी पीढ़ी के लिए वैकल्पिक संदर्भ
|
|
|
|
class NLPToStructuredQueryResponse(Record):
|
|
error = Error()
|
|
graphql_query = String() # उत्पन्न ग्राफ़क्यूएल क्वेरी
|
|
variables = Map(String()) # यदि कोई हो तो ग्राफ़क्यूएल चर
|
|
detected_schemas = Array(String()) # कौन सी स्कीमा क्वेरी को लक्षित करती हैं
|
|
confidence = Double()
|
|
```
|
|
|
|
#### 3.2 संरचित क्वेरी सेवा
|
|
नई फ़ाइल: `services/structured_query.py`
|
|
|
|
```python
|
|
from pulsar.schema import Record, String, Map, Array
|
|
from ..core.primitives import Error
|
|
|
|
class StructuredQueryRequest(Record):
|
|
query = String() # ग्राफ़क्यूएल क्वेरी
|
|
variables = Map(String()) # ग्राफ़क्यूएल चर
|
|
operation_name = String() # मल्टी-ऑपरेशन दस्तावेजों के लिए वैकल्पिक ऑपरेशन नाम
|
|
|
|
class StructuredQueryResponse(Record):
|
|
error = Error()
|
|
data = String() # JSON-एन्कोडेड ग्राफ़क्यूएल प्रतिक्रिया डेटा
|
|
errors = Array(String()) # यदि कोई हो तो ग्राफ़क्यूएल त्रुटियां
|
|
```
|
|
|
|
#### 2.2 ऑब्जेक्ट निष्कर्षण आउटपुट
|
|
नई फ़ाइल: `knowledge/object.py`
|
|
|
|
```python
|
|
from pulsar.schema import Record, String, Map, Double
|
|
from ..core.metadata import Metadata
|
|
|
|
class ExtractedObject(Record):
|
|
metadata = Metadata()
|
|
schema_name = String() # यह ऑब्जेक्ट किस स्कीमा से संबंधित है
|
|
values = Map(String()) # फ़ील्ड नाम -> मान
|
|
confidence = Double()
|
|
source_span = String() # पाठ का वह भाग जहां ऑब्जेक्ट पाया गया था
|
|
```
|
|
|
|
### 4. उन्नत ज्ञान स्कीमा
|
|
|
|
#### 4.1 ऑब्जेक्ट एम्बेडिंग संवर्द्धन
|
|
संरचित ऑब्जेक्ट एम्बेडिंग को बेहतर ढंग से समर्थन करने के लिए `knowledge/embeddings.py` को अपडेट करें:
|
|
|
|
```python
|
|
class StructuredObjectEmbedding(Record):
|
|
metadata = Metadata()
|
|
vectors = Array(Array(Double()))
|
|
schema_name = String()
|
|
object_id = String() # प्राथमिक कुंजी मान
|
|
field_embeddings = Map(Array(Double())) # प्रति-फ़ील्ड एम्बेडिंग
|
|
```
|
|
|
|
## एकीकरण बिंदु
|
|
|
|
### फ्लो एकीकरण
|
|
|
|
इन स्कीमा का उपयोग नए फ्लो मॉड्यूल द्वारा किया जाएगा:
|
|
- `trustgraph-flow/trustgraph/decoding/structured` - `StructuredDataSubmission` का उपयोग करता है
|
|
- `trustgraph-flow/trustgraph/query/nlp_query/cassandra` - एनएलपी क्वेरी स्कीमा का उपयोग करता है
|
|
- `trustgraph-flow/trustgraph/query/objects/cassandra` - संरचित क्वेरी स्कीमा का उपयोग करता है
|
|
- `trustgraph-flow/trustgraph/extract/object/row/` - `Chunk` का उपभोग करता है, `ExtractedObject` उत्पन्न करता है
|
|
- `trustgraph-flow/trustgraph/storage/objects/cassandra` - `Rows` स्कीमा का उपयोग करता है
|
|
- `trustgraph-flow/trustgraph/embeddings/object_embeddings/qdrant` - ऑब्जेक्ट एम्बेडिंग स्कीमा का उपयोग करता है
|
|
|
|
## कार्यान्वयन नोट्स
|
|
|
|
1. **स्कीमा संस्करण:** भविष्य के माइग्रेशन समर्थन के लिए `RowSchema` में एक `version` फ़ील्ड जोड़ने पर विचार करें।
|
|
2. **प्रकार प्रणाली:** `Field.type` को सभी कैसेंड्रा मूल प्रकारों का समर्थन करना चाहिए।
|
|
3. **बैच ऑपरेशन:** अधिकांश सेवाओं को एकल और बैच दोनों ऑपरेशन का समर्थन करना चाहिए।
|
|
4. **त्रुटि प्रबंधन:** सभी नई सेवाओं में सुसंगत त्रुटि रिपोर्टिंग।
|
|
5. **पिछड़ा संगतता:** मौजूदा स्कीमा अपरिवर्तित रहते हैं, केवल छोटे फ़ील्ड संवर्द्धन को छोड़कर।
|
|
|
|
## अगले कदम
|
|
|
|
1. नई संरचना में स्कीमा फ़ाइलें लागू करें।
|
|
2. मौजूदा सेवाओं को नए स्कीमा प्रकारों को पहचानने के लिए अपडेट करें।
|
|
3. इन स्कीमा का उपयोग करने वाले फ्लो मॉड्यूल लागू करें।
|
|
4. नई सेवाओं के लिए गेटवे/रिवर्स-गेटवे एंडपॉइंट बनाएं।
|
|
5. स्कीमा सत्यापन के लिए यूनिट परीक्षण बनाएं।
|