mirror of
https://github.com/trustgraph-ai/trustgraph.git
synced 2026-04-25 16:36:21 +02:00
Native CLI i18n: The TrustGraph CLI has built-in translation support that dynamically loads language strings. You can test and use different languages by simply passing the --lang flag (e.g., --lang es for Spanish, --lang ru for Russian) or by configuring your environment's LANG variable. Automated Docs Translations: This PR introduces autonomously translated Markdown documentation into several target languages, including Spanish, Swahili, Portuguese, Turkish, Hindi, Hebrew, Arabic, Simplified Chinese, and Russian.
367 lines
24 KiB
Markdown
367 lines
24 KiB
Markdown
---
|
|
layout: default
|
|
title: "नियो4जे उपयोगकर्ता/संग्रह अलगाव समर्थन"
|
|
parent: "Hindi (Beta)"
|
|
---
|
|
|
|
# नियो4जे उपयोगकर्ता/संग्रह अलगाव समर्थन
|
|
|
|
> **Beta Translation:** This document was translated via Machine Learning and as such may not be 100% accurate. All non-English languages are currently classified as Beta.
|
|
|
|
## समस्या विवरण
|
|
|
|
नियो4जे का त्रिगुट भंडारण और क्वेरी कार्यान्वयन वर्तमान में उपयोगकर्ता/संग्रह अलगाव की कमी रखता है, जो एक बहु-किरायेदारी सुरक्षा समस्या पैदा करता है। सभी त्रिगुट एक ही ग्राफ स्पेस में संग्रहीत होते हैं, बिना किसी ऐसी तंत्र के जो उपयोगकर्ताओं को अन्य उपयोगकर्ताओं के डेटा तक पहुंचने या संग्रहों को मिलाने से रोकता हो।
|
|
|
|
ट्रस्टग्राफ में अन्य स्टोरेज बैकएंड के विपरीत:
|
|
**कैसेंड्रा**: प्रत्येक उपयोगकर्ता के लिए अलग-अलग कीस्पेस और प्रत्येक संग्रह के लिए टेबल का उपयोग करता है।
|
|
**वेक्टर स्टोर** (मिलवस, क्यूड्रांट, पाइनकोन): संग्रह-विशिष्ट नेमस्पेस का उपयोग करते हैं।
|
|
**नियो4जे**: वर्तमान में सभी डेटा को एक ही ग्राफ में साझा करता है (सुरक्षा भेद्यता)।
|
|
|
|
## वर्तमान आर्किटेक्चर
|
|
|
|
### डेटा मॉडल
|
|
**नोड्स**: `:Node` लेबल के साथ `uri` प्रॉपर्टी, `:Literal` लेबल के साथ `value` प्रॉपर्टी।
|
|
**रिलेशनशिप्स**: `:Rel` लेबल के साथ `uri` प्रॉपर्टी।
|
|
**इंडेक्स**: `Node.uri`, `Literal.value`, `Rel.uri`।
|
|
|
|
### संदेश प्रवाह
|
|
`Triples` संदेशों में `metadata.user` और `metadata.collection` फ़ील्ड होते हैं।
|
|
स्टोरेज सेवा उपयोगकर्ता/संग्रह जानकारी प्राप्त करती है लेकिन इसे अनदेखा करती है।
|
|
क्वेरी सेवा `TriplesQueryRequest` में `user` और `collection` की अपेक्षा करती है लेकिन उन्हें अनदेखा करती है।
|
|
|
|
### वर्तमान सुरक्षा समस्या
|
|
```cypher
|
|
# Any user can query any data - no isolation
|
|
MATCH (src:Node)-[rel:Rel]->(dest:Node)
|
|
RETURN src.uri, rel.uri, dest.uri
|
|
```
|
|
|
|
## प्रस्तावित समाधान: प्रॉपर्टी-आधारित फ़िल्टरिंग (अनुशंसित)
|
|
|
|
### अवलोकन
|
|
सभी नोड्स और संबंधों में `user` और `collection` प्रॉपर्टीज़ जोड़ें, और फिर सभी ऑपरेशन्स को इन प्रॉपर्टीज़ के आधार पर फ़िल्टर करें। यह दृष्टिकोण मजबूत अलगाव प्रदान करता है, जबकि क्वेरी लचीलापन और पिछड़े अनुकूलता को बनाए रखता है।
|
|
|
|
### डेटा मॉडल परिवर्तन
|
|
|
|
#### उन्नत नोड संरचना
|
|
```cypher
|
|
// Node entities
|
|
CREATE (n:Node {
|
|
uri: "http://example.com/entity1",
|
|
user: "john_doe",
|
|
collection: "production_v1"
|
|
})
|
|
|
|
// Literal entities
|
|
CREATE (n:Literal {
|
|
value: "literal value",
|
|
user: "john_doe",
|
|
collection: "production_v1"
|
|
})
|
|
```
|
|
|
|
#### उन्नत संबंध संरचना
|
|
```cypher
|
|
// Relationships with user/collection properties
|
|
CREATE (src)-[:Rel {
|
|
uri: "http://example.com/predicate1",
|
|
user: "john_doe",
|
|
collection: "production_v1"
|
|
}]->(dest)
|
|
```
|
|
|
|
#### अद्यतित अनुक्रमणिकाएँ
|
|
```cypher
|
|
// Compound indexes for efficient filtering
|
|
CREATE INDEX node_user_collection_uri FOR (n:Node) ON (n.user, n.collection, n.uri);
|
|
CREATE INDEX literal_user_collection_value FOR (n:Literal) ON (n.user, n.collection, n.value);
|
|
CREATE INDEX rel_user_collection_uri FOR ()-[r:Rel]-() ON (r.user, r.collection, r.uri);
|
|
|
|
// Maintain existing indexes for backwards compatibility (optional)
|
|
CREATE INDEX Node_uri FOR (n:Node) ON (n.uri);
|
|
CREATE INDEX Literal_value FOR (n:Literal) ON (n.value);
|
|
CREATE INDEX Rel_uri FOR ()-[r:Rel]-() ON (r.uri);
|
|
```
|
|
|
|
### कार्यान्वयन में परिवर्तन
|
|
|
|
#### स्टोरेज सर्विस (`write.py`)
|
|
|
|
**वर्तमान कोड:**
|
|
```python
|
|
def create_node(self, uri):
|
|
summary = self.io.execute_query(
|
|
"MERGE (n:Node {uri: $uri})",
|
|
uri=uri, database_=self.db,
|
|
).summary
|
|
```
|
|
|
|
**अद्यतित कोड:**
|
|
```python
|
|
def create_node(self, uri, user, collection):
|
|
summary = self.io.execute_query(
|
|
"MERGE (n:Node {uri: $uri, user: $user, collection: $collection})",
|
|
uri=uri, user=user, collection=collection, database_=self.db,
|
|
).summary
|
|
```
|
|
|
|
**बेहतर `store_triples` विधि:**
|
|
```python
|
|
async def store_triples(self, message):
|
|
user = message.metadata.user
|
|
collection = message.metadata.collection
|
|
|
|
for t in message.triples:
|
|
self.create_node(t.s.value, user, collection)
|
|
|
|
if t.o.is_uri:
|
|
self.create_node(t.o.value, user, collection)
|
|
self.relate_node(t.s.value, t.p.value, t.o.value, user, collection)
|
|
else:
|
|
self.create_literal(t.o.value, user, collection)
|
|
self.relate_literal(t.s.value, t.p.value, t.o.value, user, collection)
|
|
```
|
|
|
|
#### क्वेरी सर्विस (`service.py`)
|
|
|
|
**वर्तमान कोड:**
|
|
```python
|
|
records, summary, keys = self.io.execute_query(
|
|
"MATCH (src:Node {uri: $src})-[rel:Rel {uri: $rel}]->(dest:Node) "
|
|
"RETURN dest.uri as dest",
|
|
src=query.s.value, rel=query.p.value, database_=self.db,
|
|
)
|
|
```
|
|
|
|
**अद्यतित कोड:**
|
|
```python
|
|
records, summary, keys = self.io.execute_query(
|
|
"MATCH (src:Node {uri: $src, user: $user, collection: $collection})-"
|
|
"[rel:Rel {uri: $rel, user: $user, collection: $collection}]->"
|
|
"(dest:Node {user: $user, collection: $collection}) "
|
|
"RETURN dest.uri as dest",
|
|
src=query.s.value, rel=query.p.value,
|
|
user=query.user, collection=query.collection,
|
|
database_=self.db,
|
|
)
|
|
```
|
|
|
|
### माइग्रेशन रणनीति
|
|
|
|
#### चरण 1: नए डेटा में गुण जोड़ें
|
|
1. स्टोरेज सर्विस को अपडेट करें ताकि नए त्रिगुणों में उपयोगकर्ता/संग्रह गुण जोड़े जा सकें।
|
|
2. पिछली अनुकूलता बनाए रखें, क्योंकि प्रश्नों में गुणों की आवश्यकता नहीं होगी।
|
|
3. मौजूदा डेटा सुलभ रहेगा, लेकिन अलग नहीं होगा।
|
|
|
|
#### चरण 2: मौजूदा डेटा का माइग्रेशन
|
|
```cypher
|
|
// Migrate existing nodes (requires default user/collection assignment)
|
|
MATCH (n:Node) WHERE n.user IS NULL
|
|
SET n.user = 'legacy_user', n.collection = 'default_collection';
|
|
|
|
MATCH (n:Literal) WHERE n.user IS NULL
|
|
SET n.user = 'legacy_user', n.collection = 'default_collection';
|
|
|
|
MATCH ()-[r:Rel]->() WHERE r.user IS NULL
|
|
SET r.user = 'legacy_user', r.collection = 'default_collection';
|
|
```
|
|
|
|
#### चरण 3: अलगाव को लागू करना
|
|
1. क्वेरी सेवा को अपडेट करें ताकि उपयोगकर्ता/संग्रह फ़िल्टरिंग की आवश्यकता हो
|
|
2. उचित उपयोगकर्ता/संग्रह संदर्भ के बिना क्वेरी को अस्वीकार करने के लिए सत्यापन जोड़ें
|
|
3. पुराने डेटा एक्सेस पथ को हटा दें
|
|
|
|
### सुरक्षा संबंधी विचार
|
|
|
|
#### क्वेरी सत्यापन
|
|
```python
|
|
async def query_triples(self, query):
|
|
# Validate user/collection parameters
|
|
if not query.user or not query.collection:
|
|
raise ValueError("User and collection must be specified")
|
|
|
|
# All queries must include user/collection filters
|
|
# ... rest of implementation
|
|
```
|
|
|
|
#### पैरामीटर इंजेक्शन को रोकना
|
|
केवल पैरामीटराइज़्ड क्वेरी का उपयोग करें।
|
|
उपयोगकर्ता/संग्रह मूल्यों को स्वीकृत पैटर्न के विरुद्ध मान्य करें।
|
|
Neo4j प्रॉपर्टी नाम आवश्यकताओं के लिए सैनिटाइजेशन पर विचार करें।
|
|
|
|
#### ऑडिट ट्रेल
|
|
```python
|
|
logger.info(f"Query executed - User: {query.user}, Collection: {query.collection}, "
|
|
f"Pattern: {query.s}/{query.p}/{query.o}")
|
|
```
|
|
|
|
## वैकल्पिक दृष्टिकोणों पर विचार
|
|
|
|
### विकल्प 2: लेबल-आधारित अलगाव
|
|
|
|
**दृष्टिकोण**: गतिशील लेबल का उपयोग करें जैसे `User_john_Collection_prod`
|
|
|
|
**लाभ:**
|
|
लेबल फ़िल्टरिंग के माध्यम से मजबूत अलगाव
|
|
लेबल इंडेक्स के साथ कुशल क्वेरी प्रदर्शन
|
|
स्पष्ट डेटा पृथक्करण
|
|
|
|
**नुकसान:**
|
|
Neo4j में लेबल की संख्या पर व्यावहारिक सीमाएं हैं (~1000)
|
|
जटिल लेबल नाम पीढ़ी और सैनिटाइजेशन
|
|
जब आवश्यक हो तो संग्रहों में क्वेरी करना मुश्किल होता है
|
|
|
|
**कार्यान्वयन उदाहरण:**
|
|
```cypher
|
|
CREATE (n:Node:User_john_Collection_prod {uri: "http://example.com/entity"})
|
|
MATCH (n:User_john_Collection_prod) WHERE n:Node RETURN n
|
|
```
|
|
|
|
### विकल्प 3: प्रति-उपयोगकर्ता डेटाबेस
|
|
|
|
**दृष्टिकोण**: प्रत्येक उपयोगकर्ता या उपयोगकर्ता/संग्रह संयोजन के लिए अलग-अलग Neo4j डेटाबेस बनाएं।
|
|
|
|
**लाभ:**
|
|
पूर्ण डेटा अलगाव
|
|
क्रॉस-संदूषण का कोई जोखिम नहीं
|
|
प्रति-उपयोगकर्ता स्वतंत्र स्केलिंग
|
|
|
|
**नुकसान:**
|
|
संसाधन ओवरहेड (प्रत्येक डेटाबेस मेमोरी का उपयोग करता है)
|
|
जटिल डेटाबेस जीवनचक्र प्रबंधन
|
|
Neo4j कम्युनिटी एडिशन डेटाबेस सीमाएं
|
|
उपयोगकर्ताओं के बीच विश्लेषण करना मुश्किल
|
|
|
|
### विकल्प 4: समग्र कुंजी रणनीति
|
|
|
|
**दृष्टिकोण**: सभी URIs और मानों को उपयोगकर्ता/संग्रह जानकारी के साथ उपसर्ग करें।
|
|
|
|
**लाभ:**
|
|
मौजूदा प्रश्नों के साथ संगत
|
|
सरल कार्यान्वयन
|
|
कोई स्कीमा परिवर्तन आवश्यक नहीं
|
|
|
|
**नुकसान:**
|
|
URI प्रदूषण डेटा अर्थशास्त्र को प्रभावित करता है
|
|
कम कुशल प्रश्न (स्ट्रिंग उपसर्ग मिलान)
|
|
RDF/सिमेंटिक वेब मानकों का उल्लंघन
|
|
|
|
**कार्यान्वयन उदाहरण:**
|
|
```python
|
|
def make_composite_uri(uri, user, collection):
|
|
return f"usr:{user}:col:{collection}:uri:{uri}"
|
|
```
|
|
|
|
## कार्यान्वयन योजना
|
|
|
|
### चरण 1: आधार (सप्ताह 1)
|
|
1. [ ] स्टोरेज सेवा को उपयोगकर्ता/संग्रह गुणों को स्वीकार करने और संग्रहीत करने के लिए अपडेट करें।
|
|
2. [ ] कुशल क्वेरी के लिए कंपाउंड इंडेक्स जोड़ें।
|
|
3. [ ] पिछड़े अनुकूलता परत लागू करें।
|
|
4. [ ] नई कार्यक्षमता के लिए यूनिट परीक्षण बनाएं।
|
|
|
|
### चरण 2: क्वेरी अपडेट (सप्ताह 2)
|
|
1. [ ] सभी क्वेरी पैटर्न को उपयोगकर्ता/संग्रह फ़िल्टर शामिल करने के लिए अपडेट करें।
|
|
2. [ ] क्वेरी सत्यापन और सुरक्षा जांच जोड़ें।
|
|
3. [ ] एकीकरण परीक्षण अपडेट करें।
|
|
4. [ ] फ़िल्टर किए गए प्रश्नों के साथ प्रदर्शन परीक्षण।
|
|
|
|
### चरण 3: माइग्रेशन और परिनियोजन (सप्ताह 3)
|
|
1. [ ] मौजूदा Neo4j उदाहरणों के लिए डेटा माइग्रेशन स्क्रिप्ट बनाएं।
|
|
2. [ ] परिनियोजन दस्तावेज़ और रनबुक।
|
|
3. [ ] अलगाव उल्लंघनों के लिए निगरानी और अलर्ट।
|
|
4. [ ] कई उपयोगकर्ताओं/संग्रहों के साथ एंड-टू-एंड परीक्षण।
|
|
|
|
### चरण 4: मजबूती (सप्ताह 4)
|
|
1. [ ] विरासत अनुकूलता मोड हटाएं।
|
|
2. [ ] व्यापक ऑडिट लॉगिंग जोड़ें।
|
|
3. [ ] सुरक्षा समीक्षा और प्रवेश परीक्षण।
|
|
4. [ ] प्रदर्शन अनुकूलन।
|
|
|
|
## परीक्षण रणनीति
|
|
|
|
### यूनिट परीक्षण
|
|
```python
|
|
def test_user_collection_isolation():
|
|
# Store triples for user1/collection1
|
|
processor.store_triples(triples_user1_coll1)
|
|
|
|
# Store triples for user2/collection2
|
|
processor.store_triples(triples_user2_coll2)
|
|
|
|
# Query as user1 should only return user1's data
|
|
results = processor.query_triples(query_user1_coll1)
|
|
assert all_results_belong_to_user1_coll1(results)
|
|
|
|
# Query as user2 should only return user2's data
|
|
results = processor.query_triples(query_user2_coll2)
|
|
assert all_results_belong_to_user2_coll2(results)
|
|
```
|
|
|
|
### एकीकरण परीक्षण (एकीकरण परीक्षण)
|
|
मल्टी-यूजर परिदृश्य जिसमें ओवरलैपिंग डेटा शामिल है
|
|
क्रॉस-कलेक्शन क्वेरी (विफल होनी चाहिए)
|
|
मौजूदा डेटा के साथ माइग्रेशन परीक्षण
|
|
बड़े डेटासेट के साथ प्रदर्शन बेंचमार्क
|
|
|
|
### सुरक्षा परीक्षण (सुरक्षा परीक्षण)
|
|
अन्य उपयोगकर्ताओं के डेटा को क्वेरी करने का प्रयास
|
|
उपयोगकर्ता/कलेक्शन पैरामीटर पर SQL इंजेक्शन-शैली के हमले
|
|
विभिन्न क्वेरी पैटर्न के तहत पूर्ण अलगाव को सत्यापित करें
|
|
|
|
## प्रदर्शन संबंधी विचार (प्रदर्शन संबंधी विचार)
|
|
|
|
### इंडेक्स रणनीति (इंडेक्स रणनीति)
|
|
इष्टतम फ़िल्टरिंग के लिए `(user, collection, uri)` पर कंपाउंड इंडेक्स
|
|
यदि कुछ संग्रह बहुत बड़े हैं तो आंशिक इंडेक्स पर विचार करें
|
|
इंडेक्स उपयोग और क्वेरी प्रदर्शन की निगरानी करें
|
|
|
|
### क्वेरी अनुकूलन (क्वेरी अनुकूलन)
|
|
फ़िल्टर किए गए क्वेरी में इंडेक्स उपयोग को सत्यापित करने के लिए EXPLAIN का उपयोग करें
|
|
बार-बार एक्सेस किए जाने वाले डेटा के लिए क्वेरी परिणाम कैशिंग पर विचार करें
|
|
बड़ी संख्या में उपयोगकर्ताओं/संग्रहों के साथ मेमोरी उपयोग को प्रोफाइल करें
|
|
|
|
### मापनीयता (मापनीयता)
|
|
प्रत्येक उपयोगकर्ता/संग्रह संयोजन अलग-अलग डेटा द्वीप बनाता है
|
|
डेटाबेस आकार और कनेक्शन पूल उपयोग की निगरानी करें
|
|
यदि आवश्यक हो तो क्षैतिज स्केलिंग रणनीतियों पर विचार करें
|
|
|
|
## सुरक्षा और अनुपालन (सुरक्षा और अनुपालन)
|
|
|
|
### डेटा अलगाव गारंटी (डेटा अलगाव गारंटी)
|
|
**भौतिक**: सभी उपयोगकर्ता डेटा स्पष्ट उपयोगकर्ता/संग्रह गुणों के साथ संग्रहीत होते हैं
|
|
**तार्किक**: सभी क्वेरी उपयोगकर्ता/संग्रह संदर्भ द्वारा फ़िल्टर की जाती हैं
|
|
**पहुंच नियंत्रण**: सेवा-स्तरीय सत्यापन अनधिकृत पहुंच को रोकता है
|
|
|
|
### ऑडिट आवश्यकताएँ (ऑडिट आवश्यकताएँ)
|
|
उपयोगकर्ता/संग्रह संदर्भ के साथ सभी डेटा एक्सेस को लॉग करें
|
|
माइग्रेशन गतिविधियों और डेटा मूवमेंट को ट्रैक करें
|
|
अलगाव उल्लंघन के प्रयासों की निगरानी करें
|
|
|
|
### अनुपालन संबंधी विचार (अनुपालन संबंधी विचार)
|
|
जीडीपीआर: उपयोगकर्ता-विशिष्ट डेटा को खोजने और हटाने की बेहतर क्षमता
|
|
एसओसी2: स्पष्ट डेटा अलगाव और पहुंच नियंत्रण
|
|
एचआईपीएए: स्वास्थ्य सेवा डेटा के लिए मजबूत किरायेदार अलगाव
|
|
|
|
## जोखिम और निवारण (जोखिम और निवारण)
|
|
|
|
| जोखिम | प्रभाव | संभावना | निवारण |
|
|
|------|--------|------------|------------|
|
|
| क्वेरी में उपयोगकर्ता/संग्रह फ़िल्टर गुम है | उच्च | मध्यम | अनिवार्य सत्यापन, व्यापक परीक्षण
|
|
| प्रदर्शन में गिरावट | मध्यम | कम | इंडेक्स अनुकूलन, क्वेरी प्रोफाइलिंग
|
|
| माइग्रेशन डेटा भ्रष्टाचार | उच्च | कम | बैकअप रणनीति, रोलबैक प्रक्रियाएं
|
|
| जटिल मल्टी-कलेक्शन क्वेरी | मध्यम | मध्यम | क्वेरी पैटर्न को दस्तावेज़ करें, उदाहरण प्रदान करें
|
|
|
|
## सफलता मानदंड (सफलता मानदंड)
|
|
|
|
1. **सुरक्षा**: उत्पादन में क्रॉस-यूजर डेटा एक्सेस शून्य
|
|
2. **प्रदर्शन**: अनफ़िल्टर किए गए क्वेरी की तुलना में <10% क्वेरी प्रदर्शन प्रभाव
|
|
3. **माइग्रेशन**: 100% मौजूदा डेटा बिना किसी नुकसान के सफलतापूर्वक माइग्रेट किया गया
|
|
4. **उपयोगिता**: सभी मौजूदा क्वेरी पैटर्न उपयोगकर्ता/संग्रह संदर्भ के साथ काम करते हैं
|
|
5. **अनुपालन**: उपयोगकर्ता/संग्रह डेटा एक्सेस का पूर्ण ऑडिट ट्रेल
|
|
|
|
## निष्कर्ष (निष्कर्ष)
|
|
|
|
संपत्ति-आधारित फ़िल्टरिंग दृष्टिकोण उपयोगकर्ता/संग्रह अलगाव को Neo4j में जोड़ने के लिए सुरक्षा, प्रदर्शन और रखरखाव के बीच सबसे अच्छा संतुलन प्रदान करता है। यह Neo4j की ग्राफ क्वेरी और इंडेक्सिंग में ताकत का लाभ उठाते हुए TrustGraph के मौजूदा मल्टी-टेनेंसी पैटर्न के साथ संरेखित है।
|
|
|
|
यह समाधान सुनिश्चित करता है कि TrustGraph का Neo4j बैकएंड अन्य स्टोरेज बैकएंड के समान सुरक्षा मानकों को पूरा करता है, जिससे डेटा अलगाव कमजोरियों को रोका जा सकता है, जबकि ग्राफ क्वेरी की लचीलापन और शक्ति को बनाए रखा जा सकता है।
|