trustgraph/trustgraph/embeddings/ollama/processor.py


"""
Embeddings service, applies an embeddings model selected from HuggingFace.
Input is text, output is embeddings vector.
"""
from langchain_community.embeddings import OllamaEmbeddings

from ... schema import EmbeddingsRequest, EmbeddingsResponse
from ... log_level import LogLevel
from ... base import ConsumerProducer

default_input_queue = 'embeddings'
default_output_queue = 'embeddings-response'
default_subscriber = 'embeddings-ollama'
default_model="mxbai-embed-large"
default_ollama = 'http://localhost:11434'

class Processor(ConsumerProducer):

    def __init__(
            self,
            pulsar_host=None,
            input_queue=default_input_queue,
            output_queue=default_output_queue,
            subscriber=default_subscriber,
            log_level=LogLevel.INFO,
            model=default_model,
            ollama=default_ollama,
    ):

        super(Processor, self).__init__(
            pulsar_host=pulsar_host,
            log_level=log_level,
            input_queue=input_queue,
            output_queue=output_queue,
            subscriber=subscriber,
            input_schema=EmbeddingsRequest,
            output_schema=EmbeddingsResponse,
        )

        self.embeddings = OllamaEmbeddings(base_url=ollama, model=model)

    def handle(self, msg):

        v = msg.value()

        # Sender-produced ID

        id = msg.properties()["id"]

        print(f"Handling input {id}...", flush=True)

        text = v.text
        embeds = self.embeddings.embed_query([text])

        print("Send response...", flush=True)
        r = EmbeddingsResponse(vectors=[embeds])

        self.producer.send(r, properties={"id": id})

        print("Done.", flush=True)

    @staticmethod
    def add_args(parser):

        ConsumerProducer.add_args(
            parser, default_input_queue, default_subscriber,
            default_output_queue,
        )

        parser.add_argument(
            '-m', '--model',
            default=default_model,
            help=f'Embeddings model (default: {default_model})'
        )

        parser.add_argument(
            '-r', '--ollama',
            default=default_ollama,
            help=f'ollama (default: {default_ollama})'
        )

def run():

    Processor.start('embeddings-ollama', __doc__)
Ollama embeddings module 2024-07-16 17:24:16 +01:00
			`"""`
			`Embeddings service, applies an embeddings model selected from HuggingFace.`
			`Input is text, output is embeddings vector.`
			`"""`
			`from langchain_community.embeddings import OllamaEmbeddings`

			`from ... schema import EmbeddingsRequest, EmbeddingsResponse`
			`from ... log_level import LogLevel`
Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`from ... base import ConsumerProducer`
Ollama embeddings module 2024-07-16 17:24:16 +01:00
			`default_input_queue = 'embeddings'`
			`default_output_queue = 'embeddings-response'`
			`default_subscriber = 'embeddings-ollama'`
			`default_model="mxbai-embed-large"`
			`default_ollama = 'http://localhost:11434'`

Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`class Processor(ConsumerProducer):`
Ollama embeddings module 2024-07-16 17:24:16 +01:00
			`def __init__(`
			`self,`
Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`pulsar_host=None,`
Ollama embeddings module 2024-07-16 17:24:16 +01:00			`input_queue=default_input_queue,`
			`output_queue=default_output_queue,`
			`subscriber=default_subscriber,`
			`log_level=LogLevel.INFO,`
			`model=default_model,`
			`ollama=default_ollama,`
			`):`

Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`super(Processor, self).__init__(`
			`pulsar_host=pulsar_host,`
			`log_level=log_level,`
			`input_queue=input_queue,`
			`output_queue=output_queue,`
			`subscriber=subscriber,`
			`input_schema=EmbeddingsRequest,`
			`output_schema=EmbeddingsResponse,`
Ollama embeddings module 2024-07-16 17:24:16 +01:00			`)`

			`self.embeddings = OllamaEmbeddings(base_url=ollama, model=model)`

Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`def handle(self, msg):`
Ollama embeddings module 2024-07-16 17:24:16 +01:00
Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`v = msg.value()`
Ollama embeddings module 2024-07-16 17:24:16 +01:00
Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`# Sender-produced ID`
Ollama embeddings module 2024-07-16 17:24:16 +01:00
Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`id = msg.properties()["id"]`
Ollama embeddings module 2024-07-16 17:24:16 +01:00
Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`print(f"Handling input {id}...", flush=True)`
Ollama embeddings module 2024-07-16 17:24:16 +01:00
Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`text = v.text`
			`embeds = self.embeddings.embed_query([text])`
Ollama embeddings module 2024-07-16 17:24:16 +01:00
Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`print("Send response...", flush=True)`
			`r = EmbeddingsResponse(vectors=[embeds])`
Ollama embeddings module 2024-07-16 17:24:16 +01:00
Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`self.producer.send(r, properties={"id": id})`
Ollama embeddings module 2024-07-16 17:24:16 +01:00
Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`print("Done.", flush=True)`
Ollama embeddings module 2024-07-16 17:24:16 +01:00
Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`@staticmethod`
			`def add_args(parser):`
Ollama embeddings module 2024-07-16 17:24:16 +01:00
Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`ConsumerProducer.add_args(`
			`parser, default_input_queue, default_subscriber,`
			`default_output_queue,`
			`)`
Ollama embeddings module 2024-07-16 17:24:16 +01:00
Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`parser.add_argument(`
			`'-m', '--model',`
			`default=default_model,`
			`help=f'Embeddings model (default: {default_model})'`
			`)`
Ollama embeddings module 2024-07-16 17:24:16 +01:00
Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`parser.add_argument(`
			`'-r', '--ollama',`
			`default=default_ollama,`
			`help=f'ollama (default: {default_ollama})'`
			`)`
Ollama embeddings module 2024-07-16 17:24:16 +01:00
			`def run():`

Base classes (#2) Simplify code using base classes 2024-07-17 16:56:47 +01:00			`Processor.start('embeddings-ollama', __doc__)`
Ollama embeddings module 2024-07-16 17:24:16 +01:00