diff --git a/README.es.md b/README.es.md index d61504cd5..b62d2cece 100644 --- a/README.es.md +++ b/README.es.md @@ -21,9 +21,28 @@ # SurfSense -Conecta cualquier LLM a tus fuentes de conocimiento internas y chatea con él en tiempo real junto a tu equipo. Alternativa de código abierto a NotebookLM, Perplexity y Glean. -SurfSense es un agente de investigación de IA altamente personalizable, conectado a fuentes externas como motores de búsqueda (SearxNG, Tavily, LinkUp), Google Drive, OneDrive, Dropbox, Slack, Microsoft Teams, Linear, Jira, ClickUp, Confluence, BookStack, Gmail, Notion, YouTube, GitHub, Discord, Airtable, Google Calendar, Luma, Circleback, Elasticsearch, Obsidian y más por venir. +NotebookLM es una de las mejores y más útiles plataformas de IA que existen, pero una vez que comienzas a usarla regularmente también sientes sus limitaciones dejando algo que desear. + +1. Hay límites en la cantidad de fuentes que puedes agregar en un notebook. +2. Hay límites en la cantidad de notebooks que puedes tener. +3. No puedes tener fuentes que excedan 500,000 palabras y más de 200MB. +4. Estás bloqueado con los servicios de Google (LLMs, modelos de uso, etc.) sin opción de configurarlos. +5. Fuentes de datos externas e integraciones de servicios limitadas. +6. El agente de NotebookLM está específicamente optimizado solo para estudiar e investigar, pero puedes hacer mucho más con los datos de origen. +7. Falta de soporte multijugador. + +...y más. + +**SurfSense está específicamente hecho para resolver estos problemas.** SurfSense te permite: + +- **Controla Tu Flujo de Datos** - Mantén tus datos privados y seguros. +- **Sin Límites de Datos** - Agrega una cantidad ilimitada de fuentes y notebooks. +- **Sin Dependencia de Proveedores** - Configura cualquier modelo LLM, de imagen, TTS y STT. +- **25+ Fuentes de Datos Externas** - Agrega tus fuentes desde Google Drive, OneDrive, Dropbox, Notion y muchos otros servicios externos. +- **Soporte Multijugador en Tiempo Real** - Trabaja fácilmente con los miembros de tu equipo en un notebook compartido. + +...y más por venir. @@ -34,7 +53,7 @@ https://github.com/user-attachments/assets/cc0c84d3-1f2f-4f7a-b519-2ecce22310b1 ## Ejemplo de Agente de Video -https://github.com/user-attachments/assets/cc977e6d-8292-4ffe-abb8-3b0560ef5562 +https://github.com/user-attachments/assets/012a7ffa-6f76-4f06-9dda-7632b470057a @@ -133,24 +152,29 @@ Para Docker Compose, instalación manual y otras opciones de despliegue, consult

Comentarios en Tiempo Real

-## Funcionalidades Principales +## SurfSense vs Google NotebookLM -| Funcionalidad | Descripción | -|----------------|-------------| -| Alternativa OSS | Reemplazo directo de NotebookLM, Perplexity y Glean con colaboración en equipo en tiempo real | -| 50+ Formatos de Archivo | Sube documentos, imágenes, videos vía LlamaCloud, Unstructured o Docling (local) | -| Búsqueda Híbrida | Semántica + Texto completo con Índices Jerárquicos y Reciprocal Rank Fusion | -| Respuestas con Citas | Chatea con tu base de conocimiento y obtén respuestas citadas al estilo Perplexity | -| Arquitectura de Agentes Profundos | Impulsado por [LangChain Deep Agents](https://docs.langchain.com/oss/python/deepagents/overview) con planificación, subagentes y acceso al sistema de archivos | -| Soporte Universal de LLM | 100+ LLMs, 6000+ modelos de embeddings, todos los principales rerankers vía OpenAI spec y LiteLLM | -| Privacidad Primero | Soporte completo de LLM local (vLLM, Ollama) tus datos son tuyos | -| Colaboración en Equipo | RBAC con roles de Propietario / Admin / Editor / Visor, chat en tiempo real e hilos de comentarios | -| Generación de Videos | Genera videos con narración y visuales | -| Generación de Presentaciones | Crea presentaciones editables basadas en diapositivas | -| Generación de Podcasts | Podcast de 3 min en menos de 20 segundos; múltiples proveedores TTS (OpenAI, Azure, Kokoro) | -| Extensión de Navegador | Extensión multi-navegador para guardar cualquier página web, incluyendo páginas protegidas por autenticación | -| 27+ Conectores | Motores de búsqueda, Google Drive, OneDrive, Dropbox, Slack, Teams, Jira, Notion, GitHub, Discord y [más](#fuentes-externas) | -| Auto-Hospedable | Código abierto, Docker en un solo comando o Docker Compose completo para producción | +| Característica | Google NotebookLM | SurfSense | +|---------|-------------------|-----------| +| **Fuentes por Notebook** | 50 (Gratis) a 600 (Ultra, $249.99/mes) | Ilimitadas | +| **Número de Notebooks** | 100 (Gratis) a 500 (planes de pago) | Ilimitados | +| **Límite de Tamaño de Fuente** | 500,000 palabras / 200MB por fuente | Sin límite | +| **Precios** | Nivel gratuito disponible; Pro $19.99/mes, Ultra $249.99/mes | Gratuito y de código abierto, auto-hospedable en tu propia infra | +| **Soporte de LLM** | Solo Google Gemini | 100+ LLMs vía OpenAI spec y LiteLLM | +| **Modelos de Embeddings** | Solo Google | 6,000+ modelos de embeddings, todos los principales rerankers | +| **LLMs Locales / Privados** | No disponible | Soporte completo (vLLM, Ollama) - tus datos son tuyos | +| **Auto-Hospedable** | No | Sí - Docker en un solo comando o Docker Compose completo | +| **Código Abierto** | No | Sí | +| **Conectores Externos** | Google Drive, YouTube, sitios web | 27+ conectores - Motores de búsqueda, Google Drive, OneDrive, Dropbox, Slack, Teams, Jira, Notion, GitHub, Discord y [más](#fuentes-externas) | +| **Soporte de Formatos de Archivo** | PDFs, Docs, Slides, Sheets, CSV, Word, EPUB, imágenes, URLs web, YouTube | 50+ formatos - documentos, imágenes, videos vía LlamaCloud, Unstructured o Docling (local) | +| **Búsqueda** | Búsqueda semántica | Búsqueda Híbrida - Semántica + Texto completo con Índices Jerárquicos y Reciprocal Rank Fusion | +| **Respuestas con Citas** | Sí | Sí - Respuestas citadas al estilo Perplexity | +| **Arquitectura de Agentes** | No | Sí - impulsado por [LangChain Deep Agents](https://docs.langchain.com/oss/python/deepagents/overview) con planificación, subagentes y acceso al sistema de archivos | +| **Multijugador en Tiempo Real** | Notebooks compartidos con roles de Visor/Editor (sin chat en tiempo real) | RBAC con roles de Propietario / Admin / Editor / Visor, chat en tiempo real e hilos de comentarios | +| **Generación de Videos** | Resúmenes en video cinemáticos vía Veo 3 (solo Ultra) | Disponible (NotebookLM es mejor aquí, mejorando activamente) | +| **Generación de Presentaciones** | Diapositivas más atractivas pero no editables | Crea presentaciones editables basadas en diapositivas | +| **Generación de Podcasts** | Resúmenes de audio con hosts e idiomas personalizables | Disponible con múltiples proveedores TTS (NotebookLM es mejor aquí, mejorando activamente) | +| **Extensión de Navegador** | No | Extensión multi-navegador para guardar cualquier página web, incluyendo páginas protegidas por autenticación |
Lista completa de Fuentes Externas diff --git a/README.hi.md b/README.hi.md index 011dbf5db..b49bddc72 100644 --- a/README.hi.md +++ b/README.hi.md @@ -21,9 +21,28 @@ # SurfSense -किसी भी LLM को अपने आंतरिक ज्ञान स्रोतों से जोड़ें और अपनी टीम के साथ रीयल-टाइम में चैट करें। NotebookLM, Perplexity और Glean का ओपन सोर्स विकल्प। -SurfSense एक अत्यधिक अनुकूलन योग्य AI शोध एजेंट है, जो बाहरी स्रोतों से जुड़ा है जैसे सर्च इंजन (SearxNG, Tavily, LinkUp), Google Drive, OneDrive, Dropbox, Slack, Microsoft Teams, Linear, Jira, ClickUp, Confluence, BookStack, Gmail, Notion, YouTube, GitHub, Discord, Airtable, Google Calendar, Luma, Circleback, Elasticsearch, Obsidian और भी बहुत कुछ आने वाला है। +NotebookLM वहाँ उपलब्ध सबसे अच्छे और सबसे उपयोगी AI प्लेटफ़ॉर्म में से एक है, लेकिन जब आप इसे नियमित रूप से उपयोग करना शुरू करते हैं तो आप इसकी सीमाओं को भी महसूस करते हैं जो कुछ और की चाह छोड़ती हैं। + +1. एक notebook में जोड़े जा सकने वाले स्रोतों की मात्रा पर सीमाएं हैं। +2. आपके पास कितने notebooks हो सकते हैं इस पर सीमाएं हैं। +3. आपके पास ऐसे स्रोत नहीं हो सकते जो 500,000 शब्दों और 200MB से अधिक हों। +4. आप Google सेवाओं (LLMs, उपयोग मॉडल, आदि) में बंद हैं और उन्हें कॉन्फ़िगर करने का कोई विकल्प नहीं है। +5. सीमित बाहरी डेटा स्रोत और सेवा एकीकरण। +6. NotebookLM एजेंट विशेष रूप से केवल अध्ययन और शोध के लिए अनुकूलित है, लेकिन आप स्रोत डेटा के साथ और भी बहुत कुछ कर सकते हैं। +7. मल्टीप्लेयर सपोर्ट की कमी। + +...और भी बहुत कुछ। + +**SurfSense विशेष रूप से इन समस्याओं को हल करने के लिए बनाया गया है।** SurfSense आपको सक्षम बनाता है: + +- **अपने डेटा प्रवाह को नियंत्रित करें** - अपने डेटा को निजी और सुरक्षित रखें। +- **कोई डेटा सीमा नहीं** - असीमित मात्रा में स्रोत और notebooks जोड़ें। +- **कोई विक्रेता लॉक-इन नहीं** - किसी भी LLM, इमेज, TTS और STT मॉडल को कॉन्फ़िगर करें। +- **25+ बाहरी डेटा स्रोत** - Google Drive, OneDrive, Dropbox, Notion और कई अन्य बाहरी सेवाओं से अपने स्रोत जोड़ें। +- **रीयल-टाइम मल्टीप्लेयर सपोर्ट** - एक साझा notebook में अपनी टीम के सदस्यों के साथ आसानी से काम करें। + +...और भी बहुत कुछ आने वाला है। @@ -34,7 +53,7 @@ https://github.com/user-attachments/assets/cc0c84d3-1f2f-4f7a-b519-2ecce22310b1 ## वीडियो एजेंट नमूना -https://github.com/user-attachments/assets/cc977e6d-8292-4ffe-abb8-3b0560ef5562 +https://github.com/user-attachments/assets/012a7ffa-6f76-4f06-9dda-7632b470057a @@ -133,24 +152,29 @@ Docker Compose, मैनुअल इंस्टॉलेशन और अन

रीयल-टाइम कमेंट्स

-## प्रमुख विशेषताएं +## SurfSense vs Google NotebookLM -| विशेषता | विवरण | -|----------|--------| -| OSS विकल्प | रीयल-टाइम टीम सहयोग के साथ NotebookLM, Perplexity और Glean का सीधा प्रतिस्थापन | -| 50+ फ़ाइल फ़ॉर्मेट | LlamaCloud, Unstructured या Docling (लोकल) के माध्यम से दस्तावेज़, चित्र, वीडियो अपलोड करें | -| हाइब्रिड सर्च | हायरार्किकल इंडाइसेस और Reciprocal Rank Fusion के साथ सिमैंटिक + फुल टेक्स्ट सर्च | -| उद्धृत उत्तर | अपने ज्ञान आधार के साथ चैट करें और Perplexity शैली के उद्धृत उत्तर पाएं | -| डीप एजेंट आर्किटेक्चर | [LangChain Deep Agents](https://docs.langchain.com/oss/python/deepagents/overview) द्वारा संचालित, योजना, सब-एजेंट और फ़ाइल सिस्टम एक्सेस | -| यूनिवर्सल LLM सपोर्ट | 100+ LLMs, 6000+ एम्बेडिंग मॉडल, सभी प्रमुख रीरैंकर्स OpenAI spec और LiteLLM के माध्यम से | -| प्राइवेसी फर्स्ट | पूर्ण लोकल LLM सपोर्ट (vLLM, Ollama) आपका डेटा आपका रहता है | -| टीम सहयोग | मालिक / एडमिन / संपादक / दर्शक भूमिकाओं के साथ RBAC, रीयल-टाइम चैट और कमेंट थ्रेड | -| वीडियो जनरेशन | नैरेशन और विज़ुअल के साथ वीडियो बनाएं | -| प्रेजेंटेशन जनरेशन | संपादन योग्य, स्लाइड आधारित प्रेजेंटेशन बनाएं | -| पॉडकास्ट जनरेशन | 20 सेकंड से कम में 3 मिनट का पॉडकास्ट; कई TTS प्रदाता (OpenAI, Azure, Kokoro) | -| ब्राउज़र एक्सटेंशन | किसी भी वेबपेज को सहेजने के लिए क्रॉस-ब्राउज़र एक्सटेंशन, प्रमाणीकरण सुरक्षित पेज सहित | -| 27+ कनेक्टर्स | सर्च इंजन, Google Drive, OneDrive, Dropbox, Slack, Teams, Jira, Notion, GitHub, Discord और [अधिक](#बाहरी-स्रोत) | -| सेल्फ-होस्ट करने योग्य | ओपन सोर्स, Docker एक कमांड या प्रोडक्शन के लिए पूर्ण Docker Compose | +| विशेषता | Google NotebookLM | SurfSense | +|---------|-------------------|-----------| +| **प्रति Notebook स्रोत** | 50 (मुफ़्त) से 600 (Ultra, $249.99/माह) | असीमित | +| **Notebooks की संख्या** | 100 (मुफ़्त) से 500 (सशुल्क योजनाएं) | असीमित | +| **स्रोत आकार सीमा** | 500,000 शब्द / 200MB प्रति स्रोत | कोई सीमा नहीं | +| **मूल्य निर्धारण** | मुफ़्त स्तर उपलब्ध; Pro $19.99/माह, Ultra $249.99/माह | मुफ़्त और ओपन सोर्स, अपनी इंफ्रा पर सेल्फ-होस्ट करें | +| **LLM सपोर्ट** | केवल Google Gemini | 100+ LLMs OpenAI spec और LiteLLM के माध्यम से | +| **एम्बेडिंग मॉडल** | केवल Google | 6,000+ एम्बेडिंग मॉडल, सभी प्रमुख रीरैंकर्स | +| **लोकल / प्राइवेट LLMs** | उपलब्ध नहीं | पूर्ण सपोर्ट (vLLM, Ollama) - आपका डेटा आपका रहता है | +| **सेल्फ-होस्ट करने योग्य** | नहीं | हाँ - Docker एक कमांड या पूर्ण Docker Compose | +| **ओपन सोर्स** | नहीं | हाँ | +| **बाहरी कनेक्टर्स** | Google Drive, YouTube, वेबसाइटें | 27+ कनेक्टर्स - सर्च इंजन, Google Drive, OneDrive, Dropbox, Slack, Teams, Jira, Notion, GitHub, Discord और [अधिक](#बाहरी-स्रोत) | +| **फ़ाइल फ़ॉर्मेट सपोर्ट** | PDFs, Docs, Slides, Sheets, CSV, Word, EPUB, इमेज, वेब URLs, YouTube | 50+ फ़ॉर्मेट - दस्तावेज़, इमेज, वीडियो LlamaCloud, Unstructured या Docling (लोकल) के माध्यम से | +| **सर्च** | सिमैंटिक सर्च | हाइब्रिड सर्च - हायरार्किकल इंडाइसेस और Reciprocal Rank Fusion के साथ सिमैंटिक + फुल टेक्स्ट | +| **उद्धृत उत्तर** | हाँ | हाँ - Perplexity शैली के उद्धृत उत्तर | +| **एजेंट आर्किटेक्चर** | नहीं | हाँ - [LangChain Deep Agents](https://docs.langchain.com/oss/python/deepagents/overview) द्वारा संचालित, योजना, सब-एजेंट और फ़ाइल सिस्टम एक्सेस | +| **रीयल-टाइम मल्टीप्लेयर** | दर्शक/संपादक भूमिकाओं के साथ साझा notebooks (कोई रीयल-टाइम चैट नहीं) | मालिक / एडमिन / संपादक / दर्शक भूमिकाओं के साथ RBAC, रीयल-टाइम चैट और कमेंट थ्रेड | +| **वीडियो जनरेशन** | Veo 3 के माध्यम से सिनेमैटिक वीडियो ओवरव्यू (केवल Ultra) | उपलब्ध (NotebookLM यहाँ बेहतर है, सक्रिय रूप से सुधार हो रहा है) | +| **प्रेजेंटेशन जनरेशन** | बेहतर दिखने वाली स्लाइड्स लेकिन संपादन योग्य नहीं | संपादन योग्य, स्लाइड आधारित प्रेजेंटेशन बनाएं | +| **पॉडकास्ट जनरेशन** | कस्टमाइज़ेबल होस्ट और भाषाओं के साथ ऑडियो ओवरव्यू | कई TTS प्रदाताओं के साथ उपलब्ध (NotebookLM यहाँ बेहतर है, सक्रिय रूप से सुधार हो रहा है) | +| **ब्राउज़र एक्सटेंशन** | नहीं | किसी भी वेबपेज को सहेजने के लिए क्रॉस-ब्राउज़र एक्सटेंशन, प्रमाणीकरण सुरक्षित पेज सहित |
बाहरी स्रोतों की पूरी सूची diff --git a/README.md b/README.md index f007fd43c..12ea4912a 100644 --- a/README.md +++ b/README.md @@ -21,9 +21,28 @@ # SurfSense -Connect any LLM to your internal knowledge sources and chat with it in real time alongside your team. OSS alternative to NotebookLM, Perplexity, and Glean. -SurfSense is a highly customizable AI research agent, connected to external sources such as Search Engines (SearxNG, Tavily, LinkUp), Google Drive, OneDrive, Dropbox, Slack, Microsoft Teams, Linear, Jira, ClickUp, Confluence, BookStack, Gmail, Notion, YouTube, GitHub, Discord, Airtable, Google Calendar, Luma, Circleback, Elasticsearch, Obsidian and more to come. +NotebookLM is one of the best and most useful AI platforms out there, but once you start using it regularly you also feel its limitations leaving something to be desired more. + +1. There are limits on the amount of sources you can add in a notebook. +2. There are limits on the number of notebooks you can have. +3. You cannot have sources that exceed 500,000 words and are more than 200MB. +4. You are vendor locked in to Google services (LLMs, usage models, etc.) with no option to configure them. +5. Limited external data sources and service integrations. +6. NotebookLM Agent is specifically optimised for just studying and researching, but you can do so much more with the source data. +7. Lack of multiplayer support. + +...and more. + +**SurfSense is specifically made to solve these problems.** SurfSense empowers you to: + +- **Control Your Data Flow** - Keep your data private and secure. +- **No Data Limits** - Add an unlimited amount of sources and notebooks. +- **No Vendor Lock-in** - Configure any LLM, image, TTS, and STT models to use. +- **25+ External Data Sources** - Add your sources from Google Drive, OneDrive, Dropbox, Notion, and many other external services. +- **Real-Time Multiplayer Support** - Work easily with your team members in a shared notebook. + +...and more to come. @@ -134,24 +153,29 @@ For Docker Compose, manual installation, and other deployment options, see the [

Realtime Comments

-## Key Features +## SurfSense vs Google NotebookLM -| Feature | Description | -|---------|-------------| -| OSS Alternative | Drop in replacement for NotebookLM, Perplexity, and Glean with real time team collaboration | -| 50+ File Formats | Upload documents, images, videos via LlamaCloud, Unstructured, or Docling (local) | -| Hybrid Search | Semantic + Full Text Search with Hierarchical Indices and Reciprocal Rank Fusion | -| Cited Answers | Chat with your knowledge base and get Perplexity style cited responses | -| Deep Agent Architecture | Powered by [LangChain Deep Agents](https://docs.langchain.com/oss/python/deepagents/overview) planning, subagents, and file system access | -| Universal LLM Support | 100+ LLMs, 6000+ embedding models, all major rerankers via OpenAI spec & LiteLLM | -| Privacy First | Full local LLM support (vLLM, Ollama) your data stays yours | -| Team Collaboration | RBAC with Owner / Admin / Editor / Viewer roles, real time chat & comment threads | -| Video Generation | Generate videos with narration and visuals | -| Presentation Generation | Create editable, slide based presentations | -| Podcast Generation | 3 min podcast in under 20 seconds; multiple TTS providers (OpenAI, Azure, Kokoro) | -| Browser Extension | Cross browser extension to save any webpage, including auth protected pages | -| 27+ Connectors | Search Engines, Google Drive, OneDrive, Dropbox, Slack, Teams, Jira, Notion, GitHub, Discord & [more](#external-sources) | -| Self Hostable | Open source, Docker one liner or full Docker Compose for production | +| Feature | Google NotebookLM | SurfSense | +|---------|-------------------|-----------| +| **Sources per Notebook** | 50 (Free) to 600 (Ultra, $249.99/mo) | Unlimited | +| **Number of Notebooks** | 100 (Free) to 500 (paid tiers) | Unlimited | +| **Source Size Limit** | 500,000 words / 200MB per source | No limit | +| **Pricing** | Free tier available; Pro $19.99/mo, Ultra $249.99/mo | Free and open source, self-host on your own infra | +| **LLM Support** | Google Gemini only | 100+ LLMs via OpenAI spec & LiteLLM | +| **Embedding Models** | Google only | 6,000+ embedding models, all major rerankers | +| **Local / Private LLMs** | Not available | Full support (vLLM, Ollama) - your data stays yours | +| **Self Hostable** | No | Yes - Docker one-liner or full Docker Compose | +| **Open Source** | No | Yes | +| **External Connectors** | Google Drive, YouTube, websites | 27+ connectors - Search Engines, Google Drive, OneDrive, Dropbox, Slack, Teams, Jira, Notion, GitHub, Discord & [more](#external-sources) | +| **File Format Support** | PDFs, Docs, Slides, Sheets, CSV, Word, EPUB, images, web URLs, YouTube | 50+ formats - documents, images, videos via LlamaCloud, Unstructured, or Docling (local) | +| **Search** | Semantic search | Hybrid Search - Semantic + Full Text with Hierarchical Indices & Reciprocal Rank Fusion | +| **Cited Answers** | Yes | Yes - Perplexity-style cited responses | +| **Agentic Architecture** | No | Yes - powered by [LangChain Deep Agents](https://docs.langchain.com/oss/python/deepagents/overview) with planning, subagents, and file system access | +| **Real-Time Multiplayer** | Shared notebooks with Viewer/Editor roles (no real-time chat) | RBAC with Owner / Admin / Editor / Viewer roles, real-time chat & comment threads | +| **Video Generation** | Cinematic Video Overviews via Veo 3 (Ultra only) | Available (NotebookLM is better here, actively improving) | +| **Presentation Generation** | Better looking slides but not editable | Create editable, slide-based presentations | +| **Podcast Generation** | Audio Overviews with customizable hosts and languages | Available with multiple TTS providers (NotebookLM is better here, actively improving) | +| **Browser Extension** | No | Cross-browser extension to save any webpage, including auth-protected pages |
Full list of External Sources diff --git a/README.pt-BR.md b/README.pt-BR.md index 4306b0767..50a8b739e 100644 --- a/README.pt-BR.md +++ b/README.pt-BR.md @@ -21,9 +21,28 @@ # SurfSense -Conecte qualquer LLM às suas fontes de conhecimento internas e converse com ele em tempo real junto com sua equipe. Alternativa de código aberto ao NotebookLM, Perplexity e Glean. -SurfSense é um agente de pesquisa de IA altamente personalizável, conectado a fontes externas como mecanismos de busca (SearxNG, Tavily, LinkUp), Google Drive, OneDrive, Dropbox, Slack, Microsoft Teams, Linear, Jira, ClickUp, Confluence, BookStack, Gmail, Notion, YouTube, GitHub, Discord, Airtable, Google Calendar, Luma, Circleback, Elasticsearch, Obsidian e mais por vir. +O NotebookLM é uma das melhores e mais úteis plataformas de IA disponíveis, mas quando você começa a usá-lo regularmente também sente suas limitações deixando algo a desejar. + +1. Há limites na quantidade de fontes que você pode adicionar em um notebook. +2. Há limites no número de notebooks que você pode ter. +3. Você não pode ter fontes que excedam 500.000 palavras e mais de 200MB. +4. Você fica preso aos serviços do Google (LLMs, modelos de uso, etc.) sem opção de configurá-los. +5. Fontes de dados externas e integrações de serviços limitadas. +6. O agente do NotebookLM é especificamente otimizado apenas para estudar e pesquisar, mas você pode fazer muito mais com os dados de origem. +7. Falta de suporte multiplayer. + +...e mais. + +**O SurfSense foi feito especificamente para resolver esses problemas.** O SurfSense permite que você: + +- **Controle Seu Fluxo de Dados** - Mantenha seus dados privados e seguros. +- **Sem Limites de Dados** - Adicione uma quantidade ilimitada de fontes e notebooks. +- **Sem Dependência de Fornecedor** - Configure qualquer modelo LLM, de imagem, TTS e STT. +- **25+ Fontes de Dados Externas** - Adicione suas fontes do Google Drive, OneDrive, Dropbox, Notion e muitos outros serviços externos. +- **Suporte Multiplayer em Tempo Real** - Trabalhe facilmente com os membros da sua equipe em um notebook compartilhado. + +...e mais por vir. @@ -34,7 +53,7 @@ https://github.com/user-attachments/assets/cc0c84d3-1f2f-4f7a-b519-2ecce22310b1 ## Exemplo de Agente de Vídeo -https://github.com/user-attachments/assets/cc977e6d-8292-4ffe-abb8-3b0560ef5562 +https://github.com/user-attachments/assets/012a7ffa-6f76-4f06-9dda-7632b470057a @@ -133,24 +152,29 @@ Para Docker Compose, instalação manual e outras opções de implantação, con

Comentários em Tempo Real

-## Funcionalidades Principais +## SurfSense vs Google NotebookLM -| Funcionalidade | Descrição | -|----------------|-----------| -| Alternativa OSS | Substituto direto do NotebookLM, Perplexity e Glean com colaboração em equipe em tempo real | -| 50+ Formatos de Arquivo | Faça upload de documentos, imagens, vídeos via LlamaCloud, Unstructured ou Docling (local) | -| Busca Híbrida | Semântica + Texto completo com Índices Hierárquicos e Reciprocal Rank Fusion | -| Respostas com Citações | Converse com sua base de conhecimento e obtenha respostas citadas no estilo Perplexity | -| Arquitetura de Agentes Profundos | Alimentado por [LangChain Deep Agents](https://docs.langchain.com/oss/python/deepagents/overview) com planejamento, subagentes e acesso ao sistema de arquivos | -| Suporte Universal de LLM | 100+ LLMs, 6000+ modelos de embeddings, todos os principais rerankers via OpenAI spec e LiteLLM | -| Privacidade em Primeiro Lugar | Suporte completo a LLM local (vLLM, Ollama) seus dados ficam com você | -| Colaboração em Equipe | RBAC com papéis de Proprietário / Admin / Editor / Visualizador, chat em tempo real e threads de comentários | -| Geração de Vídeos | Gera vídeos com narração e visuais | -| Geração de Apresentações | Cria apresentações editáveis baseadas em slides | -| Geração de Podcasts | Podcast de 3 min em menos de 20 segundos; múltiplos provedores TTS (OpenAI, Azure, Kokoro) | -| Extensão de Navegador | Extensão multi-navegador para salvar qualquer página web, incluindo páginas protegidas por autenticação | -| 27+ Conectores | Mecanismos de busca, Google Drive, OneDrive, Dropbox, Slack, Teams, Jira, Notion, GitHub, Discord e [mais](#fontes-externas) | -| Auto-Hospedável | Código aberto, Docker em um único comando ou Docker Compose completo para produção | +| Recurso | Google NotebookLM | SurfSense | +|---------|-------------------|-----------| +| **Fontes por Notebook** | 50 (Grátis) a 600 (Ultra, $249.99/mês) | Ilimitadas | +| **Número de Notebooks** | 100 (Grátis) a 500 (planos pagos) | Ilimitados | +| **Limite de Tamanho da Fonte** | 500.000 palavras / 200MB por fonte | Sem limite | +| **Preços** | Nível gratuito disponível; Pro $19.99/mês, Ultra $249.99/mês | Gratuito e de código aberto, auto-hospedável na sua própria infra | +| **Suporte a LLM** | Apenas Google Gemini | 100+ LLMs via OpenAI spec e LiteLLM | +| **Modelos de Embeddings** | Apenas Google | 6.000+ modelos de embeddings, todos os principais rerankers | +| **LLMs Locais / Privados** | Não disponível | Suporte completo (vLLM, Ollama) - seus dados ficam com você | +| **Auto-Hospedável** | Não | Sim - Docker em um único comando ou Docker Compose completo | +| **Código Aberto** | Não | Sim | +| **Conectores Externos** | Google Drive, YouTube, sites | 27+ conectores - Mecanismos de busca, Google Drive, OneDrive, Dropbox, Slack, Teams, Jira, Notion, GitHub, Discord e [mais](#fontes-externas) | +| **Suporte a Formatos de Arquivo** | PDFs, Docs, Slides, Sheets, CSV, Word, EPUB, imagens, URLs web, YouTube | 50+ formatos - documentos, imagens, vídeos via LlamaCloud, Unstructured ou Docling (local) | +| **Busca** | Busca semântica | Busca Híbrida - Semântica + Texto completo com Índices Hierárquicos e Reciprocal Rank Fusion | +| **Respostas com Citações** | Sim | Sim - Respostas citadas no estilo Perplexity | +| **Arquitetura de Agentes** | Não | Sim - alimentado por [LangChain Deep Agents](https://docs.langchain.com/oss/python/deepagents/overview) com planejamento, subagentes e acesso ao sistema de arquivos | +| **Multiplayer em Tempo Real** | Notebooks compartilhados com papéis de Visualizador/Editor (sem chat em tempo real) | RBAC com papéis de Proprietário / Admin / Editor / Visualizador, chat em tempo real e threads de comentários | +| **Geração de Vídeos** | Visões gerais cinemáticas via Veo 3 (apenas Ultra) | Disponível (NotebookLM é melhor aqui, melhorando ativamente) | +| **Geração de Apresentações** | Slides mais bonitos mas não editáveis | Cria apresentações editáveis baseadas em slides | +| **Geração de Podcasts** | Visões gerais em áudio com hosts e idiomas personalizáveis | Disponível com múltiplos provedores TTS (NotebookLM é melhor aqui, melhorando ativamente) | +| **Extensão de Navegador** | Não | Extensão multi-navegador para salvar qualquer página web, incluindo páginas protegidas por autenticação |
Lista completa de Fontes Externas diff --git a/README.zh-CN.md b/README.zh-CN.md index 96ebb25ad..419a831ae 100644 --- a/README.zh-CN.md +++ b/README.zh-CN.md @@ -21,9 +21,28 @@ # SurfSense -将任何 LLM 连接到您的内部知识源,并与团队成员实时聊天。NotebookLM、Perplexity 和 Glean 的开源替代方案。 -SurfSense 是一个高度可定制的 AI 研究助手,可以连接外部数据源,如搜索引擎(SearxNG、Tavily、LinkUp)、Google Drive、OneDrive、Dropbox、Slack、Microsoft Teams、Linear、Jira、ClickUp、Confluence、BookStack、Gmail、Notion、YouTube、GitHub、Discord、Airtable、Google Calendar、Luma、Circleback、Elasticsearch、Obsidian 等,未来还会支持更多。 +NotebookLM 是目前最好、最实用的 AI 平台之一,但当你开始经常使用它时,你也会感受到它的局限性,总觉得还有不足之处。 + +1. 一个笔记本中可以添加的来源数量有限制。 +2. 可以拥有的笔记本数量有限制。 +3. 来源不能超过 500,000 个单词和 200MB。 +4. 你被锁定在 Google 服务中(LLM、使用模型等),没有配置选项。 +5. 有限的外部数据源和服务集成。 +6. NotebookLM 代理专门针对学习和研究进行了优化,但你可以用源数据做更多事情。 +7. 缺乏多人协作支持。 + +...还有更多。 + +**SurfSense 正是为了解决这些问题而生。** SurfSense 赋予你: + +- **控制你的数据流** - 保持数据私密和安全。 +- **无数据限制** - 添加无限数量的来源和笔记本。 +- **无供应商锁定** - 配置任何 LLM、图像、TTS 和 STT 模型。 +- **25+ 外部数据源** - 从 Google Drive、OneDrive、Dropbox、Notion 和许多其他外部服务添加你的来源。 +- **实时多人协作支持** - 在共享笔记本中轻松与团队成员协作。 + +...更多功能即将推出。 @@ -34,7 +53,7 @@ https://github.com/user-attachments/assets/cc0c84d3-1f2f-4f7a-b519-2ecce22310b1 ## 视频代理示例 -https://github.com/user-attachments/assets/cc977e6d-8292-4ffe-abb8-3b0560ef5562 +https://github.com/user-attachments/assets/012a7ffa-6f76-4f06-9dda-7632b470057a @@ -133,24 +152,29 @@ irm https://raw.githubusercontent.com/MODSetter/SurfSense/main/docker/scripts/in

实时评论

-## 核心功能 +## SurfSense vs Google NotebookLM -| 功能 | 描述 | -|------|------| -| 开源替代方案 | 支持实时团队协作的 NotebookLM、Perplexity 和 Glean 替代品 | -| 50+ 文件格式 | 通过 LlamaCloud、Unstructured 或 Docling(本地)上传文档、图像、视频 | -| 混合搜索 | 语义搜索 + 全文搜索,结合层次化索引和倒数排名融合 | -| 引用回答 | 与知识库对话,获得 Perplexity 风格的引用回答 | -| 深度代理架构 | 基于 [LangChain Deep Agents](https://docs.langchain.com/oss/python/deepagents/overview) 构建,支持规划、子代理和文件系统访问 | -| 通用 LLM 支持 | 100+ LLM、6000+ 嵌入模型、所有主流重排序器,通过 OpenAI spec 和 LiteLLM | -| 隐私优先 | 完整本地 LLM 支持(vLLM、Ollama),您的数据由您掌控 | -| 团队协作 | RBAC 角色控制(所有者/管理员/编辑者/查看者),实时聊天和评论线程 | -| 视频生成 | 生成带有旁白和视觉效果的视频 | -| 演示文稿生成 | 创建可编辑的幻灯片式演示文稿 | -| 播客生成 | 20 秒内生成 3 分钟播客;多种 TTS 提供商(OpenAI、Azure、Kokoro) | -| 浏览器扩展 | 跨浏览器扩展,保存任何网页,包括需要身份验证的页面 | -| 27+ 连接器 | 搜索引擎、Google Drive、OneDrive、Dropbox、Slack、Teams、Jira、Notion、GitHub、Discord 等[更多](#外部数据源) | -| 可自托管 | 开源,Docker 一行命令或完整 Docker Compose 用于生产环境 | +| 功能 | Google NotebookLM | SurfSense | +|---------|-------------------|-----------| +| **每个笔记本的来源数** | 50(免费)到 600(Ultra,$249.99/月) | 无限制 | +| **笔记本数量** | 100(免费)到 500(付费方案) | 无限制 | +| **来源大小限制** | 500,000 词 / 200MB 每个来源 | 无限制 | +| **定价** | 免费版可用;Pro $19.99/月,Ultra $249.99/月 | 免费开源,在自己的基础设施上自托管 | +| **LLM 支持** | 仅 Google Gemini | 100+ LLM,通过 OpenAI spec 和 LiteLLM | +| **嵌入模型** | 仅 Google | 6,000+ 嵌入模型,所有主流重排序器 | +| **本地 / 私有 LLM** | 不可用 | 完整支持(vLLM、Ollama)- 您的数据由您掌控 | +| **可自托管** | 否 | 是 - Docker 一行命令或完整 Docker Compose | +| **开源** | 否 | 是 | +| **外部连接器** | Google Drive、YouTube、网站 | 27+ 连接器 - 搜索引擎、Google Drive、OneDrive、Dropbox、Slack、Teams、Jira、Notion、GitHub、Discord 等[更多](#外部数据源) | +| **文件格式支持** | PDF、Docs、Slides、Sheets、CSV、Word、EPUB、图像、网页 URL、YouTube | 50+ 格式 - 文档、图像、视频,通过 LlamaCloud、Unstructured 或 Docling(本地) | +| **搜索** | 语义搜索 | 混合搜索 - 语义 + 全文搜索,结合层次化索引和倒数排名融合 | +| **引用回答** | 是 | 是 - Perplexity 风格的引用回答 | +| **代理架构** | 否 | 是 - 基于 [LangChain Deep Agents](https://docs.langchain.com/oss/python/deepagents/overview) 构建,支持规划、子代理和文件系统访问 | +| **实时多人协作** | 共享笔记本,支持查看者/编辑者角色(无实时聊天) | RBAC 角色控制(所有者/管理员/编辑者/查看者),实时聊天和评论线程 | +| **视频生成** | 通过 Veo 3 的电影级视频概览(仅 Ultra) | 可用(NotebookLM 在此方面更好,正在积极改进) | +| **演示文稿生成** | 更美观的幻灯片但不可编辑 | 创建可编辑的幻灯片式演示文稿 | +| **播客生成** | 可自定义主持人和语言的音频概览 | 可用,支持多种 TTS 提供商(NotebookLM 在此方面更好,正在积极改进) | +| **浏览器扩展** | 否 | 跨浏览器扩展,保存任何网页,包括需要身份验证的页面 |
外部数据源完整列表