SurfSense/README.es.md

11 KiB
Raw Blame History

readme_banner

SurfSense

Conecta cualquier LLM a tus fuentes de conocimiento internas y chatea con él en tiempo real junto a tu equipo. Alternativa de código abierto a NotebookLM, Perplexity y Glean.

SurfSense es un agente de investigación de IA altamente personalizable, conectado a fuentes externas como motores de búsqueda (SearxNG, Tavily, LinkUp), Google Drive, Slack, Microsoft Teams, Linear, Jira, ClickUp, Confluence, BookStack, Gmail, Notion, YouTube, GitHub, Discord, Airtable, Google Calendar, Luma, Circleback, Elasticsearch, Obsidian y más por venir.

MODSetter%2FSurfSense | Trendshift

Video

https://github.com/user-attachments/assets/cc0c84d3-1f2f-4f7a-b519-2ecce22310b1

Ejemplo de Podcast

https://github.com/user-attachments/assets/a0a16566-6967-4374-ac51-9b3e07fbecd7

Funcionalidades Principales

💡 Idea:

  • Alternativa de código abierto a NotebookLM, Perplexity y Glean. Conecta cualquier LLM a tus fuentes de conocimiento internas y colabora con tu equipo en tiempo real.

📁 Soporte de Múltiples Formatos de Archivo

  • Guarda contenido de tus archivos personales (Documentos, imágenes, videos y soporta más de 50 extensiones de archivo) en tu propia base de conocimiento personal.

🔍 Búsqueda Potente

  • Investiga o encuentra rápidamente cualquier cosa en tu contenido guardado.

💬 Chatea con tu Contenido Guardado

  • Interactúa en lenguaje natural y obtén respuestas con citas.

📄 Respuestas con Citas

  • Obtén respuestas con citas como en Perplexity.

🧩 Compatibilidad Universal

  • Conecta virtualmente cualquier proveedor de inferencia a través de la especificación OpenAI y LiteLLM.

🔔 Privacidad y Soporte de LLM Local

  • Funciona perfectamente con LLMs locales como vLLM y Ollama.

🏠 Auto-Hospedable

  • Código abierto y fácil de desplegar localmente.

👥 Colaboración en Equipo con RBAC

  • Control de acceso basado en roles para los espacios de búsqueda
  • Invita a miembros del equipo con roles personalizables (Propietario, Admin, Editor, Visor)
  • Permisos granulares para documentos, chats, conectores y configuración
  • Comparte bases de conocimiento de forma segura dentro de tu organización
  • Los chats de equipo se actualizan en tiempo real y puedes "Chatear sobre el chat" en hilos de comentarios

🎙️ Podcasts

  • Agente de generación de podcasts ultrarrápido. (Crea un podcast de 3 minutos en menos de 20 segundos.)
  • Convierte tus conversaciones de chat en contenido de audio atractivo
  • Soporte para proveedores TTS locales (Kokoro TTS)
  • Soporte para múltiples proveedores TTS (OpenAI, Azure, Google Vertex AI)

🤖 Arquitectura de Agentes Profundos

  • Impulsado por LangChain Deep Agents - agentes que pueden planificar, usar subagentes y aprovechar sistemas de archivos para tareas complejas.

📊 Técnicas Avanzadas de RAG

  • Soporta más de 100 LLMs
  • Soporta más de 6000 modelos de embeddings
  • Soporta todos los principales rerankers (Pinecone, Cohere, Flashrank, etc.)
  • Utiliza índices jerárquicos (configuración RAG de 2 niveles)
  • Utiliza búsqueda híbrida (Semántica + Texto completo combinado con Reciprocal Rank Fusion)

Fuentes Externas

  • Motores de búsqueda (Tavily, LinkUp)
  • SearxNG (instancias auto-hospedadas)
  • Google Drive
  • Slack
  • Microsoft Teams
  • Linear
  • Jira
  • ClickUp
  • Confluence
  • BookStack
  • Notion
  • Gmail
  • Videos de YouTube
  • GitHub
  • Discord
  • Airtable
  • Google Calendar
  • Luma
  • Circleback
  • Elasticsearch
  • Obsidian
  • y más por venir.....

📄 Extensiones de Archivo Soportadas

Servicio ETL Formatos Notas
LlamaCloud 50+ formatos Documentos, presentaciones, hojas de cálculo, imágenes
Unstructured 34+ formatos Formatos principales + soporte de email
Docling Formatos principales Procesamiento local, no requiere clave API

Audio/Video (vía servicio STT): .mp3, .wav, .mp4, .webm, etc.

🔖 Extensión Multi-Navegador

  • La extensión de SurfSense se puede usar para guardar cualquier página web que desees.
  • Su principal uso es guardar páginas web protegidas por autenticación.

SOLICITUDES DE FUNCIONES Y FUTURO

SurfSense está en desarrollo activo. Aunque aún no está listo para producción, puedes ayudarnos a acelerar el proceso.

¡Únete al Discord de SurfSense y ayuda a dar forma al futuro de SurfSense!

🚀 Hoja de Ruta

¡Mantente al día con nuestro progreso de desarrollo y próximas funcionalidades!
Consulta nuestra hoja de ruta pública y contribuye con tus ideas o comentarios:

📋 Discusión de la Hoja de Ruta: SurfSense 2025-2026 Roadmap: Deep Agents, Real-Time Collaboration & MCP Servers

📊 Tablero Kanban: SurfSense Project Board

¿Cómo empezar?

Inicio Rápido con Docker 🐳

Tip

Para despliegues en producción, usa la configuración completa de Docker Compose que ofrece más control y escalabilidad.

Linux/macOS:

docker run -d -p 3000:3000 -p 8000:8000 -p 5133:5133 \
  -v surfsense-data:/data \
  --name surfsense \
  --restart unless-stopped \
  ghcr.io/modsetter/surfsense:latest

Windows (PowerShell):

docker run -d -p 3000:3000 -p 8000:8000 -p 5133:5133 `
  -v surfsense-data:/data `
  --name surfsense `
  --restart unless-stopped `
  ghcr.io/modsetter/surfsense:latest

Con Configuración Personalizada:

Puedes pasar cualquier variable de entorno usando flags -e:

docker run -d -p 3000:3000 -p 8000:8000 -p 5133:5133 \
  -v surfsense-data:/data \
  -e EMBEDDING_MODEL=openai://text-embedding-ada-002 \
  -e OPENAI_API_KEY=your_openai_api_key \
  -e AUTH_TYPE=GOOGLE \
  -e GOOGLE_OAUTH_CLIENT_ID=your_google_client_id \
  -e GOOGLE_OAUTH_CLIENT_SECRET=your_google_client_secret \
  -e ETL_SERVICE=LLAMACLOUD \
  -e LLAMA_CLOUD_API_KEY=your_llama_cloud_key \
  --name surfsense \
  --restart unless-stopped \
  ghcr.io/modsetter/surfsense:latest

Note

  • Si despliegas detrás de un proxy inverso con HTTPS, agrega -e BACKEND_URL=https://api.yourdomain.com

Después de iniciar, accede a SurfSense en:

Comandos Útiles:

docker logs -f surfsense      # Ver logs
docker stop surfsense         # Detener
docker start surfsense        # Iniciar
docker rm surfsense           # Eliminar (datos preservados en el volumen)

Opciones de Instalación

SurfSense ofrece múltiples opciones para empezar:

  1. SurfSense Cloud - La forma más fácil de probar SurfSense sin ninguna configuración.

    • No requiere instalación
    • Acceso instantáneo a todas las funcionalidades
    • Perfecto para empezar rápidamente
  2. Inicio Rápido Docker (Arriba) - Un solo comando para tener SurfSense funcionando localmente.

    • Imagen todo-en-uno con PostgreSQL, Redis y todos los servicios incluidos
    • Perfecto para evaluación, desarrollo y despliegues pequeños
    • Datos persistidos vía volumen Docker
  3. Docker Compose (Producción) - Despliegue de stack completo con servicios separados.

    • Incluye pgAdmin para gestión de base de datos a través de interfaz web
    • Soporta personalización de variables de entorno vía archivo .env
    • Opciones de despliegue flexibles (stack completo o solo servicios principales)
    • Mejor para producción con escalado independiente de servicios
  4. Instalación Manual - Para usuarios que prefieren más control sobre su configuración o necesitan personalizar su despliegue.

Las guías de Docker e instalación manual incluyen instrucciones detalladas específicas para Windows, macOS y Linux.

Antes de la instalación auto-hospedada, asegúrate de completar los pasos de configuración previos incluyendo:

  • Configuración de autenticación (opcional - por defecto usa autenticación LOCAL)
  • Servicio ETL de Procesamiento de Archivos (opcional - por defecto usa Docling):
    • Docling (por defecto, procesamiento local, no requiere clave API, soporta PDF, documentos Office, imágenes, HTML, CSV)
    • Clave API de Unstructured.io (soporta 34+ formatos)
    • Clave API de LlamaIndex (análisis mejorado, soporta 50+ formatos)
  • Otras claves API según sea necesario para tu caso de uso

Contribuir

¡Las contribuciones son muy bienvenidas! Una contribución puede ser tan pequeña como una o incluso encontrar y crear issues. El ajuste fino del Backend siempre es deseado.

Para guías detalladas de contribución, consulta nuestro archivo CONTRIBUTING.md.

Historial de Stars

Star History Chart

Catalyst Project