Tecnologías y plataformas | Infraestructura abierta

descripción general

Contenido

De los principios de selección a las plataformas. Cada enlace conduce al capítulo respectivo.

Principios de selección

Estándares abiertos a la capacidad operativa.

Conocimiento y recuperación

Buscar, indexar, analizar.

Tiempo de ejecución y memoria

Objetos de conocimiento y contexto.

Tiendas de vectores

Hacer que el conocimiento sea abordable.

Plataforma de datos

Almacenamiento y modelos.

Transmisión

Mueva datos en lugar de copiarlos.

transformación

Canalizaciones y orquestación.

IA e inferencia

Modelos intercambiables.

agentes

Automatización con límites.

backend

API y servicios.

Interfaz

Capa de experiencia.

Despliegue

Plataforma y operaciones.

Observabilidad

Calidad y transparencia.

Seguridad

Identidad y acceso.

Documentos

Contenido y análisis.

Selección

Requisitos en lugar de exageraciones.

Evitar

Expansión y bloqueo de herramientas.

¿Por qué Kaufman AIS?

Sistemas utilizables.

Preguntas frecuentes

Código abierto, alojamiento propio, modelos.

Nuestros principios de selección

El código abierto de IA empresarial y las plataformas abiertas son medios, no fines en sí mismos. Elegimos bloques de construcción basados en principios arquitectónicos, no en la religión de herramientas. Los siguientes principios guían la arquitectura y las operaciones de IA empresarial en proyectos.

Estándares abiertos

Las interfaces y los formatos abiertos facilitan la integración, la portabilidad y la operatividad a largo plazo a través de los límites del sistema.

API primero

Se puede acceder a los servicios y capas de conocimiento a través de API. Esto crea sistemas modulares de conocimiento empresarial en lugar de soluciones monolíticas aisladas.

Nube opcional

Las arquitecturas funcionan en nube, nube privada y on premise. La IA soberana y la IA autohospedada siguen siendo planificables.

Posibilidad de alojamiento propio

Los componentes críticos pueden operarse en su propio centro de datos. El control sobre los datos, los modelos y el acceso permanece en la empresa.

Modular

Los bloques de construcción son intercambiables. La recuperación, la memoria, la inferencia y la asistencia permanecen desacopladas y ampliables.

Portátil

Las cargas de trabajo y las configuraciones son transferibles entre entornos. Sin dependencia innecesaria de proveedores a nivel de infraestructura.

Agnóstico del modelo

Los modelos son intercambiables. Lo que importa es la base, la gobernanza y la conexión con el conocimiento de la empresa, no un único proveedor.

Operacional

La tecnología debe funcionar en las operaciones empresariales. La observabilidad, la seguridad, el escalamiento y la mantenibilidad son parte de la arquitectura.

Sistemas de conocimiento y recuperación.

Los sistemas de conocimiento combinan fuentes, índices, análisis y recuperación. Estos componentes básicos hacen que el conocimiento corporativo sea detectable y abordable. Son parte de la capa de conocimiento, no un reemplazo de la gobernanza y los permisos.

OpenSearch

Plataforma de búsqueda y análisis de código abierto para texto completo, agregaciones y consultas escalables.

Índice de texto completo y búsqueda empresarial

Elasticsearch

Motor de búsqueda y análisis ampliamente utilizado con un rico ecosistema de indexación y observabilidad.

Capas de búsqueda y análisis

Qdrant

Base de datos vectorial con enfoque en rendimiento, filtrado y operaciones relacionadas con la producción.

Índice vectorial para recuperación semántica

Weaviate

Base de datos vectorial con búsqueda híbrida, módulos y funciones gráficas.

Recuperación híbrida y objetos de conocimiento.

Meilisearch

Motor de búsqueda rápido y fácil de usar para desarrolladores para aplicaciones de baja latencia.

Búsqueda orientada a aplicaciones y Typahead

LlamaIndex

Marco para conectores de datos, indexación y canalizaciones RAG sobre fuentes heterogéneas.

Orquestación de tuberías de recuperación.

Haystack

Marco de código abierto para canalizaciones de PNL, control de calidad y sistemas RAG relacionados con la producción.

Marco de canalización para recuperación y control de calidad

Apache Solr

Enterprise Search Server basado en Lucene con búsqueda por facetas y escalado.

Índice de texto completo empresarial clásico

Apache Tika

Detección de contenido y extracción de texto de documentos y formatos binarios.

Análisis y extracción de metadatos.

Unstructured

Canalización para análisis, fragmentación y preparación de contenido no estructurado de documentos.

ETL para fuentes de conocimiento no estructuradas

Cognee

Motor de conocimiento para objetos de conocimiento, gráficos y memoria con enfoque en el contexto empresarial.

Tiempo de ejecución del conocimiento y vinculación semántica

Tiempo de ejecución del conocimiento y memoria empresarial

La memoria empresarial necesita más que vectores. Los objetos de conocimiento, el contexto, los enlaces y la reutilización se crean en una capa de tiempo de ejecución a través de almacenes de recuperación. Cognee combina gráficos, memoria y estructura semántica para una arquitectura de conocimiento utilizable.

Cognee

Motor de conocimiento para objetos de conocimiento estructurados, gráficos y memoria en proyectos empresariales.

Capa de tiempo de ejecución de conocimiento central

Neo4j

Base de datos gráfica para relaciones entre entidades, procesos y objetos de conocimiento.

Gráfico de conocimiento y vinculación.

Mem0

Capa de memoria para contexto persistente y referencia del usuario en sistemas de asistencia.

Memoria de contexto para asistentes

LlamaIndex

Conectores de datos y abstracciones de índices para flujos de trabajo de recuperación repetibles.

Tiempo de ejecución de índices y conectores

Haystack

Pipeline Runtime para control de calidad, RAG y pasos de procesamiento documentados.

Tiempo de ejecución de canalización para el flujo de conocimiento

Qdrant

Almacén de vectores para incrustaciones con filtrado y escalado orientado a producción.

Incrustar tienda en la pila de memoria

LanceDB

Base de datos vectorial integrada para cargas de trabajo vectoriales locales y escalables.

Tienda de vectores ligeros

Los objetos de conocimiento, el contexto, la memoria, la recuperación y la vinculación trabajan juntos. Más información en Qué es la memoria empresarial y Qué es una capa de conocimiento.

Bases de datos vectoriales y almacenes de recuperación.

Los almacenes de vectores hacen que el conocimiento sea accesible. Son un bloque de construcción, no la única arquitectura. La conexión a tierra, los permisos y la referencia de fuentes siguen siendo fundamentales.

Qdrant

Base de datos vectorial orientada a producción con filtrado, fragmentación y API REST.

Índice de vector primario

LanceDB

Tienda de vectores integrada para cargas de trabajo integradas, locales y perimetrales.

Tienda de vectores local e integrada

Weaviate

Búsqueda híbrida con vectores, palabras clave y módulos.

Tienda de recuperación híbrida

Milvus

Base de datos vectorial escalable de código abierto para grandes cantidades de incorporación.

Clústeres de vectores escalables

pgvector

Extensión PostgreSQL para búsqueda vectorial en cargas de trabajo relacionales.

Vectores en el panorama SQL existente

Hacer que el conocimiento sea accesible significa incorporar incorporaciones en la arquitectura, no solo instalar un almacén de vectores. Más información en Qué es la recuperación.

Plataforma y almacenamiento de datos.

Los sistemas de conocimiento empresarial necesitan un almacenamiento resistente para metadatos, eventos, hechos estructurados y objetos de conocimiento. Estas plataformas complementan los panoramas ERP, CRM y DMS existentes.

PostgreSQL

Base relacional para metadatos, configuración, pgvector y cargas de trabajo transaccionales.

Sistema de Registro de metadatos y vectores

ClickHouse

Almacén de columnas para análisis, registros y consultas de gran volumen.

Análisis y almacenamiento de eventos.

DuckDB

Motor de análisis integrado para evaluaciones y prototipos locales.

Análisis y exploración local.

Apache Iceberg

Formato de tabla abierto para lagos de datos versionados y escalables.

Lakehouse y conjuntos de datos versionados

MinIO

Almacenamiento de objetos compatible con S3 para nube privada y autohospedada.

Almacenamiento de objetos para datos sin procesar y artefactos.

Redis

Almacén en memoria para caché, colas y cargas de trabajo relacionadas con sesiones.

Caché y buffers rápidos

MongoDB

Almacén de documentos para esquemas flexibles y datos de aplicaciones.

Almacenamiento de documentos para capas de aplicaciones

Neo4j

Almacenamiento de gráficos para relaciones y gráficos de conocimiento empresarial.

Almacenamiento de gráficos para atajos

Streaming y flujo de datos

Mueva datos en lugar de copiarlos. La transmisión de eventos conecta los sistemas de origen con índice, memoria y asistencia sin frágiles cadenas de lotes.

Apache Kafka

Estándar de facto para transmisión de eventos y columna vertebral de integración.

Integración y columna vertebral del evento

Redpanda

Plataforma de streaming compatible con Kafka con un funcionamiento más sencillo.

Transmisión de eventos ligera

Apache Flink

Procesamiento en streaming para transformaciones en tiempo real y trabajos con estado.

Procesamiento y agregación de transmisiones

Debezium

Cambie la captura de datos de fuentes relacionales a flujos de eventos.

CDC de ERP y sistemas especializados

Apache Pulsar

Mensajería multiinquilino con streaming y colas.

Plataforma de mensajería y eventos

La transmisión es una capacidad para los panoramas de conocimiento actuales, no un fin en sí mismo. Más información en Arquitectura de sistemas de conocimiento empresarial.

Transformación y orquestación

Las canalizaciones preparan fuentes para índice, memoria y asistencia. La orquestación hace que las dependencias, los reintentos y la calidad sean comprensibles.

Apache Airflow

Orquestación del flujo de trabajo para canalizaciones basadas en datos.

Orquestación por lotes

Dagster

Orquestador de datos con linaje de activos y experiencia de desarrollador.

Canalizaciones basadas en activos

dbt

Transformaciones basadas en SQL con pruebas y documentación.

Capa de transformación en el almacén.

Apache Spark

Procesamiento distribuido para grandes cantidades de datos.

Trabajos en secuencia y por lotes escalables

Polars

Fast DataFrame Engine para cargas de trabajo locales y medianas.

Transformación local eficiente

Prefect

Motor de flujo de trabajo con enfoque en observabilidad y flujos dinámicos.

Orquestación de tuberías moderna

Kestra

Orquestación impulsada por eventos con flujos declarativos.

Plataforma de flujo de trabajo declarativo

IA e inferencia

Las capas de inferencia hacen que los modelos sean operables. Los modelos comerciales y de código abierto siguen siendo intercambiables siempre que la conexión a tierra, la gobernanza y la conexión de origen sean correctas.

vLLM

LLM de alto rendimiento que sirve para inferencia a nivel de producción.

Servicio de LLM e inferencia por lotes

Ollama

Tiempo de ejecución de modelo local para desarrollo y cargas de trabajo autohospedadas.

Inferencia local y prototipos.

LiteLLM

Proxy y enrutamiento para proveedores de modelos heterogéneos a través de una interfaz.

Enrutamiento y abstracción de modelos.

Open WebUI

Interfaz web para interacción de modelos locales y remotos.

UI para uso del modelo interno

Haystack

Tuberías RAG y QA con una estructura de tubería clara.

Tiempo de ejecución de RAG

LangGraph

Agentes basados en gráficos y flujos de trabajo con gestión de estado.

Agentes y tiempo de ejecución del flujo de trabajo

OpenRouter

Puerta de entrada a modelos comerciales heterogéneos y abiertos.

Modelo de puerta de enlace y enrutamiento

Agentes y automatización

Los agentes complementan la asistencia cuando los pasos recurrentes están claramente definidos. La gobernanza y la participación humana en el circuito siguen siendo fundamentales.

n8n

Automatización del flujo de trabajo con orquestación visual y autohospedaje.

Integración y fácil automatización

Temporal

Ejecución duradera para flujos de trabajo confiables y duraderos.

Ejecución robusta del proceso

Trigger.dev

Trabajos en segundo plano y flujos de trabajo de agentes para equipos de desarrollo.

Trabajos en segundo plano impulsados por eventos

Flowise

Constructor visual para flujos y prototipos de LLM.

Creación de prototipos de flujos de LLM

LangGraph

Gráficos de agentes con estado para procesos controlados de varios pasos.

Tiempo de ejecución del agente con estado

CrewAI

Orquestación multiagente para roles especializados.

Coordinación multiagente

Backend y API

Los servicios y las API conectan capas de conocimiento, capas de inteligencia y asistencia. La arquitectura API First mantiene las capas desacopladas.

FastAPI

Capa API de Python moderna con escritura y OpenAPI.

Servicios REST para API de conocimiento

Node.js

Tiempo de ejecución impulsado por eventos para servicios intensivos de E/S y capa BFF.

Tiempo de ejecución e integración del servicio

NestJS

Marco de nodo estructurado para API empresariales.

Servicios API modulares

Python

Lenguaje dominante para IA, datos y lógica de integración.

Servicios de datos e inteligencia artificial

TypeScript

Desarrollo con seguridad de tipos para API y servicios relacionados con el frontend.

Tipos y servicios compartidos

GraphQL

Capa de consulta flexible para datos de aplicaciones agregados.

API de cliente flexibles

tRPC

API de extremo a extremo con seguridad de tipos para pilas de TypeScript.

API internas con seguridad de tipos

gRPC

RPC eficiente para la comunicación de servicios internos.

Comunicación de servicio interno.

Frontend y experiencia

Experience Layer hace que el conocimiento y la asistencia sean utilizables. Céntrese en la claridad, los permisos y la referencia de fuentes, no en la sobrecarga de funciones.

Next.js

React Framework para aplicaciones web de alto rendimiento y SSR.

Marco de aplicación web

React

Biblioteca de UI basada en componentes para interfaces de asistencia.

Componentes de la interfaz de usuario

Tailwind CSS

Utilidad CSS para interfaces consistentes y fáciles de mantener.

Base del sistema de diseño.

Shadcn UI

Componentes accesibles basados en Radix y Tailwind.

Biblioteca de componentes de la interfaz de usuario

Vercel

Implementación y alojamiento perimetral para cargas de trabajo frontend.

Implementaciones de alojamiento y vista previa

Despliegue y plataforma

La infraestructura empresarial debe poder implementarse de manera reproducible. Los contenedores, Kubernetes y la infraestructura como código son herramientas estándar, no exageraciones.

Docker

Embalaje de contenedores para servicios reproducibles.

Imágenes de contenedores

Kubernetes

Orquestación para cargas de trabajo escalables y resilientes.

Plataforma de contenedores

OpenTofu

Infraestructura de código abierto como bifurcación de código de Terraform.

IaC con modelo de gobernanza abierta

Terraform

IaC ampliamente utilizado para entornos híbridos y de nube.

Infraestructura como código

Helm

Administrador de paquetes para implementaciones de Kubernetes.

Gestión de lanzamientos de K8

GitHub Actions

CI/CD para repositorios y automatización.

Integración continua

GitLab CI

CI/CD integrado en entornos GitLab.

Automatización de tuberías

Caddy

TLS automático y proxy inverso para servicios perimetrales.

Proxy perimetral y TLS

Observabilidad y calidad

La IA empresarial necesita mensurabilidad. La latencia, los errores, los costos y la calidad deben ser visibles sin una proliferación de herramientas.

Prometheus

Recopilación de métricas y alertas de servicios.

Métricas y alertas

Grafana

Paneles de control para métricas, registros y seguimientos.

Visualización y paneles de control.

OpenTelemetry

Estándar abierto para seguimientos, métricas y registros.

Telemetría unificada

Sentry

Seguimiento de errores para aplicaciones y servicios.

Análisis de errores

Loki

Agregación de registros en el ecosistema de Grafana.

Almacenamiento de registros y consulta

Jaeger

Seguimiento distribuido para microservicios y canalizaciones.

Análisis de trazas

Seguridad e Identidad

La seguridad es un requisito arquitectónico. La identidad, los secretos y la protección perimetral son parte de las operaciones empresariales, no un proyecto separado en etapa avanzada.

Keycloak

Gestión de acceso e identidad de código abierto.

Proveedores de SSO y OIDC

Authentik

Plataforma de identidad flexible para escenarios autohospedados.

Proveedor de identidad

Vault

Gestión de secretos y credenciales dinámicas.

Secretos y gestión de claves.

Traefik

Proxy inverso e ingreso nativos de la nube.

Ingreso y enrutamiento

Caddy

Terminador TLS simple y proxy inverso.

TLS perimetral y proxy

Documentos y contenido

El contenido no estructurado suele ser el mayor conjunto de conocimientos. El análisis, el OCR y la normalización son requisitos previos para una recuperación confiable.

Apache Tika

Extraiga texto y metadatos de Office, PDF y formatos binarios.

Análisis universal de documentos

OCRmyPDF

Canalización de OCR para archivos PDF con capacidad de búsqueda.

PDF OCR y preparación

Tesseract

Motor OCR de código abierto para documentos escaneados.

Reconocimiento de texto en escaneos

Pandoc

Conversión entre formatos de documentos.

Conversión de formato

LibreOffice

Conversión y representación sin cabeza de documentos de Office.

Representación y exportación de Office

Cómo elegimos las tecnologías

Deliberadamente no prometemos ninguna preferencia de herramienta. La selección sigue los requisitos, las operaciones, la gobernanza, los costos, la escala, la soberanía y la integración en los paisajes existentes. La IA empresarial de código abierto tiene sentido cuando la operación, la seguridad y la mantenibilidad son adecuadas en el contexto empresarial.

Derive los requisitos a partir de casos de uso, arquitectura y cumplimiento, no de la exageración de las herramientas.
Verifique la capacidad operativa, incluido el monitoreo, la copia de seguridad, las actualizaciones y el modelo de soporte.
Planifique la gobernanza de datos, modelos, permisos y auditorías con antelación
Considere los costos de toda la operación, no solo el precio de la licencia o la API.
Evalúe el escalado en función del volumen de datos, la cantidad de usuarios y los requisitos de latencia.
La soberanía y el autohospedaje como una opción si los datos y los modelos deben permanecer internos
Garantice la integración en ERP, CRM, DMS e Identity sin necesidad de desmontar ni reemplazar

Las decisiones sobre la pila de tecnología empresarial son decisiones de arquitectura. Más información en Construir vs Comprar IA y Gobernanza de IA para medianas empresas.

Lo que evitamos conscientemente

La arquitectura de capacidades a menudo falla debido a demasiadas iniciativas paralelas sin un modelo común. Evitamos patrones que impresionan a corto plazo pero que dificultan el mantenimiento y la transparencia a largo plazo.

Expansión de herramientas con plataformas paralelas sin niveles ni responsabilidades claras
Bloqueo del proveedor en infraestructura, modelo o formatos de datos propietarios sin una estrategia de salida
Plataformas innecesarias que duplican sistemas existentes en lugar de conectar conocimientos
Compromiso temprano del modelo antes de aclarar la arquitectura, las fuentes y la gobernanza
Exceso de arquitecturas de agentes sin límites claros, aprobaciones y humanos al tanto

No más herramientas. Sistemas más utilizables. Más información en Qué es la IA agente y por qué la IA falla sin el conocimiento de la empresa.

¿Por qué Kaufman AIS?

Kaufman AIS desarrolla sistemas de conocimiento empresarial y sistemas de inteligencia aplicada para empresas medianas y grandes en Europa. Para nosotros, la tecnología es un medio para una arquitectura de conocimiento utilizable, asistencia digital y un funcionamiento seguro.

Los sistemas de conocimiento empresarial como una arquitectura integrada, no como una colección de herramientas
Infraestructura abierta con autohospedaje, nube opcional y centros de datos europeos
IA soberana con control sobre fuentes, modelos y operaciones
Capa de conocimiento con recuperación, permisos y conexión de origen.
Asistencia digital con puesta a tierra y gobernanza para departamentos
Memoria empresarial para la reutilización de decisiones y conocimientos de procesos.

No más herramientas. Sistemas más utilizables. Más información en Sistemas de conocimiento empresarial, IA soberana y ChatGPT interno para empresas.

Preguntas frecuentes

¿Qué tecnologías utiliza Kaufman AIS?

Trabajamos de manera tecnológicamente neutral con código abierto y plataformas abiertas para sistemas de conocimiento, recuperación, inferencia, asistencia y operación. La selección específica sigue la arquitectura y los requisitos por proyecto. Esta página muestra bloques de construcción típicos, no una lista obligatoria fija.

¿Solo trabajas con código abierto?

No. El código abierto suele ser la base de las capas de conocimiento, la infraestructura y las operaciones. Los modelos comerciales, los servicios en la nube y los sistemas empresariales existentes pueden ser complementos útiles si la integración y la gobernanza son correctas.

¿Es posible el autohospedaje?

Sí. Muchas arquitecturas pueden operarse localmente o en una nube privada. La IA autohospedada es parte de configuraciones soberanas si los datos, los modelos y el acceso deben permanecer dentro de la empresa. Más en IA soberana.

¿Pueden permanecer los sistemas existentes?

Sí. Los sistemas de conocimiento empresarial normalmente se basan en ERP, CRM, DMS e identidad en lugar de reemplazarlo todo. Más información sobre silos de datos sin migración del sistema.

¿Qué modelos soporta?

Los modelos son intercambiables. Admitimos modelos API y de peso abierto a través de capas de enrutamiento e inferencia. La base, la referencia de fuentes y la gobernanza son cruciales, no un solo proveedor.

¿Cómo empiezas?

A menudo con un caso de uso con fuentes claras, uso medible y un modelo operativo definido. Esquema paralelo de arquitectura, capa de conocimiento y gobernanza. Más información en Transformación de la IA y Qué es la preparación para la IA.

Las herramientas son intercambiables. La arquitectura y la capacidad operativa determinan la IA empresarial sostenible.

Le ayudaremos a determinar qué tecnologías y plataformas tienen sentido para la arquitectura de su sistema de conocimiento empresarial. El conversatorio está dirigido a la gestión, gestión TI, arquitectura empresarial, ingeniería y digitalización.

Organizar una conversación

Contacto

Hable con nosotros sobre las estructuras de conocimiento de su panorama de datos y las posibles aplicaciones de los sistemas de asistencia inteligente dentro de su organización.

Su persona de contacto Philipp T. Schröder