Tecnologias e plataformas | Infraestrutura aberta

visão geral

Conteúdo

Dos princípios de seleção às plataformas. Cada link leva ao respectivo capítulo.

Princípios de seleção

Padrões abertos para capacidade operacional.

Conhecimento e recuperação

Pesquise, indexe, analise.

Tempo de execução e memória

Objetos de conhecimento e contexto.

Lojas de vetores

Tornar o conhecimento endereçável.

Plataforma de dados

Armazenamento e modelos.

Transmissão

Mova os dados em vez de copiá-los.

transformação

Pipelines e orquestração.

IA e inferência

Modelos intercambiáveis.

agentes

Automação com limites.

Back-end

APIs e serviços.

Front-end

Camada de experiência.

Implantação

Plataforma e operações.

Observabilidade

Qualidade e transparência.

Segurança

Identidade e acesso.

Documentos

Conteúdo e análise.

Seleção

Requisitos em vez de exageros.

Evitar

Expansão e bloqueio de ferramentas.

Por que Kaufman AIS

Sistemas utilizáveis.

Perguntas frequentes

Código aberto, auto-hospedagem, modelos.

Nossos princípios de seleção

Enterprise AI Open Source e plataformas abertas são meios, não fins em si mesmos. Escolhemos blocos de construção com base em princípios arquitetônicos, não em religião de ferramentas. Os princípios a seguir orientam a arquitetura e as operações de IA empresarial em projetos.

Padrões abertos

Interfaces e formatos abertos facilitam a integração, a portabilidade e a operabilidade a longo prazo através das fronteiras do sistema.

API primeiro

Serviços e camadas de conhecimento podem ser acessados por meio de APIs. Isto cria sistemas modulares de conhecimento empresarial em vez de soluções isoladas monolíticas.

Nuvem opcional

As arquiteturas funcionam em nuvem, nuvem privada e local. A IA soberana e a IA auto-hospedada permanecem planejáveis.

Possível auto-hospedado

Componentes críticos podem ser operados em seu próprio data center. O controle sobre dados, modelos e acesso permanece com a empresa.

Modular

Os blocos de construção são intercambiáveis. Recuperação, memória, inferência e assistência permanecem dissociadas e expansíveis.

Portátil

Cargas de trabalho e configurações são transferíveis entre ambientes. Não há dependência desnecessária de fornecedor no nível da infraestrutura.

Modelo Agnóstico

Os modelos são intercambiáveis. O que importa é a base, a governança e a conexão com o conhecimento da empresa, e não de um único fornecedor.

Operacional

A tecnologia deve funcionar nas operações empresariais. Observabilidade, segurança, escalabilidade e capacidade de manutenção fazem parte da arquitetura.

Sistemas de conhecimento e recuperação

Os sistemas de conhecimento combinam fontes, índice, análise e recuperação. Esses blocos de construção tornam o conhecimento corporativo detectável e endereçável. Eles fazem parte da camada de conhecimento e não substituem a governança e as permissões.

OpenSearch

Plataforma de pesquisa e análise de código aberto para texto completo, agregações e consultas escalonáveis.

Índice de texto completo e pesquisa corporativa

Elasticsearch

Mecanismo de pesquisa e análise amplamente utilizado com rico ecossistema de indexação e observabilidade.

Camadas de pesquisa e análise

Qdrant

Banco de dados vetorial com foco em desempenho, filtragem e operações relacionadas à produção.

Índice vetorial para recuperação semântica

Weaviate

Banco de dados vetorial com pesquisa híbrida, módulos e funções gráficas.

Recuperação híbrida e objetos de conhecimento

Meilisearch

Mecanismo de pesquisa rápido e amigável ao desenvolvedor para aplicativos de baixa latência.

Pesquisa orientada a aplicativos e Typahead

LlamaIndex

Estrutura para conectores de dados, indexação e pipelines RAG em fontes heterogêneas.

Orquestração de pipelines de recuperação

Haystack

Estrutura de código aberto para pipelines de PNL, controle de qualidade e sistemas RAG relacionados à produção.

Estrutura de pipeline para recuperação e controle de qualidade

Apache Solr

Enterprise Search Server baseado em Lucene com pesquisa facetada e escalonamento.

Índice de texto completo corporativo clássico

Apache Tika

Detecção de conteúdo e extração de texto de documentos e formatos binários.

Análise e extração de metadados

Unstructured

Pipeline para análise de documentos, fragmentação e preparação de conteúdo não estruturado.

ETL para fontes de conhecimento não estruturadas

Cognee

Mecanismo de conhecimento para objetos de conhecimento, gráfico e memória com foco no contexto empresarial.

Tempo de execução de conhecimento e vinculação semântica

Tempo de execução de conhecimento e memória corporativa

A memória corporativa precisa de mais do que vetores. Objetos de conhecimento, contexto, vinculação e reutilização são criados em uma camada de tempo de execução por meio de armazenamentos de recuperação. Cognee combina gráfico, memória e estrutura semântica para uma arquitetura de conhecimento utilizável.

Cognee

Mecanismo de conhecimento para objetos de conhecimento estruturados, gráficos e memória em projetos empresariais.

Camada central de tempo de execução de conhecimento

Neo4j

Banco de dados gráfico para relacionamentos entre entidades, processos e objetos de conhecimento.

Gráfico de conhecimento e links

Mem0

Camada de memória para contexto persistente e referência de usuário em sistemas de assistência.

Memória de contexto para assistentes

LlamaIndex

Conectores de dados e abstrações de índice para fluxos de trabalho de recuperação repetíveis.

Índice e tempo de execução do conector

Haystack

Pipeline Runtime para controle de qualidade, RAG e etapas de processamento documentadas.

Tempo de execução do pipeline para fluxo de conhecimento

Qdrant

Loja de vetores para embeddings com filtragem e escalonamento orientado à produção.

Incorporando armazenamento na pilha de memória

LanceDB

Banco de dados vetorial incorporado para cargas de trabalho vetoriais locais e escaláveis.

Armazenamento de vetores leves

Objetos de conhecimento, contexto, memória, recuperação e vinculação funcionam juntos. Mais em O que é memória corporativa e o que é uma camada de conhecimento.

Bancos de dados vetoriais e armazenamentos de recuperação

As lojas de vetores tornam o conhecimento endereçável. Eles são um alicerce, não a única arquitetura. Aterramento, permissões e referência de fonte permanecem centrais.

Qdrant

Banco de dados vetorial orientado para produção com filtragem, fragmentação e API REST.

Índice vetorial primário

LanceDB

Loja de vetores incorporada para cargas de trabalho de borda, locais e integradas.

Armazenamento de vetores local e incorporado

Weaviate

Pesquisa híbrida com vetores, palavras-chave e módulos.

Armazenamento de recuperação híbrida

Milvus

Banco de dados vetorial escalável de código aberto para grandes quantidades de incorporação.

Clusters de vetores escaláveis

pgvector

Extensão PostgreSQL para pesquisa vetorial em cargas de trabalho relacionais.

Vetores no cenário SQL existente

Tornar o conhecimento endereçável significa incorporar incorporações na arquitetura, e não apenas instalar um armazenamento de vetores. Mais em O que é recuperação.

Plataforma e armazenamento de dados

Os sistemas de conhecimento empresarial necessitam de armazenamento resiliente para metadados, eventos, factos estruturados e objetos de conhecimento. Essas plataformas complementam os cenários existentes de ERP, CRM e DMS.

PostgreSQL

Base relacional para metadados, configuração, pgvector e cargas de trabalho transacionais.

Sistema de registro para metadados e vetores

ClickHouse

Armazenamento de colunas para análises, logs e consultas de alto volume.

Análise e armazenamento de eventos

DuckDB

Mecanismo de análise incorporado para avaliações e protótipos locais.

Análise e exploração local

Apache Iceberg

Formato de tabela aberto para data lakes escalonáveis e com controle de versão.

Lakehouse e conjuntos de dados versionados

MinIO

Armazenamento de objetos compatível com S3 para nuvem privada e auto-hospedada.

Armazenamento de objetos para dados brutos e artefatos

Redis

No armazenamento de memória para cache, filas e cargas de trabalho relacionadas à sessão.

Cache e buffers rápidos

MongoDB

Armazenamento de documentos para esquemas flexíveis e dados de aplicativos.

Armazenamento de documentos para camadas de aplicativos

Neo4j

Armazenamento de gráficos para relacionamentos e gráficos de conhecimento empresarial.

Armazenamento gráfico para atalhos

Streaming e fluxo de dados

Mova os dados em vez de copiá-los. O streaming de eventos conecta sistemas de origem com índice, memória e assistência sem cadeias de lote frágeis.

Apache Kafka

Padrão de fato para streaming de eventos e backbone de integração.

Backbone e integração de eventos

Redpanda

Plataforma de streaming compatível com Kafka e operação mais fácil.

Streaming de eventos leve

Apache Flink

Processamento de fluxo para transformações em tempo real e trabalhos com estado.

Processamento e agregação de fluxo

Debezium

Transforme a captura de dados de fontes relacionais em fluxos de eventos.

CDC de ERP e sistemas especializados

Apache Pulsar

Mensagens multilocatários com streaming e enfileiramento.

Plataforma de mensagens e eventos

O streaming é uma capacidade para os atuais cenários de conhecimento, e não um fim em si mesmo. Mais em Arquitetura de Sistemas de Conhecimento Empresarial.

Transformação e orquestração

Pipelines preparam fontes para índice, memória e assistência. A orquestração torna as dependências, as novas tentativas e a qualidade compreensíveis.

Apache Airflow

Orquestração de fluxo de trabalho para pipelines orientados por dados.

Orquestração em lote

Dagster

Orquestrador de dados com linhagem de ativos e experiência de desenvolvedor.

Pipelines baseados em ativos

dbt

Transformações baseadas em SQL com testes e documentação.

Camada de transformação no armazém

Apache Spark

Processamento distribuído para grandes quantidades de dados.

Jobs escalonáveis em lote e fluxo

Polars

Motor DataFrame rápido para cargas de trabalho locais e médias.

Transformação local eficiente

Prefect

Mecanismo de fluxo de trabalho com foco em observabilidade e fluxos dinâmicos.

Orquestração moderna de pipeline

Kestra

Orquestração orientada a eventos com fluxos declarativos.

Plataforma de fluxo de trabalho declarativa

IA e inferência

Camadas de inferência tornam os modelos operáveis. Os modelos de código aberto e comerciais permanecem intercambiáveis, desde que o aterramento, a governança e a conexão da fonte estejam corretos.

vLLM

LLM de alto rendimento servindo para inferência em nível de produção.

Serviço LLM e inferência em lote

Ollama

Tempo de execução do modelo local para cargas de trabalho de desenvolvimento e auto-hospedadas.

Inferência local e protótipos

LiteLLM

Proxy e roteamento para provedores de modelos heterogêneos por meio de uma interface.

Roteamento e abstração de modelo

Open WebUI

Interface web para interação de modelo local e remoto.

UI para uso do modelo interno

Haystack

Pipelines RAG e QA com uma estrutura de pipeline clara.

Tempo de execução do RAG

LangGraph

Agentes baseados em gráficos e fluxos de trabalho com gerenciamento de estado.

Agentes e tempo de execução do fluxo de trabalho

OpenRouter

Porta de entrada para modelos comerciais e abertos heterogêneos.

Modelo de gateway e roteamento

Agentes e automação

Os agentes complementam a assistência onde as etapas recorrentes são claramente definidas. A governação e o envolvimento humano continuam a ser centrais.

n8n

Automação do fluxo de trabalho com orquestração visual e auto-hospedagem.

Integração e fácil automação

Temporal

Execução durável para fluxos de trabalho confiáveis e duradouros.

Execução robusta de processos

Trigger.dev

Trabalhos em segundo plano e fluxos de trabalho de agentes para equipes de desenvolvimento.

Jobs em segundo plano orientados a eventos

Flowise

Construtor visual para fluxos e protótipos LLM.

Prototipagem de fluxos LLM

LangGraph

Gráficos de agente com estado para processos controlados de várias etapas.

Tempo de execução do agente com estado

CrewAI

Orquestração multiagente para funções especializadas.

Coordenação multiagente

Back-end e APIs

Serviços e APIs conectam camadas de conhecimento, camadas de inteligência e assistência. A arquitetura API First mantém as camadas desacopladas.

FastAPI

Camada de API Python moderna com digitação e OpenAPI.

Serviços REST para APIs de conhecimento

Node.js

Tempo de execução orientado a eventos para serviços intensivos de E/S e camada BFF.

Tempo de execução e integração do serviço

NestJS

Estrutura de nó estruturado para APIs empresariais.

Serviços modulares de API

Python

Linguagem dominante para IA, dados e lógica de integração.

IA e serviços de dados

TypeScript

Desenvolvimento com segurança de tipo para APIs e serviços relacionados ao frontend.

Tipos e serviços compartilhados

GraphQL

Camada de consulta flexível para dados agregados de aplicativos.

APIs de cliente flexíveis

tRPC

APIs de ponta a ponta com segurança de tipo para pilhas TypeScript.

APIs internas com segurança de tipo

gRPC

RPC eficiente para comunicação de serviço interno.

Comunicação de serviço interno

Front-end e experiência

A Experience Layer torna o conhecimento e a assistência utilizáveis. Concentre-se na clareza, nas permissões e na referência da fonte, não na sobrecarga de recursos.

Next.js

React Framework para aplicativos web de alto desempenho e SSR.

Estrutura de aplicativo da web

React

Biblioteca UI baseada em componentes para interfaces de assistência.

Componentes da IU

Tailwind CSS

Utilitário CSS para interfaces consistentes e de fácil manutenção.

Base do sistema de design

Shadcn UI

Componentes acessíveis baseados em Radix e Tailwind.

Biblioteca de componentes de UI

Vercel

Implantação e hospedagem de borda para cargas de trabalho de front-end.

Hospedagem e visualização de implantações

Implantação e plataforma

A infraestrutura empresarial deve ser implantável de maneira reproduzível. Contêineres, Kubernetes e Infraestrutura como Código são ferramentas padrão, não exageros.

Docker

Embalagem de contêineres para serviços reproduzíveis.

Imagens de contêiner

Kubernetes

Orquestração para cargas de trabalho escaláveis e resilientes.

Plataforma de contêineres

OpenTofu

Infraestrutura de código aberto como Code Fork do Terraform.

IaC com modelo de governança aberto

Terraform

IaC amplamente utilizado para ambientes de nuvem e híbridos.

Infraestrutura como código

Helm

Gerenciador de pacotes para implantações do Kubernetes.

Gerenciamento de lançamento do K8

GitHub Actions

CI/CD para repositórios e automação.

Integração contínua

GitLab CI

CI/CD integrado em ambientes GitLab.

Automação de pipeline

Caddy

TLS automático e proxy reverso para serviços de borda.

Proxy de borda e TLS

Observabilidade e qualidade

A IA empresarial precisa de mensurabilidade. Latência, erros, custos e qualidade devem ser visíveis sem dispersão de ferramentas.

Prometheus

Coleta de métricas e alertas para serviços.

Métricas e alertas

Grafana

Painéis para métricas, logs e rastreamentos.

Visualização e painéis

OpenTelemetry

Padrão aberto para rastreamentos, métricas e logs.

Telemetria Unificada

Sentry

Rastreamento de erros para aplicativos e serviços.

Análise de erros

Loki

Agregação de logs no ecossistema Grafana.

Armazenamento e consulta de log

Jaeger

Rastreamento distribuído para microsserviços e pipelines.

Análise de rastreamento

Segurança e Identidade

A segurança é um requisito arquitetônico. Identidade, segredos e proteção de borda fazem parte das operações empresariais, e não de um projeto separado em estágio final.

Keycloak

Gerenciamento de identidade e acesso de código aberto.

Provedores de SSO e OIDC

Authentik

Plataforma de identidade flexível para cenários auto-hospedados.

Provedor de identidade

Vault

Gerenciamento de segredos e credenciais dinâmicas.

Segredos e gerenciamento de chaves

Traefik

Proxy reverso e entrada nativos da nuvem.

Entrada e roteamento

Caddy

Terminador TLS simples e proxy reverso.

Edge TLS e proxy

Documentos e conteúdo

O conteúdo não estruturado costuma ser o maior conjunto de conhecimento. Análise, OCR e normalização são pré-requisitos para uma recuperação confiável.

Apache Tika

Extraia texto e metadados de formatos Office, PDF e binários.

Análise universal de documentos

OCRmyPDF

Pipeline de OCR para PDFs pesquisáveis.

OCR e preparação de PDF

Tesseract

Mecanismo de OCR de código aberto para documentos digitalizados.

Reconhecimento de texto em digitalizações

Pandoc

Conversão entre formatos de documentos.

Conversão de formato

LibreOffice

Conversão e renderização sem cabeça de documentos do Office.

Renderização e exportação de escritório

Como escolhemos tecnologias

Deliberadamente não prometemos nenhuma preferência de ferramenta. A seleção segue requisitos, operações, governança, custos, escala, soberania e integração em paisagens existentes. A IA empresarial de código aberto faz sentido quando a operação, a segurança e a capacidade de manutenção estão corretas no contexto empresarial.

Obtenha requisitos de casos de uso, arquitetura e conformidade, não do entusiasmo das ferramentas
Verifique a capacidade operacional, incluindo monitoramento, backup, atualizações e modelo de suporte
Planeje antecipadamente a governança de dados, modelos, permissões e auditoria
Considere os custos de toda a operação, não apenas o preço da licença ou da API
Avalie o dimensionamento com base no volume de dados, número de usuários e requisitos de latência
Soberania e auto-hospedagem como uma opção se os dados e modelos permanecerem internamente
Garanta a integração com ERP, CRM, DMS e Identidade sem remover e substituir

As decisões sobre pilha de tecnologia empresarial são decisões de arquitetura. Mais em Construir vs Comprar IA e Governança de IA para empresas de médio porte.

O que evitamos conscientemente

A arquitetura de capacidade geralmente falha devido a muitas iniciativas paralelas sem um modelo comum. Evitamos padrões que impressionam no curto prazo, mas dificultam a manutenção e a transparência no longo prazo.

Expansão de ferramentas com plataformas paralelas sem camadas e responsabilidades claras
O fornecedor fica preso à infraestrutura, modelo ou formatos de dados proprietários sem uma estratégia de saída
Plataformas desnecessárias que duplicam sistemas existentes em vez de conectar conhecimento
Compromisso inicial do modelo antes de arquitetura, fontes e governança esclarecidas
Excesso de arquiteturas de agentes sem limites claros, aprovações e participação humana

Não há mais ferramentas. Sistemas mais utilizáveis. Mais em O que é Agentic AI e por que a IA falha sem o conhecimento da empresa.

Por que Kaufman AIS

A Kaufman AIS desenvolve sistemas de conhecimento empresarial e sistemas de inteligência aplicada para empresas de médio e grande porte na Europa. Para nós, a tecnologia é um meio para uma arquitetura de conhecimento utilizável, assistência digital e operação confiável.

Sistemas de conhecimento empresarial como uma arquitetura integrada, não como uma coleção de ferramentas
Infraestrutura aberta com auto-hospedagem, nuvem opcional e data centers europeus
IA soberana com controle sobre fontes, modelos e operações
Camada de conhecimento com recuperação, permissões e conexão de origem
Assistência digital com base e governança para departamentos
Memória empresarial para reutilização de decisões e conhecimento de processos

Não há mais ferramentas. Sistemas mais utilizáveis. Mais em Sistemas de conhecimento empresarial, IA soberana e ChatGPT interno para empresas.

Perguntas frequentes

Quais tecnologias o Kaufman AIS usa?

Trabalhamos de forma tecnologicamente neutra com código aberto e plataformas abertas para sistemas de conhecimento, recuperação, inferência, assistência e operação. A seleção específica segue arquitetura e requisitos por projeto. Esta página mostra blocos de construção típicos, não uma lista obrigatória fixa.

Você trabalha apenas com código aberto?

Não. O código aberto costuma ser a base para camadas de conhecimento, infraestrutura e operações. Modelos comerciais, serviços em nuvem e sistemas empresariais existentes podem ser complementos úteis se a integração e a governação estiverem corretas.

A auto-hospedagem é possível?

Sim. Muitas arquiteturas podem ser operadas localmente ou em uma nuvem privada. A IA auto-hospedada faz parte de configurações soberanas para que os dados, modelos e acesso permaneçam dentro da empresa. Mais em Sovereign AI.

Os sistemas existentes podem permanecer?

Sim. Os sistemas de conhecimento corporativo normalmente são baseados em ERP, CRM, DMS e identidade, em vez de substituir tudo. Mais em silos de dados sem migração de sistema.

Quais modelos você suporta?

Os modelos são intercambiáveis. Oferecemos suporte a modelos de API e peso aberto por meio de camadas de roteamento e inferência. Aterramento, referência de fonte e governança são cruciais, e não um único fornecedor.

Como você começa?

Muitas vezes com um caso de uso com fontes claras, uso mensurável e um modelo operacional definido. Arquitetura de contorno paralelo, camada de conhecimento e governança. Mais em Transformação de IA e O que é prontidão para IA.

As ferramentas são intercambiáveis. A arquitetura e a capacidade operacional determinam a IA empresarial sustentável.

Ajudaremos você a determinar quais tecnologias e plataformas fazem sentido para a arquitetura do seu sistema de conhecimento empresarial. A conversa é voltada para gestão, gestão de TI, arquitetura empresarial, engenharia e digitalização.

Organize uma conversa

Contato

Fale conosco sobre suas estruturas de conhecimento do cenário de dados e possíveis aplicações de sistemas assistentes inteligentes em sua organização.

Sua pessoa de contato Philipp T. Schröder