Tecnologie e piattaforme | Infrastruttura aperta

panoramica

Contenuto

Dai principi di selezione alle piattaforme. Ogni collegamento porta al rispettivo capitolo.

Principi di selezione

Standard aperti alla capacità operativa.

Conoscenza e recupero

Cerca, indicizza, analizza.

Autonomia e memoria

Oggetti della conoscenza e contesto.

Negozi di vettore

Rendere indirizzabile la conoscenza.

Piattaforma dati

Archiviazione e modelli.

Streaming

Sposta i dati invece di copiarli.

trasformazione

Pipeline e orchestrazione.

IA e inferenza

Modelli intercambiabili.

agenti

Automazione con limiti.

Backend

API e servizi.

Fine frontale

Livello di esperienza.

Distribuzione

Piattaforma e operazioni.

Osservabilità

Qualità e trasparenza.

Sicurezza

Identità e accesso.

Documenti

Contenuto e analisi.

Selezione

Requisiti invece di pubblicità.

Evitare

Espansione e lock-in degli strumenti.

Perché Kaufman AIS

Sistemi utilizzabili.

Domande frequenti

Open source, self hosting, modelli.

I nostri principi di selezione

Enterprise AI Open Source e le piattaforme aperte sono mezzi, non fini a se stessi. Scegliamo elementi costitutivi basati su principi architettonici, non sulla religione degli strumenti. I seguenti principi guidano l'architettura e le operazioni dell'AI aziendale nei progetti.

Standard aperti

Interfacce e formati aperti facilitano l'integrazione, la portabilità e l'operatività a lungo termine oltre i confini del sistema.

Prima l'API

È possibile accedere ai servizi e ai livelli di conoscenza tramite API. Ciò crea sistemi di conoscenza aziendale modulari invece di soluzioni isolate monolitiche.

Nuvola opzionale

Le architetture funzionano in cloud, private cloud e on premise. L’intelligenza artificiale sovrana e l’intelligenza artificiale self-hosted rimangono pianificabili.

Possibile hosting autonomo

I componenti critici possono essere gestiti nel vostro data center. Il controllo su dati, modelli e accesso rimane dell'azienda.

Modulare

Gli elementi costitutivi sono intercambiabili. Retrieval, memory, inference and assistance remain decoupled and expandable.

Portatile

I carichi di lavoro e le configurazioni sono trasferibili tra ambienti. Nessun vincolo inutile al fornitore a livello di infrastruttura.

Modello agnostico

I modelli sono intercambiabili. Ciò che conta è la base, la governance e il collegamento con la conoscenza dell’azienda, non un singolo fornitore.

Operativo

La tecnologia deve funzionare nelle operazioni aziendali. Osservabilità, sicurezza, scalabilità e manutenibilità fanno parte dell'architettura.

Sistemi di conoscenza e recupero

I sistemi di conoscenza combinano fonti, indicizzazione, analisi e recupero. Questi elementi costitutivi rendono la conoscenza aziendale rilevabile e indirizzabile. Fanno parte del livello di conoscenza, non sostituiscono la governance e le autorizzazioni.

OpenSearch

Piattaforma di ricerca e analisi open source per testo completo, aggregazioni e query scalabili.

Indice del testo completo e ricerca aziendale

Elasticsearch

Motore di ricerca e analisi ampiamente utilizzato con un ricco ecosistema di indicizzazione e osservabilità.

Livelli di ricerca e analisi

Qdrant

Database vettoriale con particolare attenzione alle prestazioni, al filtraggio e alle operazioni relative alla produzione.

Indice vettoriale per il recupero semantico

Weaviate

Database vettoriale con ricerca ibrida, moduli e funzioni grafiche.

Reperimento ibrido e oggetti di conoscenza

Meilisearch

Motore di ricerca veloce e intuitivo per gli sviluppatori per applicazioni a bassa latenza.

Ricerca orientata all'applicazione e Typehead

LlamaIndex

Framework per connettori dati, indicizzazione e pipeline RAG su origini eterogenee.

Orchestrazione delle pipeline di recupero

Haystack

Framework open source per pipeline di PNL, QA e sistemi RAG relativi alla produzione.

Framework della pipeline per il recupero e il QA

Apache Solr

Server di ricerca aziendale basato su Lucene con ricerca sfaccettata e scalabilità.

Indice full-text aziendale classico

Apache Tika

Rilevamento del contenuto ed estrazione del testo da documenti e formati binari.

Parsing ed estrazione di metadati

Unstructured

Pipeline per l'analisi, la suddivisione in blocchi e la preparazione del contenuto non strutturato dei documenti.

ETL per fonti di conoscenza non strutturate

Cognee

Motore di conoscenza per oggetti di conoscenza, grafici e memoria con particolare attenzione al contesto aziendale.

Runtime della conoscenza e collegamento semantico

Runtime della conoscenza e memoria aziendale

La memoria aziendale non ha bisogno solo di vettori. Gli oggetti di conoscenza, il contesto, il collegamento e il riutilizzo vengono creati in uno strato di runtime tramite archivi di recupero. Cognee combina grafico, memoria e struttura semantica per un'architettura della conoscenza utilizzabile.

Cognee

Motore di conoscenza per oggetti di conoscenza strutturati, grafici e memoria in progetti aziendali.

Livello runtime della conoscenza centrale

Neo4j

Database grafico per le relazioni tra entità, processi e oggetti di conoscenza.

Grafico della conoscenza e collegamento

Mem0

Livello di memoria per contesto persistente e riferimento dell'utente nei sistemi di assistenza.

Memoria di contesto per gli assistenti

LlamaIndex

Connettori dati e astrazioni di indici per flussi di lavoro di recupero ripetibili.

Runtime dell'indice e del connettore

Haystack

Runtime della pipeline per QA, RAG e fasi di elaborazione documentate.

Runtime della pipeline per il flusso di conoscenza

Qdrant

Archivio vettoriale per incorporamenti con filtraggio e ridimensionamento orientato alla produzione.

Incorporamento dell'archivio nello stack di memoria

LanceDB

Database vettoriale incorporato per carichi di lavoro vettoriali locali e scalabili.

Negozio vettoriale leggero

Oggetti di conoscenza, contesto, memoria, recupero e collegamento lavorano insieme. Maggiori informazioni in Cos'è la memoria aziendale e Cos'è un livello di conoscenza.

Database vettoriali e archivi di recupero

I negozi di vettori rendono indirizzabile la conoscenza. Sono un elemento costitutivo, non l’unica architettura. La messa a terra, le autorizzazioni e il riferimento alla fonte rimangono centrali.

Qdrant

Database vettoriale orientato alla produzione con filtraggio, partizionamento orizzontale e API REST.

Indice del vettore primario

LanceDB

Archivio vettoriale incorporato per carichi di lavoro Edge, on premise e integrati.

Archivio vettoriale locale e incorporato

Weaviate

Ricerca ibrida con vettori, parole chiave e moduli.

Archivio di recupero ibrido

Milvus

Database vettoriale scalabile open source per grandi quantità di incorporamento.

Cluster vettoriali scalabili

pgvector

Estensione PostgreSQL per la ricerca vettoriale nei carichi di lavoro relazionali.

Vettori nel panorama SQL esistente

Rendere indirizzabile la conoscenza significa incorporare elementi incorporati nell’architettura, non semplicemente installare un archivio di vettori. Maggiori informazioni in Cos'è il recupero.

Piattaforma dati e archiviazione

I sistemi di conoscenza aziendali necessitano di uno storage resiliente per metadati, eventi, fatti strutturati e oggetti di conoscenza. Queste piattaforme integrano gli scenari ERP, CRM e DMS esistenti.

PostgreSQL

Base relazionale per metadati, configurazione, pgvettori e carichi di lavoro transazionali.

Sistema di registrazione per metadati e vettori

ClickHouse

Archivio colonne per analisi, log e query a volume elevato.

Analisi e archiviazione di eventi

DuckDB

Motore di analisi integrato per valutazioni e prototipi locali.

Analisi ed esplorazione locale

Apache Iceberg

Open Table Format per data Lake scalabili e con versione.

Lakehouse e set di dati con versione

MinIO

Archiviazione di oggetti compatibile con S3 per cloud privato e self-hosted.

Archiviazione di oggetti per dati grezzi e artefatti

Redis

Archiviazione in memoria per cache, code e carichi di lavoro relativi alla sessione.

Cache e buffer veloci

MongoDB

Archivio documenti per schemi flessibili e dati applicativi.

Archiviazione di documenti per livelli di app

Neo4j

Archiviazione di grafici per relazioni e grafici della conoscenza aziendale.

Archiviazione di grafici per scorciatoie

Streaming e flusso di dati

Sposta i dati invece di copiarli. Lo streaming di eventi collega i sistemi di origine con indice, memoria e assistenza senza fragili catene batch.

Apache Kafka

Standard di fatto per lo streaming di eventi e il backbone di integrazione.

Struttura portante degli eventi e integrazione

Redpanda

Piattaforma di streaming compatibile con Kafka con funzionamento più semplice.

Streaming di eventi leggero

Apache Flink

Elaborazione del flusso per trasformazioni in tempo reale e processi con stato.

Elaborazione e aggregazione del flusso

Debezium

Modifica l'acquisizione dei dati da origini relazionali in flussi di eventi.

CDC da ERP e sistemi specialistici

Apache Pulsar

Messaggistica multi-tenant con streaming e accodamento.

Piattaforma di messaggistica ed eventi

Lo streaming è una possibilità per gli attuali paesaggi della conoscenza, non un fine in sé. Maggiori informazioni in Architettura dei sistemi di conoscenza aziendale.

Trasformazione e orchestrazione

Le pipeline preparano le fonti per l'indice, la memoria e l'assistenza. L'orchestrazione rende comprensibili le dipendenze, i tentativi e la qualità.

Apache Airflow

Orchestrazione del flusso di lavoro per pipeline basate sui dati.

Orchestrazione batch

Dagster

Orchestratore di dati con derivazione delle risorse ed esperienza dello sviluppatore.

Condutture basate sugli asset

dbt

Trasformazioni basate su SQL con test e documentazione.

Strato di trasformazione nel magazzino

Apache Spark

Elaborazione distribuita per grandi quantità di dati.

Lavori batch e flussi scalabili

Polars

Motore DataFrame veloce per carichi di lavoro locali e di medie dimensioni.

Trasformazione locale efficiente

Prefect

Motore del flusso di lavoro con particolare attenzione all'osservabilità e ai flussi dinamici.

Orchestrazione moderna della pipeline

Kestra

Orchestrazione guidata dagli eventi con flussi dichiarativi.

Piattaforma del flusso di lavoro dichiarativo

IA e inferenza

I livelli di inferenza rendono i modelli utilizzabili. I modelli open source e commerciali rimangono intercambiabili purché la messa a terra, la governance e la connessione alla fonte siano corrette.

vLLM

LLM a throughput elevato utilizzato per l'inferenza a livello di produzione.

Servizio LLM e inferenza batch

Ollama

Runtime del modello locale per carichi di lavoro di sviluppo e self-hosted.

Inferenza locale e prototipi

LiteLLM

Proxy e routing per fornitori di modelli eterogenei tramite un'unica interfaccia.

Routing e astrazione del modello

Open WebUI

Interfaccia Web per l'interazione del modello locale e remoto.

Interfaccia utente per l'utilizzo del modello interno

Haystack

Pipeline RAG e QA con una struttura chiara della pipeline.

RAG Runtime

LangGraph

Agenti e flussi di lavoro basati su grafici con gestione dello stato.

Agenti e runtime del flusso di lavoro

OpenRouter

Gateway per modelli commerciali e aperti eterogenei.

Gateway e modello di routing

Agenti e automazione

Gli agenti integrano l'assistenza laddove i passaggi ricorrenti sono chiaramente definiti. La governance e il coinvolgimento umano rimangono centrali.

n8n

Automazione del flusso di lavoro con orchestrazione visiva e self-hosting.

Integrazione e facile automazione

Temporal

Esecuzione duratura per flussi di lavoro affidabili e duraturi.

Esecuzione robusta del processo

Trigger.dev

Lavori in background e flussi di lavoro degli agenti per i team di sviluppo.

Lavori in background guidati da eventi

Flowise

Costruttore visivo per flussi e prototipi LLM.

Prototipazione di flussi LLM

LangGraph

Grafici ad agenti con stato per processi multifase controllati.

Runtime dell'agente con stato

CrewAI

Orchestrazione multi-agente per ruoli specializzati.

Coordinamento multiagente

Backend e API

Servizi e API collegano livelli di conoscenza, livelli di intelligence e assistenza. L'architettura API First mantiene i livelli disaccoppiati.

FastAPI

Livello API Python moderno con digitazione e OpenAPI.

Servizi REST per API della conoscenza

Node.js

Runtime basato sugli eventi per servizi ad uso intensivo di I/O e livello BFF.

Runtime e integrazione del servizio

NestJS

Framework di nodi strutturati per API aziendali.

Servizi API modulari

Python

Linguaggio dominante per intelligenza artificiale, dati e logica di integrazione.

IA e servizi dati

TypeScript

Sviluppo indipendente dai tipi per API e servizi correlati al frontend.

Tipologie e servizi condivisi

GraphQL

Livello di query flessibile per dati applicativi aggregati.

API client flessibili

tRPC

API indipendenti dai tipi end-to-end per stack TypeScript.

API interne indipendenti dai tipi

gRPC

RPC efficiente per la comunicazione interna del servizio.

Comunicazione interna del servizio

Frontend ed esperienza

Experience Layer rende fruibili conoscenze e assistenza. Concentrati sulla chiarezza, sulle autorizzazioni e sul riferimento alla fonte, non sul sovraccarico di funzionalità.

Next.js

React Framework per app Web e SSR ad alte prestazioni.

Struttura dell'app Web

React

Libreria UI basata su componenti per interfacce di assistenza.

Componenti dell'interfaccia utente

Tailwind CSS

CSS di utilità per interfacce coerenti e manutenibili.

Base del sistema di progettazione

Shadcn UI

Componenti accessibili basati su Radix e Tailwind.

Libreria dei componenti dell'interfaccia utente

Vercel

Distribuzione e hosting edge per carichi di lavoro frontend.

Hosting e anteprima delle distribuzioni

Distribuzione e piattaforma

L'infrastruttura aziendale deve essere distribuibile in modo riproducibile. Container, Kubernetes e Infrastructure as Code sono strumenti standard, non pubblicità.

Docker

Packaging in contenitori per servizi riproducibili.

Immagini del contenitore

Kubernetes

Orchestrazione per carichi di lavoro scalabili e resilienti.

Piattaforma portacontainer

OpenTofu

Infrastruttura open source come fork del codice da Terraform.

IaC con modello di governance aperta

Terraform

IaC ampiamente utilizzato per ambienti cloud e ibridi.

Infrastruttura come codice

Helm

Gestore pacchetti per distribuzioni Kubernetes.

Gestione dei rilasci di K8

GitHub Actions

CI/CD per repository e automazione.

Integrazione continua

GitLab CI

CI/CD integrato in ambienti GitLab.

Automazione della pipeline

Caddy

TLS automatico e proxy inverso per servizi edge.

Edge Proxy e TLS

Osservabilità e qualità

L’intelligenza artificiale aziendale ha bisogno di misurabilità. Latenza, errori, costi e qualità devono essere visibili senza proliferazione degli strumenti.

Prometheus

Raccolta di metriche e avvisi per i servizi.

Metriche e avvisi

Grafana

Dashboard per parametri, log e tracce.

Visualizzazione e dashboard

OpenTelemetry

Standard aperto per tracce, metriche e log.

Telemetria unificata

Sentry

Tracciamento degli errori per applicazioni e servizi.

Analisi degli errori

Loki

Aggregazione dei log nell'ecosistema Grafana.

Archiviazione e query dei registri

Jaeger

Tracciatura distribuita per microservizi e pipeline.

Analisi delle tracce

Sicurezza e identità

La sicurezza è un requisito architettonico. Identità, segreti e protezione dei confini fanno parte delle operazioni aziendali, non di un progetto separato in fase avanzata.

Keycloak

Gestione dell'identità e degli accessi open source.

Fornitori SSO e OIDC

Authentik

Piattaforma di identità flessibile per scenari self-hosted.

Fornitore di identità

Vault

Gestione dei segreti e credenziali dinamiche.

Segreti e gestione delle chiavi

Traefik

Proxy inverso e ingresso nativi del cloud.

Ingresso e instradamento

Caddy

Terminatore TLS semplice e proxy inverso.

Edge TLS e proxy

Documenti e contenuti

Il contenuto non strutturato è spesso il più grande bacino di conoscenza. L'analisi, l'OCR e la normalizzazione sono prerequisiti per un recupero affidabile.

Apache Tika

Estrai testo e metadati da formati Office, PDF e binari.

Analisi universale dei documenti

OCRmyPDF

Pipeline OCR per PDF ricercabili.

PDF OCR e preparazione

Tesseract

Motore OCR open source per documenti scansionati.

Riconoscimento del testo nelle scansioni

Pandoc

Conversione tra formati di documenti.

Conversione del formato

LibreOffice

Conversione e rendering headless di documenti Office.

Rendering ed esportazione di uffici

Come scegliamo le tecnologie

Non promettiamo deliberatamente alcuna preferenza per lo strumento. La selezione segue i requisiti, le operazioni, la governance, i costi, la scalabilità, la sovranità e l’integrazione nei paesaggi esistenti. L'AI aziendale open source ha senso quando il funzionamento, la sicurezza e la manutenibilità sono adatti al contesto aziendale.

Deriva i requisiti dai casi d'uso, dall'architettura e dalla conformità, non dall'hype sugli strumenti
Verifica la capacità operativa, inclusi monitoraggio, backup, aggiornamenti e modello di supporto
Pianificare in anticipo la governance per dati, modelli, autorizzazioni e audit
Considera i costi dell'intera operazione, non solo la licenza o il prezzo dell'API
Valuta la scalabilità in base al volume di dati, al numero di utenti e ai requisiti di latenza
Sovranità e self-hosting come opzione se dati e modelli dovessero rimanere interni
Garantisci l'integrazione in ERP, CRM, DMS e identità senza modifiche e sostituzioni

Le decisioni sullo stack tecnologico aziendale sono decisioni sull'architettura. Maggiori informazioni in Costruisci o Acquista AI e Governance dell'AI per le aziende di medie dimensioni.

Ciò che evitiamo consapevolmente

L’architettura delle capacità spesso fallisce a causa di troppe iniziative parallele senza un modello comune. Evitiamo modelli che fanno impressione nel breve termine ma rendono difficile il mantenimento e la trasparenza nel lungo termine.

Espansione degli strumenti con piattaforme parallele senza livelli e responsabilità chiari
Il fornitore si vincola all'infrastruttura, al modello o ai formati di dati proprietari senza una strategia di uscita
Piattaforme inutili che duplicano i sistemi esistenti invece di connettere la conoscenza
Impegno anticipato sul modello prima che venga chiarita l’architettura, le fonti e la governance
Architetture di agenti eccessive senza confini chiari, approvazioni e partecipazione umana

Niente più strumenti. Sistemi più utilizzabili. Maggiori informazioni in Cos'è l'Agentic AI e perché l'AI fallisce senza che l'azienda ne sia a conoscenza.

Perché Kaufman AIS

Kaufman AIS sviluppa sistemi di conoscenza aziendale e sistemi di intelligenza applicata per aziende di medie e grandi dimensioni in Europa. Per noi la tecnologia è un mezzo per un'architettura della conoscenza utilizzabile, un'assistenza digitale e un funzionamento sicuro.

Sistemi di conoscenza aziendale come architettura integrata, non come insieme di strumenti
Infrastruttura aperta con self-hosting, cloud opzionale e data center europei
IA sovrana con controllo su fonti, modelli e operazioni
Livello di conoscenza con recupero, autorizzazioni e connessione alla fonte
Assistenza digitale al grounding e alla governance dei dipartimenti
Memoria aziendale per il riutilizzo della conoscenza delle decisioni e dei processi

Niente più strumenti. Sistemi più utilizzabili. Maggiori informazioni in Sistemi di conoscenza aziendale, AI sovrana e ChatGPT interna per le aziende.

Domande frequenti

Quali tecnologie utilizza Kaufman AIS?

Lavoriamo in modo neutrale dal punto di vista tecnologico con open source e piattaforme aperte per sistemi di conoscenza, recupero, inferenza, assistenza e funzionamento. La selezione specifica segue l'architettura e i requisiti del progetto. Questa pagina mostra gli elementi costitutivi tipici, non un elenco obbligatorio fisso.

Lavori solo con l'open source?

No. L'open source è spesso la base per i livelli di conoscenza, l'infrastruttura e le operazioni. I modelli commerciali, i servizi cloud e i sistemi aziendali esistenti possono essere utili complementi se l’integrazione e la governance sono corrette.

È possibile il self-hosting?

SÌ. Molte architetture possono essere gestite on premise o in un cloud privato. L’intelligenza artificiale self-hosted fa parte di strutture sovrane se i dati, i modelli e l’accesso devono rimanere all’interno dell’azienda. Altro su Sovereign AI.

I sistemi esistenti possono rimanere?

SÌ. I sistemi di conoscenza aziendale in genere si basano su ERP, CRM, DMS e identità anziché sostituire tutto. Di più nei silos di dati senza migrazione del sistema.

Quali modelli supportate?

I modelli sono intercambiabili. Supportiamo modelli API e pesi aperti tramite livelli di routing e inferenza. La messa a terra, il riferimento alla fonte e la governance sono cruciali, non un unico fornitore.

Come inizi?

Spesso con un caso d'uso con fonti chiare, utilizzo misurabile e un modello operativo definito. Architettura di struttura parallela, livello di conoscenza e governance. Maggiori informazioni in Trasformazione dell'intelligenza artificiale e Che cos'è la preparazione all'intelligenza artificiale.

Gli strumenti sono intercambiabili. L'architettura e la capacità operativa determinano l'intelligenza artificiale aziendale sostenibile.

Ti aiuteremo a determinare quali tecnologie e piattaforme sono adatte per l'architettura del tuo sistema di conoscenza aziendale. La conversazione è rivolta al management, alla gestione IT, all'architettura aziendale, all'ingegneria e alla digitalizzazione.

Organizza una conversazione

Contatto

Parlaci delle tue strutture di conoscenza del panorama dei dati e delle potenziali applicazioni dei sistemi di assistenza intelligenti all'interno della tua organizzazione.

Il tuo referente Philipp T. Schröder