OpenSearch
Piattaforma di ricerca e analisi open source per testo completo, aggregazioni e query scalabili.
Indice del testo completo e ricerca aziendale
tecnologia
Gli strumenti sono intercambiabili. I principi dell'architettura rimangono. Questa panoramica mostra le tecnologie open source e aperte con cui lavora Kaufman AIS o che in genere utilizziamo nei sistemi di conoscenza aziendali. Nessun marketing sullo stack tecnologico, ma trasparenza su capacità, operazioni e capacità di integrazione per la gestione, la gestione IT, l'architettura aziendale e l'ingegneria nelle aziende di medie e grandi dimensioni.
Enterprise AI Open Source e le piattaforme aperte sono mezzi, non fini a se stessi. Scegliamo elementi costitutivi basati su principi architettonici, non sulla religione degli strumenti. I seguenti principi guidano l'architettura e le operazioni dell'AI aziendale nei progetti.
I sistemi di conoscenza combinano fonti, indicizzazione, analisi e recupero. Questi elementi costitutivi rendono la conoscenza aziendale rilevabile e indirizzabile. Fanno parte del livello di conoscenza, non sostituiscono la governance e le autorizzazioni.
Piattaforma di ricerca e analisi open source per testo completo, aggregazioni e query scalabili.
Indice del testo completo e ricerca aziendale
Motore di ricerca e analisi ampiamente utilizzato con un ricco ecosistema di indicizzazione e osservabilità.
Livelli di ricerca e analisi
Database vettoriale con particolare attenzione alle prestazioni, al filtraggio e alle operazioni relative alla produzione.
Indice vettoriale per il recupero semantico
Database vettoriale con ricerca ibrida, moduli e funzioni grafiche.
Reperimento ibrido e oggetti di conoscenza
Motore di ricerca veloce e intuitivo per gli sviluppatori per applicazioni a bassa latenza.
Ricerca orientata all'applicazione e Typehead
Framework per connettori dati, indicizzazione e pipeline RAG su origini eterogenee.
Orchestrazione delle pipeline di recupero
Framework open source per pipeline di PNL, QA e sistemi RAG relativi alla produzione.
Framework della pipeline per il recupero e il QA
Server di ricerca aziendale basato su Lucene con ricerca sfaccettata e scalabilità.
Indice full-text aziendale classico
Rilevamento del contenuto ed estrazione del testo da documenti e formati binari.
Parsing ed estrazione di metadati
Pipeline per l'analisi, la suddivisione in blocchi e la preparazione del contenuto non strutturato dei documenti.
ETL per fonti di conoscenza non strutturate
Motore di conoscenza per oggetti di conoscenza, grafici e memoria con particolare attenzione al contesto aziendale.
Runtime della conoscenza e collegamento semantico
La memoria aziendale non ha bisogno solo di vettori. Gli oggetti di conoscenza, il contesto, il collegamento e il riutilizzo vengono creati in uno strato di runtime tramite archivi di recupero. Cognee combina grafico, memoria e struttura semantica per un'architettura della conoscenza utilizzabile.
Motore di conoscenza per oggetti di conoscenza strutturati, grafici e memoria in progetti aziendali.
Livello runtime della conoscenza centrale
Database grafico per le relazioni tra entità, processi e oggetti di conoscenza.
Grafico della conoscenza e collegamento
Livello di memoria per contesto persistente e riferimento dell'utente nei sistemi di assistenza.
Memoria di contesto per gli assistenti
Connettori dati e astrazioni di indici per flussi di lavoro di recupero ripetibili.
Runtime dell'indice e del connettore
Runtime della pipeline per QA, RAG e fasi di elaborazione documentate.
Runtime della pipeline per il flusso di conoscenza
Archivio vettoriale per incorporamenti con filtraggio e ridimensionamento orientato alla produzione.
Incorporamento dell'archivio nello stack di memoria
Database vettoriale incorporato per carichi di lavoro vettoriali locali e scalabili.
Negozio vettoriale leggero
Oggetti di conoscenza, contesto, memoria, recupero e collegamento lavorano insieme. Maggiori informazioni in Cos'è la memoria aziendale e Cos'è un livello di conoscenza.
I negozi di vettori rendono indirizzabile la conoscenza. Sono un elemento costitutivo, non l’unica architettura. La messa a terra, le autorizzazioni e il riferimento alla fonte rimangono centrali.
Database vettoriale orientato alla produzione con filtraggio, partizionamento orizzontale e API REST.
Indice del vettore primario
Archivio vettoriale incorporato per carichi di lavoro Edge, on premise e integrati.
Archivio vettoriale locale e incorporato
Ricerca ibrida con vettori, parole chiave e moduli.
Archivio di recupero ibrido
Database vettoriale scalabile open source per grandi quantità di incorporamento.
Cluster vettoriali scalabili
Estensione PostgreSQL per la ricerca vettoriale nei carichi di lavoro relazionali.
Vettori nel panorama SQL esistente
Rendere indirizzabile la conoscenza significa incorporare elementi incorporati nell’architettura, non semplicemente installare un archivio di vettori. Maggiori informazioni in Cos'è il recupero.
I sistemi di conoscenza aziendali necessitano di uno storage resiliente per metadati, eventi, fatti strutturati e oggetti di conoscenza. Queste piattaforme integrano gli scenari ERP, CRM e DMS esistenti.
Base relazionale per metadati, configurazione, pgvettori e carichi di lavoro transazionali.
Sistema di registrazione per metadati e vettori
Archivio colonne per analisi, log e query a volume elevato.
Analisi e archiviazione di eventi
Motore di analisi integrato per valutazioni e prototipi locali.
Analisi ed esplorazione locale
Open Table Format per data Lake scalabili e con versione.
Lakehouse e set di dati con versione
Archiviazione di oggetti compatibile con S3 per cloud privato e self-hosted.
Archiviazione di oggetti per dati grezzi e artefatti
Archiviazione in memoria per cache, code e carichi di lavoro relativi alla sessione.
Cache e buffer veloci
Archivio documenti per schemi flessibili e dati applicativi.
Archiviazione di documenti per livelli di app
Archiviazione di grafici per relazioni e grafici della conoscenza aziendale.
Archiviazione di grafici per scorciatoie
Sposta i dati invece di copiarli. Lo streaming di eventi collega i sistemi di origine con indice, memoria e assistenza senza fragili catene batch.
Standard di fatto per lo streaming di eventi e il backbone di integrazione.
Struttura portante degli eventi e integrazione
Piattaforma di streaming compatibile con Kafka con funzionamento più semplice.
Streaming di eventi leggero
Elaborazione del flusso per trasformazioni in tempo reale e processi con stato.
Elaborazione e aggregazione del flusso
Modifica l'acquisizione dei dati da origini relazionali in flussi di eventi.
CDC da ERP e sistemi specialistici
Messaggistica multi-tenant con streaming e accodamento.
Piattaforma di messaggistica ed eventi
Lo streaming è una possibilità per gli attuali paesaggi della conoscenza, non un fine in sé. Maggiori informazioni in Architettura dei sistemi di conoscenza aziendale.
Le pipeline preparano le fonti per l'indice, la memoria e l'assistenza. L'orchestrazione rende comprensibili le dipendenze, i tentativi e la qualità.
Orchestrazione del flusso di lavoro per pipeline basate sui dati.
Orchestrazione batch
Orchestratore di dati con derivazione delle risorse ed esperienza dello sviluppatore.
Condutture basate sugli asset
Trasformazioni basate su SQL con test e documentazione.
Strato di trasformazione nel magazzino
Elaborazione distribuita per grandi quantità di dati.
Lavori batch e flussi scalabili
Motore DataFrame veloce per carichi di lavoro locali e di medie dimensioni.
Trasformazione locale efficiente
Motore del flusso di lavoro con particolare attenzione all'osservabilità e ai flussi dinamici.
Orchestrazione moderna della pipeline
Orchestrazione guidata dagli eventi con flussi dichiarativi.
Piattaforma del flusso di lavoro dichiarativo
I livelli di inferenza rendono i modelli utilizzabili. I modelli open source e commerciali rimangono intercambiabili purché la messa a terra, la governance e la connessione alla fonte siano corrette.
LLM a throughput elevato utilizzato per l'inferenza a livello di produzione.
Servizio LLM e inferenza batch
Runtime del modello locale per carichi di lavoro di sviluppo e self-hosted.
Inferenza locale e prototipi
Proxy e routing per fornitori di modelli eterogenei tramite un'unica interfaccia.
Routing e astrazione del modello
Interfaccia Web per l'interazione del modello locale e remoto.
Interfaccia utente per l'utilizzo del modello interno
Pipeline RAG e QA con una struttura chiara della pipeline.
RAG Runtime
Agenti e flussi di lavoro basati su grafici con gestione dello stato.
Agenti e runtime del flusso di lavoro
Gateway per modelli commerciali e aperti eterogenei.
Gateway e modello di routing
Gli agenti integrano l'assistenza laddove i passaggi ricorrenti sono chiaramente definiti. La governance e il coinvolgimento umano rimangono centrali.
Automazione del flusso di lavoro con orchestrazione visiva e self-hosting.
Integrazione e facile automazione
Esecuzione duratura per flussi di lavoro affidabili e duraturi.
Esecuzione robusta del processo
Lavori in background e flussi di lavoro degli agenti per i team di sviluppo.
Lavori in background guidati da eventi
Costruttore visivo per flussi e prototipi LLM.
Prototipazione di flussi LLM
Grafici ad agenti con stato per processi multifase controllati.
Runtime dell'agente con stato
Orchestrazione multi-agente per ruoli specializzati.
Coordinamento multiagente
Servizi e API collegano livelli di conoscenza, livelli di intelligence e assistenza. L'architettura API First mantiene i livelli disaccoppiati.
Livello API Python moderno con digitazione e OpenAPI.
Servizi REST per API della conoscenza
Runtime basato sugli eventi per servizi ad uso intensivo di I/O e livello BFF.
Runtime e integrazione del servizio
Framework di nodi strutturati per API aziendali.
Servizi API modulari
Linguaggio dominante per intelligenza artificiale, dati e logica di integrazione.
IA e servizi dati
Sviluppo indipendente dai tipi per API e servizi correlati al frontend.
Tipologie e servizi condivisi
Livello di query flessibile per dati applicativi aggregati.
API client flessibili
API indipendenti dai tipi end-to-end per stack TypeScript.
API interne indipendenti dai tipi
RPC efficiente per la comunicazione interna del servizio.
Comunicazione interna del servizio
Experience Layer rende fruibili conoscenze e assistenza. Concentrati sulla chiarezza, sulle autorizzazioni e sul riferimento alla fonte, non sul sovraccarico di funzionalità.
React Framework per app Web e SSR ad alte prestazioni.
Struttura dell'app Web
Libreria UI basata su componenti per interfacce di assistenza.
Componenti dell'interfaccia utente
CSS di utilità per interfacce coerenti e manutenibili.
Base del sistema di progettazione
Componenti accessibili basati su Radix e Tailwind.
Libreria dei componenti dell'interfaccia utente
Distribuzione e hosting edge per carichi di lavoro frontend.
Hosting e anteprima delle distribuzioni
L'infrastruttura aziendale deve essere distribuibile in modo riproducibile. Container, Kubernetes e Infrastructure as Code sono strumenti standard, non pubblicità.
Packaging in contenitori per servizi riproducibili.
Immagini del contenitore
Orchestrazione per carichi di lavoro scalabili e resilienti.
Piattaforma portacontainer
Infrastruttura open source come fork del codice da Terraform.
IaC con modello di governance aperta
IaC ampiamente utilizzato per ambienti cloud e ibridi.
Infrastruttura come codice
Gestore pacchetti per distribuzioni Kubernetes.
Gestione dei rilasci di K8
CI/CD per repository e automazione.
Integrazione continua
CI/CD integrato in ambienti GitLab.
Automazione della pipeline
TLS automatico e proxy inverso per servizi edge.
Edge Proxy e TLS
L’intelligenza artificiale aziendale ha bisogno di misurabilità. Latenza, errori, costi e qualità devono essere visibili senza proliferazione degli strumenti.
Raccolta di metriche e avvisi per i servizi.
Metriche e avvisi
Dashboard per parametri, log e tracce.
Visualizzazione e dashboard
Standard aperto per tracce, metriche e log.
Telemetria unificata
Tracciamento degli errori per applicazioni e servizi.
Analisi degli errori
Aggregazione dei log nell'ecosistema Grafana.
Archiviazione e query dei registri
Tracciatura distribuita per microservizi e pipeline.
Analisi delle tracce
La sicurezza è un requisito architettonico. Identità, segreti e protezione dei confini fanno parte delle operazioni aziendali, non di un progetto separato in fase avanzata.
Gestione dell'identità e degli accessi open source.
Fornitori SSO e OIDC
Piattaforma di identità flessibile per scenari self-hosted.
Fornitore di identità
Gestione dei segreti e credenziali dinamiche.
Segreti e gestione delle chiavi
Proxy inverso e ingresso nativi del cloud.
Ingresso e instradamento
Terminatore TLS semplice e proxy inverso.
Edge TLS e proxy
Il contenuto non strutturato è spesso il più grande bacino di conoscenza. L'analisi, l'OCR e la normalizzazione sono prerequisiti per un recupero affidabile.
Estrai testo e metadati da formati Office, PDF e binari.
Analisi universale dei documenti
Pipeline OCR per PDF ricercabili.
PDF OCR e preparazione
Motore OCR open source per documenti scansionati.
Riconoscimento del testo nelle scansioni
Conversione tra formati di documenti.
Conversione del formato
Conversione e rendering headless di documenti Office.
Rendering ed esportazione di uffici
Non promettiamo deliberatamente alcuna preferenza per lo strumento. La selezione segue i requisiti, le operazioni, la governance, i costi, la scalabilità, la sovranità e l’integrazione nei paesaggi esistenti. L'AI aziendale open source ha senso quando il funzionamento, la sicurezza e la manutenibilità sono adatti al contesto aziendale.
Le decisioni sullo stack tecnologico aziendale sono decisioni sull'architettura. Maggiori informazioni in Costruisci o Acquista AI e Governance dell'AI per le aziende di medie dimensioni.
L’architettura delle capacità spesso fallisce a causa di troppe iniziative parallele senza un modello comune. Evitiamo modelli che fanno impressione nel breve termine ma rendono difficile il mantenimento e la trasparenza nel lungo termine.
Niente più strumenti. Sistemi più utilizzabili. Maggiori informazioni in Cos'è l'Agentic AI e perché l'AI fallisce senza che l'azienda ne sia a conoscenza.
Kaufman AIS sviluppa sistemi di conoscenza aziendale e sistemi di intelligenza applicata per aziende di medie e grandi dimensioni in Europa. Per noi la tecnologia è un mezzo per un'architettura della conoscenza utilizzabile, un'assistenza digitale e un funzionamento sicuro.
Niente più strumenti. Sistemi più utilizzabili. Maggiori informazioni in Sistemi di conoscenza aziendale, AI sovrana e ChatGPT interna per le aziende.
Lavoriamo in modo neutrale dal punto di vista tecnologico con open source e piattaforme aperte per sistemi di conoscenza, recupero, inferenza, assistenza e funzionamento. La selezione specifica segue l'architettura e i requisiti del progetto. Questa pagina mostra gli elementi costitutivi tipici, non un elenco obbligatorio fisso.
No. L'open source è spesso la base per i livelli di conoscenza, l'infrastruttura e le operazioni. I modelli commerciali, i servizi cloud e i sistemi aziendali esistenti possono essere utili complementi se l’integrazione e la governance sono corrette.
SÌ. Molte architetture possono essere gestite on premise o in un cloud privato. L’intelligenza artificiale self-hosted fa parte di strutture sovrane se i dati, i modelli e l’accesso devono rimanere all’interno dell’azienda. Altro su Sovereign AI.
SÌ. I sistemi di conoscenza aziendale in genere si basano su ERP, CRM, DMS e identità anziché sostituire tutto. Di più nei silos di dati senza migrazione del sistema.
I modelli sono intercambiabili. Supportiamo modelli API e pesi aperti tramite livelli di routing e inferenza. La messa a terra, il riferimento alla fonte e la governance sono cruciali, non un unico fornitore.
Spesso con un caso d'uso con fonti chiare, utilizzo misurabile e un modello operativo definito. Architettura di struttura parallela, livello di conoscenza e governance. Maggiori informazioni in Trasformazione dell'intelligenza artificiale e Che cos'è la preparazione all'intelligenza artificiale.
Un breve check di sistemi, punti di attrito e obiettivi mostra dove l'AI enterprise può creare più impatto.
Ti aiuteremo a determinare quali tecnologie e piattaforme sono adatte per l'architettura del tuo sistema di conoscenza aziendale. La conversazione è rivolta al management, alla gestione IT, all'architettura aziendale, all'ingegneria e alla digitalizzazione.
Parlaci delle tue strutture di conoscenza del panorama dei dati e delle potenziali applicazioni dei sistemi di assistenza intelligenti all'interno della tua organizzazione.