Ricerca in modo unificato ed efficiente tra tutti i tuoi dati e documenti
ColumbusDoc è- veloce
- affidabile
- duttile
- semplice
- compatibile
- veloce
- affidabile
- duttile
- semplice
- compatibile
Indicizza e struttura automaticamente i tuoi documenti per trovarli e consultarli in modo semplice e immediato
columbus doc indicizza e struttura automaticamente i tuoi dati per azzerare, con la massima efficienza, i tempi di ricerca.
Highlights
-
Restituisce i risultati in meno di un secondo
-
Indicizza account di posta e dischi cloud
-
Consente di eseguire ricerche complesse in modo semplice e diretto
-
Puoi salvare le ricerche e condividere i risultati con altri utenti
-
Permette di formulare domande in linguaggio naturale
Caratteristiche

ACQUISIZIONE DATI E DOCUMENTI
Il sistema acquisisce informazioni da svariate sorgenti specificate dall’utente (o dall’amministratore del sistema) che rispettino le seguenti condizioni:
- Il legittimo proprietario abbia concesso le necessarie autorizzazione all’accesso
- La sorgente supporti l’accesso mediante interfaccia API o sia accessibile da parte di columbus attraverso un connettore custom appositamente scritto ed autorizzato

TRASFORMAZIONE
I diversi elementi documentali acquisiti hanno formati differenti.
Questa attività uniforma il formato di tutti gli elementi acquisiti al fine di ottenere documenti pdf ricercabili. A seconda del formato dell’elemento acquisito, la trasformazione può o meno includere attività differenti, quali rendering, scansione, OCR, conversione, esportazione.

ARCHIVIAZIONE OTTIMIZZATA
Il sistema procede ad archiviare in modo ottimizzato gli elementi trasformati, utilizzando storage dedicati in grado di massimizzare le performance di accesso a consultazione.
Nel rispetto della privacy e della sicurezza di accesso, vengono risolti tutti i problemi di duplicazione di contenuto che spesso si presentano nell’ambito di comunicazioni tra membri della stessa organizzazione (si pensi all’allegato di una mail a volte presente in decine di elementi, ma pur sempre unico come contenuto).
Il sistema provvede quindi ad archiviare un’unica copia di qualsiasi contenuto, identificandoli tramite funzioni di hashing e garantendo quindi, oltre al risparmio di spazio, anche il risparmio delle attività di trasformazione in caso di contenuto già trattato;
I documenti pdf ricercabili vengono archiviati anche in modalità paginata: in altre parole, il sistema provvede ad archiviare una conversione che consente di consultare una singola pagina del documento senza accedere all’intero documento. Si pensi, ad esempio, ad una ricerca che abbia identificato risultati presenti solo in alcune delle centinaia pagine di un determinato documento: l’archiviazione paginata consente di accedere immediatamente l contenuto senza dover scaricare preventivamente l’intero file.

CLASSIFICAZIONE E INDICIZZAZIONE
La fase di classificazione applica a tutti i documenti acquisiti una serie di algoritmi automatici in grado di estrarre annotare informazioni strutturate, che possono essere sia tecniche che funzionali.
Gli algoritmi di estrazione automatica delle informazioni sono combinabili secondo le necessità del cliente: è possibile quindi selezionare quali algoritmi devono essere installati, quanta capacità computazionale devono assorbire, e in che ordine devono essere eseguiti. Possono inoltre essere scritti ed installati algoritmi custom capaci di applicare logiche specifiche nell’individuazione ed estrazione dei dati strutturati. E’ inoltre possibile installare algoritmi che utilizzino servizi esterni di intelligenza artificiale, in grado di estendere ulteriormente le capacità di analisi automatica del sistema.
L’insieme di questi metadati viene poi utilizzato per arricchire la fase di indicizzazione e rendere il sistema in grado di ricercare il patrimonio informative combinando metodiche di ricerca full-text con quelle di ricerca su dati strutturati. Le informazioni strutturate, inoltre, sono un elemento fondamentale dalla capacità del sistema di consentire la ricerca esplorativa, fornendo diversi percorsi semantici di raffinamento dei risultati ottenuti.
Durante la fase di indicizzazione, vengono inoltre impostate le informazioni necessarie per garantire la sicurezza nell’accesso al patrimonio informativo, secondo meccanismi di partizionamento e condivisione, in grado di garantire che ogni utente possa ricercare solo all’interno del patrimonio a cui ha diritto di accedere.

RICERCA E CONSULTAZIONE
Al termine delle attività di classificazione e indicizzazione, il sistema mette a disposizione diverse modalità di ricerca, sia in termini funzionali che architetturali.
Ricerca attraverso il client columbus: il client dedicato, disponibile sia in modalità desktop (utilizzabile da un PC Windows) che (opzionalmente) anche in modalità mobile (utilizzabile da uno smartphone/tablet iOs/Android/Windows), mette a disposizione l’intero set di funzioni di ricerca disponibile.
La ricerca è possibile combinando elementi full-text presenti all’interno del testo del documento indicizzato con filtri sui diversi set di metadati estratti dal sistema.
Il risultato ottenuto è poi raffinabile attraverso un sistema di faceting totalmente basato sui metadati estratti. La selezione delle facet è possibile in termini di inclusione e di esclusione, rappresentando un potente e intuitivo meccanismo di selezione utile alla rapida individuazione dei contenuti ricercati.
Il sistema consente inoltre anche la cosiddetta ‘ricerca esplorativa’ che permette di esplorare l’intero patrimonio informativo senza introdurre alcuna query iniziale ma utilizzando esclusivamente il meccanismo di faceting. L’architettura del sistema consente di effettuare queste operazioni mantenendo l’efficienza prestazionale attesa.
Ricerca attraverso l’API: le principali funzionalità di ricerca sopradescritte sono disponibili anche per l’integrazione con altri sistemi, che utilizzando l’API disponibili ed i meccanismi di sicurezza opportuni, possono interrogare il sistema ed ottenere dati in formati standard da utilizzare per le proprie necessità.
