Che cos'è la ricerca semantica ?
La ricerca semantica (semantic serch) è un processo informatico di ricerca delle informazioni in un documento o in una base di conoscenza, tramite la comprensione del testo. È utilizzata sul web dai motori di ricerca per affinare i risultati.
Prima di addentrarci nell'argomento ci soffermiamo sulla parola semantica: in greco significa comprensione. Il campo di studio della semantica è lo studio del significato delle parole e dell'ontologia logica.
Un algoritmo di ricerca semantica ha lo scopo di comprendere il significato del linguaggio naturale, il contesto e l'argomento di cui si parla.
La sua applicazione in campo informatico introduce nuove e importanti tecniche di ricerca nel settore della Information Retrieval.
Che differenza c’è tra la ricerca classica e quella semantica ?
Un algoritmo di ricerca classica, come il page rank, utilizza i link per calcolare l'importanza (ranking) delle risorse su un particolare argomento, mentre un algoritmo della semantic search studia direttamente la semantica del testo delle risorse.
I primi search engine sul Web offrono come risposta un elenco di risorse sulla base dell'analisi delle parole chiave (ricerca per keyword) presenti sia nella query dell'utente che nel testo delle risorse. Questo approccio, detto della ricerca classica, è stato progressivamente superato in quanto espone a errori di interpretazione e allo spam-engine.
Per migliorare i risultati i search engine più moderni abbandonano la ricerca classica ed iniziano ad analizzare altri fattori di valutazione diversi dalle parole chiave, come la relazione tra le parole, i sinonimi e la vicinanza di un insieme di parole a un particolare concetto, allo scopo di fornire all'utente dei risultati di ricerca pertinenti nei confronti della sua domanda (query).
Con la ricerca semantica l'algoritmo cerca di comprendere il vero significato della query di un utente e del documento, indipendentemente dalle parole chiave utilizzate.
Questo approccio di ricerca è molto vicino al linguaggio naturale utilizzato dagli uomini per comunicare.
Quali sono gli approcci della ricerca semantica ?
Esistono diversi approcci alla ricerca semantica ed è possibile riepilogarli in euristiche e algoritmi di comprensione.
Le euristiche: si tratta di algoritmi che analizzano le relazioni tra i termini di un documento per stimare l'argomento o il concetto di cui parla, l'intento di chi scrive e il pubblico a cui si rivolge. Questi algoritmi impiegano poche risorse, sono efficienti, ma non assicurano la migliore qualità del risultato. L'algoritmo non comprende il significato del testo ma si limita a stimare la sua vicinanza a un concetto ( topic, entities, ecc. ) sulla base dei segnali presenti nel documento.
Gli algoritmi di comprensione: questi algoritmi analizzano la struttura e i termini del linguaggio naturale per ricostruirne il significato logico delle frasi. Per funzionare necessitano di un'ampia base di conoscenza a cui far riferimento. Si tratta di algoritmi poco efficienti e molto complessi, poiché impiegano una grande quantità di risorse e di tempo di elaborazione, ma sono in grado di raggiungere livelli di qualità superiori. In questo caso, l'algoritmo non si limita a stimare l'argomento, bensì cerca di comprendere il significato vero e proprio del documento.
Esiste una base dati semantica ?
Nella ricerca semantica sono comprese diverse tecniche IR (Information Retrieval) di recupero della conoscenza da una base dati. Spesso i dati sono strutturati in ontologie per semplificare lo studio delle relazioni tra le parole e i concetti. L'uso delle ontologie è uno dei fondamenti dei linguaggi del web semantico.
Le basi dati semantiche sono anche una forma di rappresentazione dei domini di conoscenza e, per questa ragione, sono anche dette basi di conoscenza.
Quali sono gli elementi della ricerca semantica ?
La semantic search sul web è composta da tre parti: l'insieme delle Universal Resource Identifier ( URI ), una struttura Resource Description Framework ( RDF ) e una libreria di ontologie.
Le URI sono l'insieme dei documenti e delle pagine web, su cui risiedono le informazioni.
Lo schema RDF consente di associare alle informazioni una struttura standardizzata.
L'Ontologia, infine, associa alle parole un significato.
Fonte: https://www.okpedia.it/ricerca_semantica.