Vai al contenuto principale
Coronavirus: aggiornamenti per la comunità universitaria / Coronavirus: updates for UniTo Community
Tipologia
Tesi teorica
Argomento
Natural Language Processing
Disponibile dal
01/10/2019
Presso
Tesi presso azienda Intervieweb S.r.l. (Zucchetti)
Altre informazioni

 

Tesi presso azienda Intervieweb S.r.l. (Zucchetti)
Disponibile dal 01/10/2019

Il gruppo Data Science di Intervieweb -- attivo nell'implementazione di soluzioni Machine Learning nel dominio recruiting e gestione delle Risorse Umane -- offre due possibilità di tesi magistrali a
studenti di Fisica e Fisica dei Sistemi Complessi.


1) La prima proposta di tesi si colloca nell'ambito del Natural Language Processing; l'obiettivo è la creazione di un chatbot "goal-oriented" che sia in grado di interagire con un utente in uno o più
dei seguenti ambiti:
a) servizio di indirizzamento e screening di candidati: il chatbot deve conversare con un candidato che mandi il suo CV a un’azienda, usando come base informazioni estratte dal CV mediante il software
già presente in azienda; sulla base delle risposte del candidato deve reindirizzarlo verso la/le proposta/e più in linea con il suo profilo, effettuando al contempo uno pre-screening dei candidati
(verificando la vicinanza del profilo alla posizione e la presenza di determinate competenze richieste)
b) servizio di supporto ai clienti di un prodotto (il prodotto di riferimento è In-recruiting, ma una generalizzazione di parte del lavoro è possibile); il chatbot deve "capire" quale sia la tipologia
di problema, se possibile dovrà fornire direttamente una risposta, in caso contrario smistare la richiesta sulla base dell'argomento.


2) La seconda proposta di tesi si inquadra all'intersezione fra Computer Vision e Natural Language Processing; l'obiettivo è la creazione di un tool in grado di estrarre informazione da determinati
tipi di documenti (in particolare curriculum vitae) in formato immagine. Più in dettaglio, si vuole:
a) individuare la "naturale" suddivisione del documento in sezioni sulla base di elementi grafici
b) riconoscere il tipo di ogni sezione (per esempio: testo, grafico, immagine generica,...)
c) estrarre il testo dalle sezioni di tipo testuale (OCR, parsing)
d) estrarre alcune informazioni da sezioni non testuali


In entrambi i casi la tesi comporterà una fase preliminare di ricerca e studio dello stato dell'arte per l'ambito in questione; la parte principale del lavoro consisterà nel seguire la pipeline dello
sviluppo dalla creazione del database al rilascio di una versione prototipale del codice (preferibilmente in python) che permetta di raggiungere gli obiettivi descritti mediante l'implementazione, con
gli opportuni adattamenti e miglioramenti, delle tecniche studiate.
La tesi sarà inoltre un’occasione per il candidato per entrare in contatto con varie tecnologie quali python, Flask, Docker, ElasticSearch, MongoDB, API, etc.

 

Stato
Disponibile

Rivolgersi a:

Docente
Prof. Michele Caselle
Email
michele.caselle@unito.it
Telefono
011 6707205
Ultimo aggiornamento: 01/10/2019 16:24
Non cliccare qui!