Panoramica
Per un data scientist, la lettera di presentazione deve fare qualcosa che il portfolio di progetti non riesce a fare da solo: collegare modelli e algoritmi a impatto sul business. AUC-ROC e metriche di performance sono importanti, ma il recruiter vuole sapere quanti soldi hai fatto risparmiare o guadagnare all'azienda.
Questa lettera e di Eleonora Vitale, data scientist con cinque anni di esperienza nel settore finanziario. Lavora in UniCredit e si candida per il team di Advanced Analytics di Intesa Sanpaolo. La lettera e efficace perche ogni modello menzionato e collegato a un risultato di business concreto.
L'apertura: specializzazione di settore
Mi candido per la posizione di Data Scientist presso il team di Advanced Analytics di Intesa Sanpaolo. Con cinque anni di esperienza nello sviluppo di modelli di machine learning per il settore finanziario, conosco le sfide specifiche della modellizzazione del rischio e dell'analisi testuale in ambito bancario.
Eleonora non si presenta come "data scientist generica." Si presenta come specialista del settore finanziario. Per Intesa Sanpaolo, questo e fondamentale. I modelli finanziari hanno vincoli regolamentari e di interpretabilita che non esistono in altri settori.
Il corpo: modelli e impatto
Ho sviluppato un modello di credit scoring con XGBoost che ha migliorato l'AUC-ROC dal 0,78 al 0,91, implementato un sistema NLP per l'analisi automatica di 45.000 bilanci aziendali all'anno, e ridotto le perdite su crediti del 18% nel segmento PMI.
L'AUC-ROC da 0,78 a 0,91 e un miglioramento enorme nel credit scoring. Ma il dato veramente potente e la riduzione delle perdite su crediti del 18%. Questo e denaro risparmiato, e nel banking le perdite su crediti sono una voce di bilancio cruciale.
Il sistema NLP su 45.000 bilanci e i modelli in produzione su un portfolio di 127 miliardi di euro danno la scala. Non sono modelli accademici. Sono modelli che gestiscono rischio reale su cifre enormi.
Per la tua lettera: Se sei un data scientist, menziona sempre la metrica tecnica (AUC-ROC, accuracy, F1) e il risultato di business (riduzione perdite, aumento revenue, risparmio di tempo). Servono entrambi.
Cosa rende questa lettera forte
Specializzazione verticale. Il settore finanziario ha le sue regole. Eleonora lo sa e lo dimostra.
Scala dei modelli. 127 miliardi di euro di portfolio e 45.000 bilanci. Non sono esperimenti.
Collegamento tecnica-business. Dal 0,78 al 0,91 di AUC-ROC e un dato tecnico. -18% di perdite su crediti e un dato di business. La lettera ha entrambi.
Errori frequenti
Parlare solo di algoritmi. XGBoost, TensorFlow, PyTorch. Va bene, ma qual e stato l'impatto? Il recruiter non assume che un buon modello abbia generato valore.
Dimenticare la scala. Un modello che gira su 1.000 record e un modello che gira su 127 miliardi di portfolio sono cose diverse.
Non menzionare la produzione. Molti data scientist fanno modelli che restano in Jupyter Notebook. Se i tuoi sono in produzione, dillo. E un differenziatore importante.





