LexCensurae (Anonymizer PDF Desktop)
Un'applicazione desktop enterprise progettata per l'anonimizzazione e la redazione automatica di documenti PDF sensibili tramite intelligenza artificiale e computer vision.
La Sfida di Business
La rimozione manuale di dati sensibili (PII) e volti umani da documenti legali o clinici prima della pubblicazione richiede ore ed è soggetta a sviste critiche che espongono informazioni riservate.
Scelte Tecniche & Architettura
Applicazione desktop Windows nativa sviluppata in C# e .NET con interfaccia WinUI 3 (Windows App SDK). Integra modelli ONNX locali per il Named Entity Recognition (NER) testuale e OpenCV per la detection automatica dei volti umani all'interno delle pagine renderizzate.
La Soluzione & Impatto
Individuazione e oscuramento istantaneo di nomi, indirizzi, codici fiscali e volti umani con un solo click. Riduce drasticamente il tempo di redazione e protegge i dati sensibili da leaks di pubblicazione.
using var cascade = new CascadeClassifier(cascadePath);
using var pdfiumDoc = PdfDocument.Load(pdfPath);
var faces = cascade.DetectMultiScale(
mat,
scaleFactor: 1.1,
minNeighbors: 4,
flags: HaarDetectionTypes.ScaleImage,
minSize: new Size(30, 30));
foreach (var face in faces) {
double pdfX = face.X * scaleX;
double pdfY = pdfHeight - (face.Y * scaleY) - (face.Height * scaleY);
entities.Add(new SensitiveEntity("Volto Umano", pageNum, pdfX, pdfY, face.Width, face.Height));
}