Skip to content

Este é um script que utiliza o Spacy para identificar entidades nomeadas em um texto em português e, em seguida, substitui essas entidades por caracteres de pseudônimo.

Notifications You must be signed in to change notification settings

ntsation/pseudonimizacao

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 

Repository files navigation

Pseudonimizador de Dados Pessoais

Este é um pequeno script em Python que utiliza a biblioteca Spacy para identificar entidades nomeadas em um texto em português e, em seguida, substitui essas entidades por caracteres de pseudônimo.

O objetivo é proteger a privacidade das informações pessoais presentes no texto, como nomes de pessoas, localizações, números de telefone e endereços de e-mail.

Funcionalidades

  • Identificação de entidades nomeadas como pessoas (PER) e locais (LOC) no texto.

  • Ocultação de nomes de pessoas e localizações substituindo-os por caracteres de pseudônimo (#).

  • Remoção de números de telefone e endereços de e-mail substituindo-os por caracteres de pseudônimo (#).

Referência

Medium - Demystifying Individual Privacy

About

Este é um script que utiliza o Spacy para identificar entidades nomeadas em um texto em português e, em seguida, substitui essas entidades por caracteres de pseudônimo.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages