GUIKAR741
10/10/2019 - 9:33 PM

Sanitize String

from unicodedata import combining, normalize
from re import sub

def sanitizestring(palavra):
        """."""
        # Unicode normalize transforma um caracter em seu equivalente em latin.
        nfkd = normalize('NFKD', palavra)
        palavrasemacento = u"".join([c for c in nfkd if not combining(c)])
        # Usa expressão regular para retornar a palavra apenas com números, letras e espaço
        return sub('[^a-zA-Z0-9 ]', '', palavrasemacento)

sanitazestring("abcábç")