J’en conviens, il s’agit d’un mot barbare
Cependant, ce qu’il cache est très simple : lemmatiser un texte signifie qu’on va mettre tous les mots au singulier et tous les verbes à l’infinitif… Chaque mot prend alors ce qu’on appelle sa forme canonique : on appelle ça un lemme.
Vous pourrez remarquer que tous les mots d’un dictionnaire sont lemmatisés.
Il ne faut pas confondre la lemmatisation avec la troncature, qui consiste simplement à enlever des bouts de mot pour simplifier la phrase. Par exemple, le s du pluriel s’en va. La lemmatisation est beaucoup plus complexe puisqu’elle nécessite de connaître (un minimum) la grammaire pour aller rechercher le lemme de chaque mot.