Busca de Call To Actions em legendas

Boa tarde,

estou precisando buscar strings em legendas que contenham CTAs. Criei um código buscando pelo radical das palavras. Meu problema é que estão aparecendo muitos falsos-positivos. Alguém que tenha feito este tipo de trabalho, poderia me dizer como posso realizar este trabalho? Qual seria o ponto de partida?
Desde já agradeço.