Vers une meilleure adéquation entre texte et image grâce à la modulation de l’attention