Praxia
Technique··7 min de lecture

Comment ChatGPT décide de citer une entreprise (et pas une autre)

Comprendre les mécanismes par lesquels les modèles de langage sélectionnent les entreprises à mentionner — sans mystère, sans jargon technique.

Vous avez peut-être remarqué que lorsque vous demandez à ChatGPT de vous recommander un prestataire dans votre secteur, certains noms reviennent systématiquement — et d'autres jamais. Ce n'est pas un hasard, ni une injustice arbitraire. C'est le résultat d'un processus d'apprentissage précis que l'on peut comprendre et influencer.

La mémoire des modèles de langage

Un modèle de langage comme GPT-4, Claude ou Gemini est entraîné sur une immense quantité de texte collecté sur le web : articles, blogs, forums, documentation, bases de données. Pendant cet entraînement, le modèle n'apprend pas "qui est la meilleure entreprise de logistique en France". Il apprend des patterns statistiques : quels mots apparaissent souvent ensemble, quelles entreprises sont souvent mentionnées dans quel contexte, quelle est la tonalité associée à telle marque.

Le résultat : le modèle développe une représentation implicite de chaque entité (entreprise, personne, concept) basée sur la fréquence et la qualité des mentions qu'il a vues.

Une entreprise qui apparaît dans 500 sources différentes de qualité aura une représentation bien plus solide dans un LLM qu'une entreprise excellente mais peu citée sur le web.

Les trois critères implicites de sélection

1. La fréquence de mention

Plus une entreprise est mentionnée dans de nombreuses sources indépendantes, plus elle est "connue" du modèle. Cette notoriété n'est pas la même chose que la taille de l'entreprise : une PME très active dans sa communication sectorielle peut être mieux représentée qu'un grand groupe discret.

2. La cohérence sémantique

Le modèle associe votre entreprise à des thèmes. Si toutes vos sources parlent de vous en termes cohérents (vous êtes "cabinet de recrutement spécialisé dans l'ingénierie industrielle"), votre association thématique est forte. Si les sources sont contradictoires ou vagues, le modèle ne saura pas où vous placer.

3. La qualité des sources citantes

Une mention dans un article du Monde ou de Les Échos pèse bien plus qu'une mention dans un annuaire bas de gamme. Le modèle a appris, implicitement, à distinguer les sources de haute qualité — il en pondère les informations plus fortement.

Ce que le modèle ne sait pas faire

Il est important de comprendre les limites de ce système pour ne pas avoir d'attentes erronées :

  • Le modèle ne vérifie pas si une entreprise est toujours en activité au moment de la question.
  • Il ne peut pas accéder à votre site web en temps réel (sauf fonctionnalités de navigation spécifiques).
  • Il peut avoir des informations périmées si sa date de coupure d'entraînement est ancienne.
  • Il peut confondre des homonymes ou des entités similaires si leurs profils en ligne se ressemblent.

La date de coupure : un point critique

Chaque modèle a une "knowledge cutoff date" — la date jusqu'à laquelle il a été entraîné. GPT-4 a été entraîné jusqu'à début 2024. Claude 3 jusqu'à mi-2024. Tout ce qui s'est passé depuis cette date est invisible pour le modèle, à moins qu'il ne dispose d'une connexion web en temps réel. Agir vite sur votre visibilité maximise vos chances d'être intégré dans les prochaines versions des modèles.

Le rôle de la RAG (Retrieval-Augmented Generation)

De plus en plus d'IA — notamment Perplexity et la version "Browse" de ChatGPT — utilisent la RAG : avant de répondre, elles effectuent une recherche web en temps réel et injectent les résultats dans leur contexte. Dans ce cas, c'est votre SEO classique qui entre en jeu : si votre site apparaît dans les premiers résultats Google, l'IA le lira et pourra vous citer.

Le GEO doit donc être pensé en complément du SEO, pas en remplacement. Les deux disciplines se renforcent mutuellement.

Comment mesurer votre visibilité actuelle

La méthode la plus directe : interrogez vous-même les principales IA avec des questions représentatives de votre secteur. Par exemple :

  • "Quels sont les meilleurs [votre métier] en [votre ville/région] ?"
  • "Que sais-tu de [nom de votre entreprise] ?"
  • "Quelles entreprises recommanderais-tu pour [votre service principal] ?"
  • "Quels sont les acteurs reconnus dans [votre secteur] en France ?"

Compilez les résultats. Notez si vous apparaissez, si la description est exacte, si la tonalité est positive. C'est votre point de départ pour une stratégie GEO.

Les actions prioritaires

Sur la base de ces mécanismes, les actions les plus efficaces pour améliorer votre visibilité IA sont, par ordre de priorité :

  1. 1.Auditer votre présence actuelle (que disent les IA de vous aujourd'hui).
  2. 2.Harmoniser votre positionnement sur tous les canaux (site, LinkedIn, Google My Business, annuaires).
  3. 3.Produire du contenu expert régulier, répondant aux questions précises de votre secteur.
  4. 4.Obtenir des mentions dans des médias sectoriels reconnus (guest posts, interviews, communiqués).
  5. 5.Compléter vos données structurées Schema.org et votre fiche Wikipedia si applicable.

Ce travail de fond, mené avec méthode, est ce qui fera la différence entre les entreprises que les IA citent naturellement — et celles qu'elles ignorent.

Découvrez votre score de visibilité IA

Vous voulez savoir si votre entreprise est concernée par ce qu'on vient de décrire ? L'audit gratuit vous donne la réponse en 30 secondes.

Audit gratuit

Sans email · 1 minute · Sans engagement

Votre entreprise est-elle citée par les IA ?

30 secondes pour le savoir. Gratuit, sans inscription.

Audit gratuit