À propos du robot Veridi Fact-Checker
Si vous êtes arrivé sur cette page après avoir vu un user-agent Veridi Fact-Checker/1.0 dans les journaux de votre serveur, cette page vous explique ce qu’est le robot, ce qu’il fait, et comment l’autoriser ou le bloquer.
Ce que c’est
Veridi est une méthodologie publiée de vérification des faits, ainsi qu’un petit service en exploitation qui l’applique. Lorsqu’un utilisateur soumet une affirmation à vérifier, la méthodologie exige la récupération de sources primaires, l’évaluation de leur crédibilité, et l’ancrage du verdict résultant dans des preuves récupérables plutôt que dans le corpus d’entraînement du modèle. Le robot constitue le côté récupération de cette étape.
Chaîne user-agent
Veridi Fact-Checker/1.0 (+https://veridi.org/en/bot; contact via https://veridi.org/en/contact/)
Ce qu’il fait
- Effectue des recherches sur le Web public au moyen d’API de recherche standards.
- Récupère les URL citées ou repérées par ces recherches afin de lire le contenu sous-jacent.
- Cite votre URL dans le résultat de la vérification afin que les utilisateurs puissent consulter votre contenu directement.
- Visite une page par URL citée par vérification. Le robot n’est pas un robot d’indexation : il ne suit pas les liens de manière récursive, n’énumère pas les répertoires des sites, et ne maintient pas d’index persistant.
Ce qu’il ne fait pas
- Republier votre contenu. Les pages récupérées sont résumées dans des sorties privées de vérification livrées à l’utilisateur qui en a fait la demande ; le texte sous-jacent n’est pas redistribué.
- Entraîner des modèles sur votre contenu. Veridi ne collecte pas de données pour l’entraînement de modèles. La méthodologie publiée s’exécute sur des modèles linguistiques commerciaux qui ont leurs propres politiques (distinctes) sur les données d’entraînement.
- Surcharger vos serveurs. La récupération par vérification est bornée par des budgets de recherche par niveau (typiquement 1 à 8 recherches par affirmation, avec un espacement entre requêtes d’au moins 3 secondes). Le robot n’effectue pas d’exploration continue.
Conformité robots.txt
Le robot respecte robots.txt. Si vous souhaitez le bloquer spécifiquement, ajoutez :
User-agent: Veridi Fact-Checker
Disallow: /
Les règles génériques standards s’appliquent si vous souhaitez bloquer tous les robots par défaut tout en autorisant certains d’entre eux.
Pourquoi l’autoriser
La vérification des faits est une fonction d’intérêt public. Lorsque les utilisateurs soumettent des affirmations concernant votre contenu (par exemple, des affirmations qui vous citent comme source, ou qui font référence à des reportages que vous avez publiés), Veridi a besoin de récupérer la page réelle pour comparer l’affirmation à votre contenu, plutôt que de se fier à la mémoire d’un modèle linguistique. Le résultat de la vérification inclut les URL citées, afin que les utilisateurs puissent consulter votre contenu directement. Bloquer le robot signifie que ces vérifications seront traitées sans lecture directe de votre contenu. Le résultat est typiquement un verdict INSUFFICIENT EVIDENCE ou UNVERIFIABLE, accompagné d’une note LIMITATIONS documentant le blocage. La méthodologie ne substitue pas de récupération inventée.
Pourquoi nous nous identifions
Nous n’utilisons pas un user-agent de navigateur pour contourner les défenses anti-robot. Le user-agent indiqué plus haut est le seul que nous utilisons, y compris lorsqu’il est bloqué.
Contact
Pour des questions sur la méthodologie, des signalements d’abus, des demandes d’ajout à une liste d’autorisation, ou pour toute rétroaction d’opérateur : veuillez utiliser le formulaire de contact.
Historique des versions
- 1.0 (2 mai 2026) : user-agent déclaré initial. Remplace l’ancienne chaîne
Veridi Fact-Checker/1.0qui ne comportait pas d’URL d’information publique.
Pages connexes
- Méthodologie : ce que le robot fait du contenu qu’il récupère
- Limites connues : portée et état de la validation
- Consommation de ressources : estimations d’énergie et d’eau de refroidissement par million de jetons