QUALITÉ · MESURE PUBLIQUE

La qualité de notre recherche, en clair.

Nous publions ici, en continu, le résultat des évaluations que nous faisons subir à JuriDX. Combien de questions répondues correctement, dans quels domaines, avec quels articles encore manquants. Pas de moyenne marketing, pas de chiffre décontextualisé. La méthode et les données brutes sont versionnées dans notre dépôt.

Données vivantes — dernière évaluation : 1er mai 2026 à 03h14 (CET)

Cette page est régénérée automatiquement chaque nuit à 02h00 (CET). Le score d'évaluation est mis à jour à chaque exécution complète de la batterie de tests, déclenchée à chaque modification de la chaîne de recherche. La dette de recherche et la fraîcheur du corpus reflètent l'état du système à la dernière régénération.


Nous mesurons JuriDX contre 237 questions de référence couvrant les 11 domaines du droit français. Ces questions ont été écrites par des avocats. Pour chaque question, le test est strict : la recherche doit retrouver les bons articles, déclencher les bons concepts juridiques (ce que nous appelons les ancres), et présenter les sources que la réponse doit impérativement citer. Une seule omission fait échouer la question.

Score global

100,0 %

Moyenne pondérée sur les 11 domaines.

Questions évaluées

237

237 réussites · 0 échec

Domaines couverts

11

Pénal, civil, social, fiscal, environnement, numérique, et plus encore.

Dernière évaluation

1er mai 2026 à 03h14 (CET)

Les passages sont déclenchés à chaque modification de la chaîne de recherche.


Le taux de réussite est la part de questions de chaque domaine que JuriDX traite intégralement. Le hit rate est la proportion d'articles attendus que la recherche a effectivement remontés, même quand la question dans son ensemble n'est pas validée. Plus c'est proche de 100 %, mieux c'est.

Domaine Questions Taux de réussite Hit rate moyen
Droit administratif21100,0 %100,0 %
Droit des affaires28100,0 %100,0 %
Droit de l'environnement20100,0 %100,0 %
Droit de la famille22100,0 %100,0 %
Droit fiscal20100,0 %100,0 %
Droit des étrangers20100,0 %100,0 %
Droit immobilier25100,0 %100,0 %
Droit du numérique20100,0 %100,0 %
Droit pénal20100,0 %100,0 %
Droit de la santé20100,0 %100,0 %
Droit du travail21100,0 %100,0 %

Aucune. Sur la dernière évaluation, les 237 questions de référence sont toutes validées. Cela ne signifie pas que JuriDX répond parfaitement à toute question réelle d'avocat — cela signifie qu'il réussit la batterie de tests que nous avons écrite. Ces tests évoluent : nous en ajoutons dès qu'un avocat nous signale un cas mal traité.


Quand JuriDX ne peut pas ancrer une réponse dans les sources fournies, il l'admet explicitement dans la réponse plutôt que d'inventer. Nous comptons ces aveux et les regroupons ici. Cette liste est notre cahier des charges d'ingestion : les articles les plus demandés que nous n'avons pas encore couverts sont ingérés en priorité.

Domaine Article demandé Nombre de demandes
Droit de l'environnementL.512-12
Droit fiscalL.1692
Droit de la famille9711
Droit pénalArt.3931
Droit du travail1
Droit des étrangersL.435-41

JuriDX ingère les codes et la jurisprudence chaque nuit depuis Légifrance et le portail PISTE. Voici l'état du corpus au moment de la dernière évaluation.

Articles de loi

163 900

78 codes français et instruments européens.

Fragments indexés

2 508 281

Chaque article est découpé en fragments sémantiques pour la recherche.

Décisions de jurisprudence

1 267 389

Cassation, Conseil d'État, Conseil constitutionnel, CEDH, CJUE.

Dernière mise à jour jurisprudence

10 juin 2026

Ingestion automatique chaque nuit à 01h10 (CET).


Le score que vous voyez est obtenu en mode strict : pour qu'une question soit validée, tous les articles attendus doivent être remontés, toutes les ancres prévues doivent être déclenchées, et les sources étiquetées mustCite doivent apparaître dans le pool de synthèse. Une seule omission échec.

Nous ne mesurons pas la qualité rédactionnelle des réponses ici. Cette page mesure exclusivement la chaîne de recherche : est-ce que JuriDX a su trouver les bonnes sources avant même d'écrire un mot. Si la recherche échoue, la rédaction n'a aucune chance.

Les 237 questions, leur structure, le code de scoring et les évolutions historiques sont dans le dépôt public juridx-saas/scripts/eval-harness/. Toute personne peut reproduire l'évaluation.


Données synthétisées le 13 juin 2026 à 02h00 (CET). Régénération automatique chaque nuit à 02h00 (CET) — la dette de recherche et la fraîcheur du corpus sont rafraîchies sur ce cycle. Le score d'évaluation, le hit rate par domaine et la liste des questions en échec ne bougent qu'à chaque nouvelle exécution complète de la batterie de tests, déclenchée à chaque modification de la chaîne de recherche. La méthodologie et les données brutes sont versionnées dans le dépôt JuriDX.