Nous publions ici, en continu, le résultat des évaluations que nous faisons subir à JuriDX. Combien de questions répondues correctement, dans quels domaines, avec quels articles encore manquants. Pas de moyenne marketing, pas de chiffre décontextualisé. La méthode et les données brutes sont versionnées dans notre dépôt.
Cette page est régénérée automatiquement chaque nuit à 02h00 (CET). Le score d'évaluation est mis à jour à chaque exécution complète de la batterie de tests, déclenchée à chaque modification de la chaîne de recherche. La dette de recherche et la fraîcheur du corpus reflètent l'état du système à la dernière régénération.
Nous mesurons JuriDX contre 237 questions de référence couvrant les 11 domaines du droit français. Ces questions ont été écrites par des avocats. Pour chaque question, le test est strict : la recherche doit retrouver les bons articles, déclencher les bons concepts juridiques (ce que nous appelons les ancres), et présenter les sources que la réponse doit impérativement citer. Une seule omission fait échouer la question.
Score global
100,0 %
Moyenne pondérée sur les 11 domaines.
Questions évaluées
237
237 réussites · 0 échec
Domaines couverts
11
Pénal, civil, social, fiscal, environnement, numérique, et plus encore.
Dernière évaluation
1er mai 2026 à 03h14 (CET)
Les passages sont déclenchés à chaque modification de la chaîne de recherche.
Le taux de réussite est la part de questions de chaque domaine que JuriDX traite intégralement. Le hit rate est la proportion d'articles attendus que la recherche a effectivement remontés, même quand la question dans son ensemble n'est pas validée. Plus c'est proche de 100 %, mieux c'est.
| Domaine | Questions | Taux de réussite | Hit rate moyen |
|---|---|---|---|
| Droit administratif | 21 | 100,0 % | 100,0 % |
| Droit des affaires | 28 | 100,0 % | 100,0 % |
| Droit de l'environnement | 20 | 100,0 % | 100,0 % |
| Droit de la famille | 22 | 100,0 % | 100,0 % |
| Droit fiscal | 20 | 100,0 % | 100,0 % |
| Droit des étrangers | 20 | 100,0 % | 100,0 % |
| Droit immobilier | 25 | 100,0 % | 100,0 % |
| Droit du numérique | 20 | 100,0 % | 100,0 % |
| Droit pénal | 20 | 100,0 % | 100,0 % |
| Droit de la santé | 20 | 100,0 % | 100,0 % |
| Droit du travail | 21 | 100,0 % | 100,0 % |
Aucune. Sur la dernière évaluation, les 237 questions de référence sont toutes validées. Cela ne signifie pas que JuriDX répond parfaitement à toute question réelle d'avocat — cela signifie qu'il réussit la batterie de tests que nous avons écrite. Ces tests évoluent : nous en ajoutons dès qu'un avocat nous signale un cas mal traité.
Quand JuriDX ne peut pas ancrer une réponse dans les sources fournies, il l'admet explicitement dans la réponse plutôt que d'inventer. Nous comptons ces aveux et les regroupons ici. Cette liste est notre cahier des charges d'ingestion : les articles les plus demandés que nous n'avons pas encore couverts sont ingérés en priorité.
| Domaine | Article demandé | Nombre de demandes |
|---|---|---|
| Droit de l'environnement | L.512-1 | 2 |
| Droit fiscal | L.169 | 2 |
| Droit de la famille | 971 | 1 |
| Droit pénal | Art.393 | 1 |
| Droit du travail | — | 1 |
| Droit des étrangers | L.435-4 | 1 |
JuriDX ingère les codes et la jurisprudence chaque nuit depuis Légifrance et le portail PISTE. Voici l'état du corpus au moment de la dernière évaluation.
Articles de loi
163 900
78 codes français et instruments européens.
Fragments indexés
2 508 281
Chaque article est découpé en fragments sémantiques pour la recherche.
Décisions de jurisprudence
1 267 389
Cassation, Conseil d'État, Conseil constitutionnel, CEDH, CJUE.
Dernière mise à jour jurisprudence
10 juin 2026
Ingestion automatique chaque nuit à 01h10 (CET).
Le score que vous voyez est obtenu en mode strict : pour qu'une question soit validée, tous les articles attendus doivent être remontés, toutes les ancres prévues doivent être déclenchées, et les sources étiquetées mustCite doivent apparaître dans le pool de synthèse. Une seule omission échec.
Nous ne mesurons pas la qualité rédactionnelle des réponses ici. Cette page mesure exclusivement la chaîne de recherche : est-ce que JuriDX a su trouver les bonnes sources avant même d'écrire un mot. Si la recherche échoue, la rédaction n'a aucune chance.
Les 237 questions, leur structure, le code de scoring et les évolutions historiques sont dans le dépôt public juridx-saas/scripts/eval-harness/. Toute personne peut reproduire l'évaluation.
Données synthétisées le 13 juin 2026 à 02h00 (CET). Régénération automatique chaque nuit à 02h00 (CET) — la dette de recherche et la fraîcheur du corpus sont rafraîchies sur ce cycle. Le score d'évaluation, le hit rate par domaine et la liste des questions en échec ne bougent qu'à chaque nouvelle exécution complète de la batterie de tests, déclenchée à chaque modification de la chaîne de recherche. La méthodologie et les données brutes sont versionnées dans le dépôt JuriDX.