Comment fonctionne le modèle AcePredict V2
L'équipe AcePredict ·
- acepredict
- modèle V2
- IA
- prédictions
- ATP
- tennis
Le moteur de prédiction d’AcePredict ne se contente pas de balancer toutes les stats d’un match à une IA en espérant le meilleur. La V2 est un pipeline en deux temps : un pré-calcul déterministe qui transforme la donnée brute en signaux pondérés, puis un modèle de langage qui doit respecter ces poids pour produire la probabilité de victoire et la lecture du match.
L’objectif est simple : réduire la part d’interprétation libre du modèle et ancrer chaque prédiction sur des règles tennis explicites, mesurables et reproductibles.
L’idée clé : des règles pondérées plutôt qu’un blob de texte
Dans une approche naïve, on donne à l’IA un gros bloc de texte (classement, forme, stats de service, historique…) et on la laisse extraire elle-même le signal. Problème : le classement ATP devient écrasant, la pondération devient opaque, et deux exécutions sur le même match peuvent diverger.
La V2 inverse le flux. Un module dédié calcule en amont des features (forme récente, stats par surface, profil de jeu, fatigue, head-to-head…) puis déclenche toutes les règles applicables, chacune associée à un poids de 1 à 10. L’IA reçoit cette synthèse pondérée et doit s’y aligner.
Le classement ATP, lui, n’est plus dans le catalogue. Il sert uniquement de tiebreaker quand aucune règle forte ne penche d’un côté. Fini les prédictions dictées par le ranking par défaut.
Le catalogue des 23 règles V2
Chaque règle est rangée dans une catégorie tennis et porte un poids fixe qui reflète sa fiabilité historique. Voici l’état actuel du catalogue.
Forme récente
- 4 victoires sur 5 derniers matchs — poids 8
- 3 défaites consécutives ou plus — poids 7
- 10 derniers matchs nettement au-dessus de la saison — poids 8
Service
- Seconde balle < 50 % sur les 5 derniers matchs — poids 9
- Taux de doubles fautes élevé — poids 7
- Gros ace rate compensant une seconde fragile — poids 6
Retour
- Plus de 30 % de break sur les derniers matchs — poids 9
- Faible retour face à un gros serveur — poids 7
Surface
- Stats surface 2× supérieures aux stats globales — poids 9
- Moins de 3 matchs sur la surface = incertitude — poids 7
- Changement de surface récent (< 7 jours) — poids 8
Fatigue
- 3 matchs en 5 jours ou plus — poids 8
- Boost après un titre la semaine précédente — poids 6
- Match précédent long face à un adversaire au match court — poids 7
Profil de jeu
- Défenseur sur surface lente — poids 8
- Gros serveur sur surface rapide — poids 8
- Profils similaires → le ranking redevient déterminant — poids 6
Head-to-head
- 3-0 sur les 2 dernières années, même surface — poids 8
- Les 3 derniers H2H pèsent plus que l’historique — poids 7
- H2H > 5 ans à pondérer faiblement — poids 6
Mental & contexte
- Retour de blessure (moins de 5 matchs joués) — poids 8
- Joueur à domicile ou sur son tournoi fétiche — poids 6
- Wild card / qualifié — effet surprise — poids 5
Comment une règle se déclenche concrètement
Le pré-calcul produit pour chaque règle activée un trigger qui contient : la règle, le joueur en faveur duquel elle penche, l’évidence factuelle derrière (ex. « 82 % sur dur cette saison vs 60 % global ») et sa catégorie.
L’IA additionne mentalement les poids par joueur — c’est son signal principal. Une règle de poids 9 (seconde balle faible, domination sur surface…) écrase trois règles de poids 5 cumulées dans l’autre camp. Et une règle dite neutral sert d’avertissement : elle ne penche pas, mais elle indique de ne pas s’appuyer trop fort sur une donnée (H2H trop ancien, échantillon trop court, etc.).
Des indicateurs additionnels injectés en clair
En plus des triggers, le prompt V2 affiche des signaux de contexte que l’IA peut intégrer : défaites consécutives, changement de surface, surcharge de matchs, retour de blessure, avantage à domicile, titre la semaine précédente. Ils renforcent ou nuancent les règles déclenchées.
Un output pensé pour l’évaluation des cotes
La prédiction V2 ne se limite pas à un vainqueur et une probabilité. Le modèle doit produire des champs structurés qui permettent ensuite de chasser la value sur les marchés annexes :
- expectedTotalGames — nombre total de jeux du match (utile pour les totals).
- expectedMargin — écart de jeux vainqueur/perdant (handicaps et spreads).
- expectedSetScore — le score type le plus probable (ex. 6-4 6-3).
- straightSetsProbability — probabilité d’une victoire en sets secs.
- ruleScores — la trace des règles ayant pesé, traduite en langage chronique (pas de jargon interne côté utilisateur).
En aval, notre sélecteur de cotes passe en mode V2 native sur ces matchs : sigma resserré, plage de probabilités élargie, et comparaison directe au marché. C’est ce qui permet de détecter une cote sous-évaluée même quand la prédiction de vainqueur n’a rien d’audacieux.
Garantie de cohérence côté utilisateur
Le modèle est aussi contraint sur la forme du rendu. Les textes affichés — résumé, raisonnement, scénarios, impact des règles — doivent rester en langage de chronique sportive : pas de mention de « trigger », « poids », « score interne » ni de noms techniques de règles. La pondération aide le modèle, elle reste invisible pour le lecteur final.
Côté chiffres, des garde-fous restent en place : le winner a toujours une probabilité supérieure ou égale à 50 %, la confidence reflète la qualité de la donnée disponible et un grade global (A+ à D) résume la robustesse de l’analyse.
Pourquoi cette architecture change la qualité des prédictions
- Reproductibilité : les mêmes features déclenchent les mêmes règles, donc deux exécutions sur un même match donnent des prédictions cohérentes.
- Explicabilité : chaque prédiction est tracée par les règles activées et leur évidence factuelle.
- Anti-biais ranking : le classement ATP n’écrase plus la lecture tactique du match.
- Profondeur cotes : les sorties structurées (totaux, marge, sets secs) ouvrent la porte à l’évaluation de la value sur tous les marchés.
Et la suite
Le catalogue de règles est vivant : trois d’entre elles (RETURN_BREAK_HIGH, RETURN_LOW_VS_BIG_SERVER et FATIGUE_LONG_LAST_MATCH) attendent encore l’extraction de signaux fins (taux de break détaillé, durée du match précédent) côté collecte de données. Au fil des nouvelles features, le catalogue s’enrichira ; chaque ajout est versionné pour invalider proprement le cache des prédictions précédentes.
En résumé, la V2 d’AcePredict n’est pas une IA qui devine. C’est un cadre tennis explicite — 23 règles pondérées, des features mesurables, des sorties structurées — que le modèle de langage assemble pour produire une probabilité de victoire que l’on peut défendre, ligne par ligne, devant n’importe quel parieur.