Leçons de Netomi pour l’échelle des systèmes agentiques dans l’entreprise
Les entreprises s’attendent à ce que les agents IA gèrent de manière fiable des flux de travail complexes, respectent les politiques par défaut, fonctionnent sous une forte charge et montrent leur travail.
Netomi construit des systèmes qui répondent à ces exigences, servant des clients du Fortune 500. Leur plateforme associe GPT‑4.1 pour une utilisation d’outils fiable et à faible latence avec GPT‑5.2 pour une planification multi-étapes plus approfondie, le tout dans une couche d’exécution régulée conçue pour maintenir les actions pilotées par le modèle prévisibles dans des conditions de production réelles.
Leçon 1 : Construire pour la complexité du monde réel, pas pour des flux idéalisés
Une seule demande d’entreprise ne correspond généralement pas à une seule API. Les flux de travail réels s’étendent sur des moteurs de réservation, des bases de données de fidélité, des systèmes CRM, des logiques de politique, des paiements et des sources de connaissances. Les données sont souvent incomplètes, contradictoires ou sensibles au temps. Les systèmes qui dépendent de flux fragiles s’effondrent sous cette variabilité.
Netomi a conçu son Agentic OS de sorte que les modèles d’OpenAI soient au centre d’un pipeline d’orchestration régulé construit pour ce niveau d’ambiguïté. La plateforme utilise GPT‑4.1 pour un raisonnement rapide et fiable, et GPT‑5.2 lorsque la planification multi-étapes ou un raisonnement plus profond est nécessaire.
Pour garantir un comportement cohérent des agents à travers des tâches longues et complexes, Netomi suit des modèles de prompting agentique recommandés par OpenAI :
- Rappels de persistance pour aider GPT‑5.2 à maintenir le raisonnement à travers des flux de travail multi-étapes
- Attentes explicites d’utilisation des outils, supprimant les réponses hallucinations en dirigeant GPT‑4.1 à appeler des outils pour des informations autorisées lors des opérations transactionnelles
- Planification structurée, qui exploite le raisonnement plus profond de GPT‑5.2 pour décrire et exécuter des tâches multi-étapes
- Décisions multimédias riches pilotées par l’agent, s’appuyant sur GPT‑5.2 pour détecter et signaler quand un appel d’outil devrait retourner des images, vidéos ou autres éléments multimodaux
Ensemble, ces modèles aident le système à mapper de manière fiable des demandes non structurées à des flux de travail multi-étapes et à maintenir l’état à travers des interactions discontinues.
Leçon 2 : Paralléliser tout pour répondre aux attentes de latence des entreprises
Dans des moments de forte pression, les utilisateurs abandonneront un système qui hésite. La latence définit la confiance.
La plupart des systèmes IA échouent parce qu’ils exécutent des tâches de manière séquentielle. Netomi a plutôt conçu pour la concurrence, tirant parti du comportement d’appel d’outil stable et à faible latence de GPT‑4.1.
GPT‑4.1 offre un temps de réponse rapide et un comportement d’appel d’outil prévisible, rendant cette architecture viable à grande échelle ; tandis que GPT‑5.2 fournit des chemins de raisonnement multi-étapes plus profonds lorsque nécessaire. Le cadre de concurrence de Netomi assure que le système total, et non seulement le modèle, reste en dessous des seuils de latence critiques.
Ces exigences de concurrence ne sont pas uniques aux compagnies aériennes. Tout système exposé à des pics de trafic extrêmes a besoin de la même discipline architecturale.
Leçon 3 : Faire de la gouvernance une partie intrinsèque du fonctionnement
L’IA d’entreprise doit être digne de confiance par conception, avec la gouvernance intégrée directement dans le fonctionnement.
Lorsque la confiance dans l’intention tombe en dessous d’un certain seuil, ou lorsqu’une demande ne peut pas être classée avec certitude, les mécanismes de gouvernance de Netomi interviennent pour déterminer comment la demande est traitée, garantissant que le système se retire de la génération libre en faveur de chemins d’exécution contrôlés.
Au niveau technique, la couche de gouvernance gère :
- Validation de schéma, qui valide chaque appel d’outil contre les arguments attendus avant l’exécution
- Application de politiques qui applique des filtres de sujet et des vérifications de conformité en temps réel
- Protection des données sensibles pour détecter et masquer les données sensibles
- Retours déterministes, retournant à des comportements sûrs lorsque l’intention ou les données sont ambiguës
- Observabilité en temps réel, exposant les traces de jetons et les étapes de raisonnement pour une inspection en temps réel
Conclusion
Le parcours de Netomi montre ce qu’il faut pour gagner la confiance des entreprises : construire pour la complexité, paralléliser pour répondre aux exigences de latence, et intégrer la gouvernance dans chaque flux de travail. Les modèles d’OpenAI forment l’épine dorsale du raisonnement, tandis que l’ingénierie des systèmes de Netomi garantit que l’intelligence est opérationnellement sûre et prête pour les environnements d’entreprise.