Orchestration GPU et Face Swap B2B à grande échelle.
- Python
- FastAPI
- RunPod
- AWS (S3)
- Next.js
Le pivot technologique
À l'origine, Maillol était un logiciel de bureau (Desktop App) destiné aux photographes, leur permettant d'appliquer des Face Swaps sur leurs clichés. Face à l'engouement, le besoin a évolué : les prestataires voulaient proposer cette fonctionnalité directement sur leur propre site web à leurs clients. Il a donc fallu pivoter l'intégralité du produit vers une API B2B distribuée.
Les défis d'ingénierie
Goulet d'étranglement matériel (Compute)
Un traitement d'image par IA requiert une immense puissance de calcul. Impossible de se reposer sur des serveurs classiques sans exploser les coûts ou subir des temps de latence inacceptables.
Sélection & Pipeline des modèles IA
Le Face Swap n'est pas une simple requête. Il a fallu orchestrer la sélection de plusieurs modèles d'IA, les coordonner avec précision, et gérer les matrices de coordonnées faciales.
Gestion et sécurité des volumes (S3)
En B2B, la plateforme doit absorber des milliers de photos HD par heure. La gestion des flux d'upload/download de manière sécurisée et asynchrone était cruciale.
Architecture & Scalabilité
1. Création d'un pipeline IA sur-mesure : Je me suis chargé d'auditer, de sélectionner et d'implémenter les modèles d'IA les plus performants. J'ai développé une architecture capable de gérer le mapping des coordonnées faciales avec une précision chirurgicale avant de procéder à la fusion.
2. Orchestration GPU Dynamique via RunPod : Pour répondre aux pics de charge sans ruiner la rentabilité, l'infrastructure s'appuie sur RunPod. Les instances GPU s'allument ("spin up") et s'éteignent automatiquement en fonction de la file d'attente des requêtes API, garantissant un scaling infini.
3. Stockage & Sécurité Cloud (AWS) : Les images entrantes et générées transitent par des buckets Amazon S3. Cela permet de décharger complètement les serveurs API du poids des médias, en générant des URLs signées à durée de vie limitée pour assurer la confidentialité des données clients.
Besoin de déployer
une infrastructure IA robuste ?
Disponibles pour de nouvelles missions