Orchestration GPU et Face Swap B2B à grande échelle.

API B2BFace Swap IARunPodAWS S3Python/FastAPI

ScaleOrchestration GPU Dynamique

APIIntégration B2B

S3Stockage AWS Sécurisé

ProjetMaillol

SecteurIntelligence Artificielle & Photographie

InterventionLead Tech : Architecture IA & Infrastructure Cloud

Stack Technique

Python
FastAPI
RunPod
AWS (S3)
Next.js

Desktop → API B2B : un pivot d'échelle

À l'origine, Maillol était un logiciel de bureau pour photographes. Face à la demande, le produit devait évoluer : les prestataires voulaient intégrer le Face Swap directement sur leurs propres sites, à grande échelle. Pivoter vers une API B2B distribuée n'était pas une option — c'était la condition de survie et de monétisation du produit.

Les défis d'ingénierie

Goulet d'étranglement matériel (Compute)

Un traitement d'image par IA requiert une immense puissance de calcul. Impossible de se reposer sur des serveurs classiques sans exploser les coûts ou subir des temps de latence inacceptables.

Sélection & Pipeline des modèles IA

Le Face Swap n'est pas une simple requête. Il a fallu orchestrer la sélection de plusieurs modèles d'IA, les coordonner avec précision, et gérer les matrices de coordonnées faciales.

Gestion et sécurité des volumes (S3)

En B2B, la plateforme doit absorber des milliers de photos HD par heure. La gestion des flux d'upload/download de manière sécurisée et asynchrone était cruciale.

Infrastructure & Pipeline IA

API GatewayRequêtes B2B entrantes

AWS S3 BucketsStockage sécurisé des visages

Cluster GPU RunPod

Pipeline sur-mesure : Détection des traits, alignement, injection du modèle Face Swap et upscaling.

Restitution WebhooksEnvoi de l'image finale au site du photographe.

Dashboard AdminSuivi de la consommation GPU et facturation.

Architecture & Scalabilité

1. Création d'un pipeline IA sur-mesure : Je me suis chargé d'auditer, de sélectionner et d'implémenter les modèles d'IA les plus performants. J'ai développé une architecture capable de gérer le mapping des coordonnées faciales avec une précision chirurgicale avant de procéder à la fusion.

2. Orchestration GPU Dynamique via RunPod : Pour répondre aux pics de charge sans ruiner la rentabilité, l'infrastructure s'appuie sur RunPod. Les instances GPU s'allument ("spin up") et s'éteignent automatiquement en fonction de la file d'attente des requêtes API, garantissant un scaling infini.

3. Stockage & Sécurité Cloud (AWS) : Les images entrantes et générées transitent par des buckets Amazon S3. Cela permet de décharger complètement les serveurs API du poids des médias, en générant des URLs signées à durée de vie limitée pour assurer la confidentialité des données clients.

Votre pipeline IA, en production

L'IA n'est un avantage que si
elle scale sans exploser vos coûts.

Discuter de mon infrastructure IA

Disponibles pour de nouvelles missions