FineTouch
API B2B en Production
Maillol

Orchestration GPU et Face Swap B2B à grande échelle.

API B2BFace Swap IARunPodAWS S3Python/FastAPI
Projet Maillol
ScaleOrchestration GPU Dynamique
APIIntégration B2B
S3Stockage AWS Sécurisé
ProjetMaillol
SecteurIntelligence Artificielle & Photographie
InterventionLead Tech : Architecture IA & Infrastructure Cloud
Stack Technique
  • Python
  • FastAPI
  • RunPod
  • AWS (S3)
  • Next.js

Le pivot technologique

À l'origine, Maillol était un logiciel de bureau (Desktop App) destiné aux photographes, leur permettant d'appliquer des Face Swaps sur leurs clichés. Face à l'engouement, le besoin a évolué : les prestataires voulaient proposer cette fonctionnalité directement sur leur propre site web à leurs clients. Il a donc fallu pivoter l'intégralité du produit vers une API B2B distribuée.

Les défis d'ingénierie

01

Goulet d'étranglement matériel (Compute)

Un traitement d'image par IA requiert une immense puissance de calcul. Impossible de se reposer sur des serveurs classiques sans exploser les coûts ou subir des temps de latence inacceptables.

02

Sélection & Pipeline des modèles IA

Le Face Swap n'est pas une simple requête. Il a fallu orchestrer la sélection de plusieurs modèles d'IA, les coordonner avec précision, et gérer les matrices de coordonnées faciales.

03

Gestion et sécurité des volumes (S3)

En B2B, la plateforme doit absorber des milliers de photos HD par heure. La gestion des flux d'upload/download de manière sécurisée et asynchrone était cruciale.

Infrastructure & Pipeline IA
API GatewayRequêtes B2B entrantes
AWS S3 BucketsStockage sécurisé des visages
Cluster GPU RunPod
Pipeline sur-mesure : Détection des traits, alignement, injection du modèle Face Swap et upscaling.
Restitution WebhooksEnvoi de l'image finale au site du photographe.
Dashboard AdminSuivi de la consommation GPU et facturation.

Architecture & Scalabilité

1. Création d'un pipeline IA sur-mesure : Je me suis chargé d'auditer, de sélectionner et d'implémenter les modèles d'IA les plus performants. J'ai développé une architecture capable de gérer le mapping des coordonnées faciales avec une précision chirurgicale avant de procéder à la fusion.

2. Orchestration GPU Dynamique via RunPod : Pour répondre aux pics de charge sans ruiner la rentabilité, l'infrastructure s'appuie sur RunPod. Les instances GPU s'allument ("spin up") et s'éteignent automatiquement en fonction de la file d'attente des requêtes API, garantissant un scaling infini.

3. Stockage & Sécurité Cloud (AWS) : Les images entrantes et générées transitent par des buckets Amazon S3. Cela permet de décharger complètement les serveurs API du poids des médias, en générant des URLs signées à durée de vie limitée pour assurer la confidentialité des données clients.

Travaillons ensemble

Besoin de déployer
une infrastructure IA robuste ?

Nous contacter

Disponibles pour de nouvelles missions