On a construit le scraping qu'on aurait voulu avoir.
Pixee Crawl est né d'un besoin interne Pixeeplay : maintenir des dizaines de scrapers fournisseurs et concurrents sans y passer ses nuits. Aujourd'hui ouvert aux marques, distributeurs et opérateurs e-commerce qui ont la même contrainte.
Notre origine
Né d'une frustration concrète
Saisir manuellement 150 000 produits fournisseurs ? Pas tenable. Maintenir 15 scrapers DIY qui cassent à chaque refonte de site ? Encore moins. On a écrit le framework qu'on aurait voulu trouver : auto-repair, anti-détection, sync PIM.
Notre mission
Brancher les marques à la donnée web
Permettre à chaque opérateur e-commerce de capter et fiabiliser les flux dont il a besoin — catalogues fournisseurs, veille concurrentielle, monitoring marché — sans construire ni maintenir une équipe scraping en interne.
Nos engagements
Souveraineté & ownership
Hébergement France (OVH via Coolify), conformité RGPD by design, credentials chiffrés, aucune revente de données, BYOK pour les proxies. Vous gardez la main, vos flux restent à vous.
Un framework assemblé. Pas une boîte noire.
Pixee Crawl est l'assemblage cohérent d'outils open-source matures — Playwright, httpx, curl_cffi, PostgreSQL, FastAPI, APScheduler — et de la couche métier que nous écrivons à la main : BasePipeline, ExtractionHealthTracker, SelectorDoctor, gestionnaire de proxies, dashboard temps réel.
Vous achetez l'opération d'un service, pas une licence verrouillée. Les données restent chez vous, exportables à tout moment.
Ce qui ne change pas, quel que soit le palier.
- RGPD natif
- Données France
- Outils open-source
- BYOK · vos proxies
- Pas de lock-in
- Support humain
- Tarif au scraper, pas au volume
- Ownership des données
Un produit Pixeeplay.
Pixeeplay « Digital, Commerce, Expériences » est une agence basée en France. Pixee Crawl complète l'écosystème aux côtés de Pixee PIM et Pixee Commerce. Les trois produits partagent un design system, une infrastructure souveraine et une équipe.