Filtres GA4 indispensables : 10 actions pour des données propres

· 10 min · Google Analytics

Des données GA4 polluées faussent vos décisions marketing. Voici les filtres et réglages indispensables, avec exemples et benchmarks, pour fiabiliser vos rapports.

Pourquoi des filtres GA4 sont indispensables pour des données propres

Dans GA4, la qualité des données n’est pas un « bonus » : c’est la base de toute analyse fiable. Sans filtres et règles d’hygiène, vous risquez de surévaluer vos sessions, de sous-estimer vos conversions, et de prendre de mauvaises décisions (budget média, SEO, CRO, etc.).

Quelques repères réalistes observés sur des sites e-commerce et lead gen :

• Trafic interne (équipe, prestataires, agences) : souvent 1 à 8% des sessions, mais peut dépasser 15% sur des petits sites. • Bots et outils automatisés (monitoring, scrapers, uptime checks) : typiquement 0,5 à 5% des sessions, parfois plus si le site est très exposé. • Référents indésirables (paiement, webmail, outils) : peuvent contaminer l’attribution et représenter 2 à 10% des sessions « referral ». • Paramètres d’URL (utm inutiles, paramètres techniques) : peuvent créer des doublons de pages et gonfler les pages vues uniques de 5 à 30% selon le cas.

Dans GA4, il faut distinguer deux approches :

• Filtrer à la collecte (via paramètres GA4 / balises / règles) : impacte les données dès l’entrée, donc irréversible. • Filtrer à l’analyse (comparaisons, explorations, audiences, BigQuery) : réversible, utile pour contrôler.

Objectif : mettre en place un socle minimal de filtres « indispensables », puis compléter selon votre contexte.

Pré-requis : structurer votre GA4 pour filtrer sans casser les données

Avant d’activer des filtres, sécurisez votre configuration. Une erreur de filtrage peut faire disparaître des données utiles.

Créer des propriétés et environnements de mesure cohérents

Bonnes pratiques actionnables :

• Garder une propriété GA4 de production (site/app réel). • Utiliser un environnement de test (via GTM et/ou un domaine de staging) pour valider avant déploiement. • Mettre en place au minimum 2 flux si nécessaire : - Web (prod) - Web (staging) ou App

Définir une checklist de qualité (benchmark simple)

Avant/après filtres, suivez 7 indicateurs sur 14 jours glissants :

• Part du trafic “Direct” (souvent 15 à 35% sur un site sain, variable selon marque) • Part du “Referral” (souvent 5 à 20%) • Taux d’engagement (souvent 45 à 70% selon secteur) • Conversions (stabilité, pas de chute brutale) • Nombre de pages (ou pages vues) par session (repérer les pics anormaux) • Top référents (détecter paiement/webmail/spam) • Top pages (détecter URLs dupliquées via paramètres)

Documenter vos règles (indispensable)

• Listez chaque filtre/règle : objectif, où c’est configuré, date d’activation, impact attendu. • Conservez un historique (même un simple Google Sheet) pour expliquer les ruptures de série.

Filtrer le trafic interne : le filtre n°1 à mettre en place

Le trafic interne est l’une des principales sources de pollution, surtout si vous testez souvent (QA, recettes, campagnes, formulaires).

Méthode recommandée : filtre “Internal traffic” via GA4

GA4 propose un mécanisme natif basé sur une définition de trafic interne (souvent IP).

Étapes :

Allez dans Admin > Data streams > (votre flux Web) > Configure tag settings. Ouvrez Define internal traffic. Créez une règle : - Nom : internal_office, internal_agency, etc. - Type de correspondance : IP (ou plage) Ensuite, allez dans Admin > Data settings > Data filters. Activez le filtre Internal traffic en mode : - Testing d’abord (recommandé 7 à 14 jours) - Puis Active

Bonnes pratiques :

• Commencez par Testing pour vérifier que vous n’excluez pas des utilisateurs réels. • Si vos IP changent (télétravail, VPN), préférez compléter avec une approche GTM.

Alternative robuste : marquage via GTM (cookie/localStorage)

Quand l’IP n’est pas fiable :

• Déclenchez une variable « interne » via : - un paramètre d’URL (ex. ?internal=1), - une page spécifique (ex. /internal/ok), - ou une règle sur l’IP côté serveur (si vous avez du server-side tagging). • Envoyez un user_property (ex. user_type=internal) ou un event parameter. • Filtrez ensuite dans explorations/audiences (ou BigQuery) sans supprimer la donnée brute.

Benchmark d’impact :

• Sur un site B2B avec 20 personnes qui testent souvent, exclure l’interne peut réduire les sessions de 3 à 12% et stabiliser les conversions (moins de faux leads).

Exclure les bots et le trafic automatisé (monitoring, scrapers)

GA4 filtre une partie du trafic automatisé, mais ce n’est pas toujours suffisant, surtout si vos outils de monitoring simulent des parcours.

Identifier le trafic suspect (signaux simples)

• Pics de sessions à heures fixes (ex. toutes les 5 minutes) • Durée d’engagement quasi nulle • Pages vues répétées sur 1-2 URLs (ex. page d’accueil) • Localisations incohérentes (pays inattendus) • User agents connus (si vous avez BigQuery ou logs serveur)

Actions concrètes (sans “casser” GA4)

Exclure les outils de monitoring - Ajoutez une règle dans l’outil (ex. ping sans JS) si possible. - Sinon, identifiez leur IP et ajoutez-les à “internal traffic” (catégorie in…