15 Expressions Régulières Incontournables : Boostez Votre SEO avec les Regex

Dans le domaine du SEO, des analyses de données ou même pour des tâches quotidiennes en développement web, les expressions régulières, ou regex, sont des outils puissants pour rechercher, filtrer ou analyser des informations textuelles. Elles permettent de créer des requêtes complexes pour trouver des motifs spécifiques dans des textes, des bases de données, ou des pages web. Dans cet article, nous allons explorer en détail plusieurs regex courantes avec des exemples concrets, ainsi qu’un tableau récapitulatif pour t’aider à comprendre leur utilité.

Qu’est-ce qu’une expression régulière (regex) ?

Une expression régulière est une séquence de caractères qui permet de définir un motif de recherche dans une chaîne de caractères. En d’autres termes, c’est un outil qui permet de rechercher, remplacer ou valider des données textuelles. Les regex sont largement utilisées dans des langages de programmation, des moteurs de recherche comme Google Search Console, et même dans certains outils de marketing pour filtrer des mots-clés ou analyser des requêtes.

Regex

Pourquoi les Regex sont-elles utiles pour le SEO ?

Pour les experts en SEO, les regex offrent la possibilité de :

  • Filtrer des requêtes spécifiques dans des outils comme Google Search Console.
  • Analyser des pages web ou des fichiers log pour identifier des schémas répétitifs.
  • Optimiser des campagnes de mots-clés en trouvant des variations ou des combinaisons précises de termes.

Principales Regex et Exemples Concrets

Voici quelques expressions régulières courantes, chacune accompagnée d’exemples concrets pour montrer comment elles peuvent être utilisées.

RegexExplicationExemple Concret
^word.*Trouve toutes les expressions commençant par le mot-cléRecherche « marketing digital », « marketing automation »
.*word$Trouve toutes les expressions se terminant par le mot-cléRecherche « plan de stratégie », « analyse de stratégie »
.*word.*Trouve toutes les expressions contenant le mot-clé (peu importe la position)Recherche « marketing de contenu », « contenu optimisé »
\b\w{11,}\bTrouve des mots de plus de 10 caractèresRecherche « développement », « transformation »
^[^word].*$Trouve les expressions ne commençant pas par le mot-cléExclut « SEO », mais trouve « optimisation des pages »
`^word1word2$`Trouve les expressions commençant par « word1 » ou se terminant par « word2 »
word[0-9]Trouve les expressions contenant un mot suivi d’un chiffre entre 0 et 9Recherche « campagne1 », « campagne2 »
[0-9]{4}Trouve toutes les expressions contenant exactement 4 chiffresRecherche « 2024 », « 1999 »
`(mot1.*mot2)(mot2.*mot1)`Trouve des expressions contenant « mot-clé1 » et « mot-clé2 » dans n’importe quel ordre
^([^\s]*\s){4,}Trouve des expressions contenant au moins 5 motsRecherche « stratégie de marketing de contenu efficace »
\b20\d{2}\bTrouve des requêtes avec une année au format « 20XX »Recherche « 2023 », « 2024 »
`^(term1term2term3)$`
`^(mot1mot2)`Trouve des expressions commençant par l’un des deux mots
`\b(keywordsynonyme1synonyme2)\b`
\bmot[- ]clé\bTrouve des mots-clés séparés par un espace ou un tiretRecherche « mot clé », « mot-clé »
.*[^\w\s].*Trouve des mots contenant des caractères spéciauxRecherche « 50% », « prix réduit ! »

Explication détaillée de chaque Regex

  1. ^word.* : Cette regex est utilisée pour rechercher des termes ou des expressions qui commencent par un mot spécifique. Par exemple, en utilisant ^marketing.*, tu peux trouver toutes les expressions qui commencent par « marketing » dans tes rapports SEO, comme « marketing digital », « marketing automation », etc.
  2. .*word$ : Contrairement à la première regex, celle-ci recherche toutes les expressions qui se terminent par un mot donné. Par exemple, .*stratégie$ te permet de retrouver des expressions comme « plan de stratégie », « analyse de stratégie ».
  3. .*word.* : Cette regex est plus générale et permet de rechercher des expressions qui contiennent un mot-clé, qu’il soit au début, au milieu ou à la fin. En utilisant .*contenu.*, tu peux trouver des termes comme « contenu optimisé » ou « marketing de contenu ».
  4. \b\w{11,}\b : Si tu veux trouver des mots de plus de 10 caractères, cette regex est idéale. Par exemple, des termes comme « développement » ou « transformation » peuvent être extraits facilement grâce à cette expression.
  5. ^[^word].*$ : Cette regex est utile pour exclure les termes qui commencent par un mot spécifique. Par exemple, ^[^SEO].*$ exclut toutes les expressions commençant par « SEO » mais inclut d’autres comme « stratégie de contenu ».
  6. ^word1|word2$ : Ici, tu peux rechercher des expressions qui commencent par un mot et se terminent par un autre. Cela peut être utile si tu veux analyser des expressions comme « contenu optimisé » ou « plan marketing ».
  7. word[0-9] : Cette regex permet de trouver des termes associés à des chiffres, souvent utilisés dans les noms de campagnes marketing. Par exemple, elle te permet de repérer « campagne1 », « campagne2 », etc.
  8. [0-9]{4} : Si tu cherches des années spécifiques dans tes données, cette regex trouve les expressions contenant 4 chiffres, comme « 2024 » ou « 1999 ».
  9. (mot1.*mot2)|(mot2.*mot1) : Si tu veux trouver des combinaisons spécifiques de deux mots, peu importe leur ordre, cette regex est parfaite. Par exemple, elle peut détecter « SEO optimisé pour le contenu » ou « contenu stratégique SEO ».
  10. ^([^\s]*\s){4,} : Cette regex est utile pour identifier des phrases contenant au moins 5 mots, comme « stratégie de marketing de contenu efficace ».
  11. \b20\d{2}\b : Pour chercher des années au format « 20XX », cette regex est idéale. Tu peux l’utiliser pour analyser des données historiques ou récentes, comme « 2023 », « 2024 ».
  12. ^(term1|term2|term3)$ : Utilisée pour rechercher précisément un terme parmi plusieurs, cette regex est utile dans des analyses ciblées. Par exemple, elle peut te permettre de rechercher des occurrences de « SEO », « contenu », ou « marketing ».
  13. ^(mot1|mot2) : Pour trouver des expressions commençant par plusieurs termes possibles, utilise cette regex. Elle te permet de trouver « SEO avancé » ou « contenu optimisé ».
  14. \b(keyword|synonyme1|synonyme2)\b : Les regex peuvent aussi trouver des synonymes, ce qui est utile pour analyser des termes alternatifs dans tes contenus, comme « marketing », « publicité » ou « promotion ».
  15. \bmot[- ]clé\b : Cette regex est parfaite pour trouver des mots-clés composés qui sont séparés par un espace ou un tiret, comme « mot clé » ou « mot-clé ».
  16. .*[^\w\s].* : Si tu cherches des expressions contenant des caractères spéciaux comme « % », « $ », etc., cette regex est idéale. Elle te permet de repérer des termes comme « 50% » ou « prix réduit ! ».

Exemple Avancé : Trouver des URLs spécifiques avec Regex

L’une des utilisations les plus courantes des regex en SEO est de filtrer des URLs. Voici une regex complexe qui permet de détecter des types d’URLs spécifiques :

Google_Search_Console_Regex_Filter

Regex :
^https:\/\/(www\.)?[a-zA-Z0-9_-]+\.[a-zA-Z0-9_-]+\/(html|content|guide|blog|faq)\/?$

Explication détaillée :

  • ^https:\/\/ : Cela spécifie que l’URL doit commencer par « https:// ».
  • (www\.)? : Le point d’interrogation après (www\.) signifie que la partie « www. » est optionnelle.
  • [a-zA-Z0-9_-]+\.[a-zA-Z0-9_-]+ : Cette partie correspond au domaine de l’URL. Elle accepte des lettres majuscules et minuscules, des chiffres, des tirets (-) et des underscores (_), suivi d’un point (.) puis d’une extension similaire (comme .com ou .net).
  • \/(html|content|guide|blog|faq) : Cette partie vérifie que l’URL se termine par l’un des termes suivants : « html », « content », « guide », « blog », ou « faq ». Le symbole | signifie « ou », permettant de capturer n’importe lequel de ces termes.
  • \/?$ : Le \/? signifie qu’un slash (/) à la fin de l’URL est optionnel. Le symbole $ indique la fin de l’URL.

Exemple concret :
Cette regex peut être utilisée pour trouver toutes les URLs d’un site qui correspondent à des sections spécifiques comme :

  • https://www.exemple.com/guide/
  • https://exemple.com/blog
  • https://exemple.com/faq

Elle peut servir dans le cadre d’une analyse SEO pour identifier et filtrer les pages types (comme des blogs ou des FAQ) pour leur optimisation ou leur suivi dans Google Analytics.

Conclusion

Les expressions régulières (regex) sont des outils incroyablement puissants pour le SEO et l’analyse de données. Elles permettent de filtrer des informations précises, d’optimiser tes campagnes de mots-clés, ou de générer des rapports ciblés dans des outils comme Google Search Console. Avec ces regex à ta disposition, tu pourras non seulement gagner du temps,

Publications similaires