Het komt vooral bij oudere HTML websites vaak voor dat er veel onnodige code in de broncode van de webpagina staat. Deze informatie is meestal niet direct zichtbaar voor de bezoeker, maar soms wel doordat bijvoorbeeld woorden afbreken in WordPress.
Het vervelende is dat het altijd in de webbrowser wordt geladen, dit komt de laadtijd van de website niet ten goede en heeft zodoende ook een nadelig effect op de vindbaarheid bij de zoekmachines.
Ook wanneer je de opmaak van de pagina wil veranderen of verwijderen en de broncode van de pagina staat vol met inline styles kan het heel veel werk zijn om dit met de hand te veranderen. Helaas zullen externe stylesheets hier ook niet helpen, omdat inline CSS voorrang krijgt. Met aanpassingen kan die voorrang wel afgedwongen worden, maar dat is helaas zeer inefficiënt en komt de laadtijd van de pagina nog minder ten goede.
Natuurlijk kan je gewoon een zoek en vervang functie gebruiken, dit werk prima voor standaard HTML tags, maar voor tags met een HTML attribute zoals span, div en table kan dit behoorlijk tijdrovend en arbeidsintensief zijn.
Gelukkig is er een gratis oplossing, waarbij je geen moeilijke toeren hoeft uit te halen dit voor elkaar te krijgen.
Met de volgende regular expression (regex) is het mogelijk om in een keer alle, of selectief de ongewenste HTML tags te verwijderen of te vervangen:
Alle tags selecteren:
<[^>] >
Selectief de tags span,style, div en p:
<(s*/)?s*(span|style|div)b[^>]*?>
Je kan deze regular expressions in combinatie met Notepad++ of een andere tekst editor gebruiken die regex ondersteund. Vergeet hierbij niet om als zoek methode “regular expression” aan te vinken. (zie afbeelding)
Nu kan je met de “replace” vervang functie de ongewenste tags verwijderen. Dit gebeurt door niets in te vullen in het “replace” invulveld en de knop “find all in current document”.
Natuurlijk kan je ook de ongewenste tags vervangen door een andere tag of attribute (waarde).
Wanneer de editor ook nog tekst vervangen in files ondersteunt, kan je met één handeling zelfs meerdere files tegelijk de aanpassing doorvoeren. Bij Notepad++ gebeurt dit door de gewenste handeling binnnen het tabje “find in files” uit te voeren, daarbij kan je nog aangeven om ook in onderliggende mappen te zoeken en te veranderen.
Wanneer de Textfx plugin is geïnstalleerd kan je “eenvoudiger” reguliere expressies aanmaken met Ctrl+R of via het menu: TextFX -> TextFX Quick -> Find/Replace.
Een aantal handige reguliere expressies voor direct gebruik:
Zoek Regex | Vervang Regex | Regex Effect |
---|---|---|
:(.*)$ | leeg laten | Hiermee haal je van elke regel de tekst achter de dubbele punt weg |
be(w*)sb | leeg laten | Verwijder alle woorden die beginnen met “e” en eindigen met “s” (Caps gevoelig) |
Om zelf Reguliere expressies samen te stellen zijn er ook een aantal handige online tools beschikbaar:
http://www.rubular.com/
http://gskinner.com/RegExr/
https://gerardnico.com/ide/notepad/replace
Andere tips, aanvullingen of opbouwende kritiek zijn altijd welkom!
Geef een reactie