Search15.10.2016

​TF*IDF: Content optimaliseren voor de 21e eeuw


Hoe optimaliseer je content voor Google? De Duitse SEO-goeroe Marcus Tandler zweert bij TF*IDF. En hij niet alleen. Zeker de helft van de honderd populairste Duitse sites schijnt deze formule te gebruiken om te scoren met content. Als dat klopt, is het nu tijd om TF*IDF nader te onderzoeken. Spring op de kar voor hij zonder je vertrekt.

On-page criteria

Zoekmachines gebruiken bij de ranking van websites voor een bepaalde zoekterm zowel off-page als on-page criteria. Tot de eerste categorie behoren externe links die naar een URL leiden. Over de tweede categorie, de on-page criteria, heb je als webmaster de meeste macht. We vinden daar onder meer het gebruik van zoektermen.

Er zijn verschillende manieren om het gewicht van een zoekterm op een webpagina te bepalen. De frequentie waarmee ze wordt gebruikt, is de bekendste. Vroeger was dit zaligmakend. Pagina’s met de juiste keyword density, en met de zoektermen in de meta tags, scoorden haast vanzelf goed in Google. Die tijd is voorbij. Het was te gemakkelijk om te manipuleren.

Nu is er een complex aan factoren dat een rol speelt. Wil een tekst scoren, moeten er meerdere zoektermen op een pagina voorkomen die allemaal relevant zijn voor het overkoepelende onderwerp.

Wat is TF*IDF?

Alleen, hoe bepaal je welke zoektermen relevant zijn voor jouw topic? En hoe vaak moet je ze gebruiken om een kans te maken t.o.v. de concurrentie?

Een manier om hierachter te komen biedt TF*IDF. Het is een rekenkundige formule die de inhoud van een pagina nauwkeurig op waarde weet te schatten. TF*IDF vermenigvuldigt het gebruik van keywords binnen één document met de frequentie van dit begrip in een groter geheel van documenten, “corpus” genaamd. Het corpus kan een groep concurrerende webpagina’s zijn, maar ook een verzameling pagina’s van je eigen site.

Nieuw is de formule allerminst. Ze is afkomstig uit de statistiek en de geschiedenis gaat terug tot in de jaren vijftig van de vorige eeuw, lang voordat er van internet sprake was. Vandaag wordt TF*IDF intensief gebruikt op OnPage.org, een veelzijdige SEO-tool van Marcus Tandler. Hij is een van Duitslands meest vooraanstaande internetexperts en een pionier op het gebied van SEO.

TF*IDF: Een hit in Duitsland

Met OnPage.org kun je na een grondige analyse bestaande content optimaliseren. De tool is tevens geschikt om nieuwe content te creëren. Je kunt nagaan welke begrippen je nodig hebt om de strijd aan te gaan met met de topresultaten voor jouw zoekterm in Google.

OnPage.org is in Nederland niet zo bekend. Dat kan echter snel veranderen. Tandler richtte zich voordien uitsluitend op de Duitse markt en besloot zich onlangs op het buitenland te richten. Als sterkste argument kan gelden dat in Duitsland meer dan de helft van de top 100-websites OnPage.org schijnt te gebruiken. Volgens Tandler gebruiken niet alleen grote kranten het in hun voordeel, maar ook kleine webwinkels.

TF*IDF vormt het hart van OnPage.org. De identificatie van homoniemen ligt aan de basis van de formule. Tandler geeft graag “Java” als voorbeeld. Schrijf je een tekst over “Java” en er komen woorden als “Indonesië” en “eiland” in voor, zal de pagina niet scoren voor iemand die zoekt naar “Java programmeren”. De tekst kan wel scoren voor wie zoekt naar “Java vakantie”. Gaat een artikel over “Java” maar staan er ook woorden als “smaak” en “bonen” in, gaat de tekst vermoedelijk over koffie.

TF*IDF: hoe werkt het?

Zoals de naam aangeeft, bestaat de formule uit twee delen:

  • TF staat voor Term Frequency. Hiermee wordt de frequentie van het zoekbegrip gemeten. Hoe langer een tekst, hoe vaker een belangrijk zoekwoord erin voorkomt. TF = aantal malen dat zoekterm voorkomt / aantal woorden in de tekst (het document)
  • IDF betekent Inverse Document Frequency. Dit meet het belang van de zoekterm voor de relevantie van de tekst binnen het corpus. Veelvoorkomende woorden, stopwoorden dus, tellen niet mee. IDF = totaal aantal documenten binnen het corpus / totaal aantal zoektermen binnen document

Een voorbeeld. Je leest een tekst van 500 woorden waarin het woordje “rente” vijf keer voorkomt. Kortom, TF = 5/500 = 0.01. De tekst maakt deel uit van een geheel van honderd teksten. In veertig van die honderd komt “rente” voor. IDF = 100/40 = 2.5. Resultaat: TF*IDF = 0.01 x 2.5 = 0.025.

Hoe OnPage.org de formule gebruikt

Op OnPage.org wordt de top-15 in Google voor een bepaalde zoekterm geanalyseerd. Daarbij duikt niet alleen de onderzochte zoekterm op, maar worden ook alle andere relevante keywords voor dit onderwerp genoemd. Deze analyse vergelijkt de software met een van je eigen URL’s. Het resultaat wordt weergegeven in een staafdiagram.

DutchCowboys.nl Voorgesteld Beeldmateriaal TF-IDF Diagram
DutchCowboys.nl Voorgesteld Beeldmateriaal TF-IDF Diagram

Het voorbeeld hierboven, afkomstig uit een video van OnPage.org, betreft het woord “iPhone”. Donkerblauw staat voor de gemiddelde TF*IDF-score van de hoogste zoekresultaten in Google tezamen, voor elk van de onderzochte keywords. Het lichtere blauw geeft de score aan voor de mate waarin de term op afzonderlijke pagina’s wordt gebruikt. Om beter te scoren dan het gemiddelde, zonder je aan keyword spamming schuldig te maken, moet je de groene staaf bereiken.

OnPage.org heeft een handige feature waarbij je een tekst realtime op TF*IDF kunt analyseren. Je vindt vanzelf verwante begrippen (geen writer’s block meer!) en kunt ze in de juiste aantallen gebruiken. Dat is content optimaliseren terwijl je schrijft!

Google gebruikt TF*IDF al jaren, volgens Tandler en andere vooraanstaande search specialisten, en bij Yandex, de grootste Russische zoekmachine, schijnt het de op twee na belangrijkste rankingfactor te zijn. Alleen deze gegevens al maken het de moeite waard om deze aloude berekeningsmethode serieus te nemen. Een bijkomende reden is dat de zoektermanalyses met deze formule buiten Duitsland nog lang niet ingeburgerd zijn. Wie het nu toepast, zou zichzelf weleens een belangrijke voorsprong kunnen geven.

Deze blogpost is geschreven door Romano Groenewoud, Zoekmachine Optimalisatie Specialist.

[Afbeelding © Artur Marciniec- Fotolia]

Verder lezen over Content

​YoastCon: het evenement voor online marketeers en SEO-specialisten!

Ben jij een online marketeer of SEO-specialist en wil je je kennis en vaardigheden op het gebied van SEO naar een hoger niveau tillen? Dan mag je YoastCon zeker niet missen! YoastCon is hét evenement voor iedereen die g...

Search11.04.2023

​YoastCon: het evenement voor online marketeers en SEO-specialisten!

Die tekst voor je website? Die schrijf je gewoon zelf

Als ondernemer heb je veel zaken om aan te denken: de inkoop van producten, het verkopen van diensten en producten, de administratie, je personeel… Het is daardoor aantrekkelijk om sommige taken uit te besteden. Een bo...

DC Business27.01.2023

Die tekst voor je website? Die schrijf je gewoon zelf

​Wat is linkbuilding en wat maakt het belangrijk?

Als je een website runt, dan is de kans groot dat je wel eens mails graag met vragen over linkbuilding. Of het nu gaat om bedrijven die graag een linkje op jouw website reserveren of bedrijven die je ermee willen helpen:...

DC Business24.11.2022

​Wat is linkbuilding en wat maakt het belangrijk?

Twitter neemt Nederlandse start-up Revue over

Twitter is de plek waar mensen naartoe gaan om te zien wat er in de wereld gebeurt en om erover te praten. En het is ook de plek waar schrijvers - van individuele makers tot uitgevers - hun werk delen, zinvolle gesprekke...

Social Media26.01.2021

Twitter neemt Nederlandse start-up Revue over

Een beter thuis voor schrijvers
Duplicate content: wat is het en hoe voorkom je het?

1 van de onderwerpen waar je aandacht aan moet besteden als je aan SEO doet, is duplicate content. Deze dubbele inhoud is niet alleen vervelend voor de bezoekers van je website, maar ook voor zoekmachines. Na het lezen v...

Search14.12.2020

Duplicate content: wat is het en hoe voorkom je het?

​Help! De concurrent jat productomschrijvingen uit mijn webshop!

In deze column ga ik het hebben over de productbeschrijvingen in jouw webshop. Wat als je een luie concurrent hebt die jouw productteksten pikt? Dat is vervelend. Maar wat als iedere concurrent ze van jou pikt? Behalve ?...

Online07.09.2020

​Help! De concurrent jat productomschrijvingen uit mijn webshop!

​De onzichtbare kracht van SEO

Als jouw potentiële afnemers of klanten op zoek gaan naar een product of dienst die jij aanbiedt, hoe groot is dan de kans dat ze op jouw website terechtkomen? Hoeveel moeite doet een klant? Het antwoord is simpel, de g...

Search12.03.2020

​De onzichtbare kracht van SEO

Je productiviteit verhogen doe je met de MX Master 3 & MX Keys

Logitech kennen veel mensen vooral van de gaming-tak. Maar het bedrijf is al vele jaren bezig met hardware voor multitasking, voor developers en gewoon voor op kantoor om jouw productiviteit te verhogen. In 2015 was er d...

Gadgets07.11.2019

Je productiviteit verhogen doe je met de MX Master 3 & MX Keys

Verder lezen over Google

YouTube wil straks ook reclame laten zien als je pauzeert

YouTube bestaat uit zoveel reclame, dat het soms niet meer leuk is om iets te kijken. Daar komt nu meer reclame bij: in de door jou gekozen pauze.

Advertising26.04.2024

YouTube wil straks ook reclame laten zien als je pauzeert

Dit is Google Vids – de nieuwe Workspace app

Google Cloud heeft vandaag, tijdens het Google Cloud Next event in Las Vegas, nieuwe innovaties en verbeteringen aangekondigd voor Google Workspace.

Video10.04.2024

Dit is Google Vids – de nieuwe Workspace app

Google’s zoekmachine gaat geld kosten en dat komt door AI

De zoekmachine van Google wordt binnenkort waarschijnlijk betaald. Niet voor iedereen: de versie zoals we die nu kennen blijft wat het is. Er wordt echter AI aan toegevoegd en dat zal waarschijnlijk geld kosten. Het nieu...

Search04.04.2024

Google’s zoekmachine gaat geld kosten en dat komt door AI

SEO-tip: 5 dingen die veranderen in de Google-zoekmachine

Google heeft een core update aangekondigd en dat betekent dat er wat staat te veranderen voor vele pagina’s op het internet. De belangrijkste verandering zit hem vooral in het opsporen van pagina’s die niet waardevol...

Search07.03.2024

SEO-tip: 5 dingen die veranderen in de Google-zoekmachine

Google komt met koddige schrikkeljaar-Doodle

Google heeft speciaal in het kader van Schrikkeldag een speciale Doodle uitgebracht die in het teken staat van die gekke 29 februari die we af en toe krijgen. Het is een vrolijke kikker die even de 29 laat gelden en verv...

Coffee corner29.02.2024

Google komt met koddige schrikkeljaar-Doodle

​Google onthult na teasen nieuwe loginpagina: amper anders

Inloggen op je Google-account ziet er al jaren hetzelfde uit, maar dat is nu veranderd. Google heeft het lang geteaset en plaatste er zelfs een waarschuwingsmelding over wanneer je de laatste tijd wilde inloggen. Echter...

Online22.02.2024

​Google onthult na teasen nieuwe loginpagina: amper anders

​Waarom een Fitbit gebruiken steeds onaantrekkelijker wordt

Fitbit was ooit het toonbeeld van wearables, sportiviteit en de ‘smartphone’ voor om de pols, maar inmiddels begint het die status steeds meer te verliezen. Zeker met kapers op de kust als Amazfit, ziet het er twijfe...

Gadgets31.01.2024

​Waarom een Fitbit gebruiken steeds onaantrekkelijker wordt

De meest voorkomende reparaties aan een Google Pixel (en hoe je ze kunt voorkomen)

Google is relatief laat in de markt van de mobiele telefoons gestapt, maar heeft door zijn sterke marktpositie relatief weinig moeite gehad om binnen dit segment met een nieuw merk voet aan de grond te krijgen. Onder de...

Mobile29.01.2024

De meest voorkomende reparaties aan een Google Pixel (en hoe je ze kunt voorkomen)