Search15.10.2016

​TF*IDF: Content optimaliseren voor de 21e eeuw


Hoe optimaliseer je content voor Google? De Duitse SEO-goeroe Marcus Tandler zweert bij TF*IDF. En hij niet alleen. Zeker de helft van de honderd populairste Duitse sites schijnt deze formule te gebruiken om te scoren met content. Als dat klopt, is het nu tijd om TF*IDF nader te onderzoeken. Spring op de kar voor hij zonder je vertrekt.

On-page criteria

Zoekmachines gebruiken bij de ranking van websites voor een bepaalde zoekterm zowel off-page als on-page criteria. Tot de eerste categorie behoren externe links die naar een URL leiden. Over de tweede categorie, de on-page criteria, heb je als webmaster de meeste macht. We vinden daar onder meer het gebruik van zoektermen.

Er zijn verschillende manieren om het gewicht van een zoekterm op een webpagina te bepalen. De frequentie waarmee ze wordt gebruikt, is de bekendste. Vroeger was dit zaligmakend. Pagina’s met de juiste keyword density, en met de zoektermen in de meta tags, scoorden haast vanzelf goed in Google. Die tijd is voorbij. Het was te gemakkelijk om te manipuleren.

Nu is er een complex aan factoren dat een rol speelt. Wil een tekst scoren, moeten er meerdere zoektermen op een pagina voorkomen die allemaal relevant zijn voor het overkoepelende onderwerp.

Wat is TF*IDF?

Alleen, hoe bepaal je welke zoektermen relevant zijn voor jouw topic? En hoe vaak moet je ze gebruiken om een kans te maken t.o.v. de concurrentie?

Een manier om hierachter te komen biedt TF*IDF. Het is een rekenkundige formule die de inhoud van een pagina nauwkeurig op waarde weet te schatten. TF*IDF vermenigvuldigt het gebruik van keywords binnen één document met de frequentie van dit begrip in een groter geheel van documenten, “corpus” genaamd. Het corpus kan een groep concurrerende webpagina’s zijn, maar ook een verzameling pagina’s van je eigen site.

Nieuw is de formule allerminst. Ze is afkomstig uit de statistiek en de geschiedenis gaat terug tot in de jaren vijftig van de vorige eeuw, lang voordat er van internet sprake was. Vandaag wordt TF*IDF intensief gebruikt op OnPage.org, een veelzijdige SEO-tool van Marcus Tandler. Hij is een van Duitslands meest vooraanstaande internetexperts en een pionier op het gebied van SEO.

TF*IDF: Een hit in Duitsland

Met OnPage.org kun je na een grondige analyse bestaande content optimaliseren. De tool is tevens geschikt om nieuwe content te creëren. Je kunt nagaan welke begrippen je nodig hebt om de strijd aan te gaan met met de topresultaten voor jouw zoekterm in Google.

OnPage.org is in Nederland niet zo bekend. Dat kan echter snel veranderen. Tandler richtte zich voordien uitsluitend op de Duitse markt en besloot zich onlangs op het buitenland te richten. Als sterkste argument kan gelden dat in Duitsland meer dan de helft van de top 100-websites OnPage.org schijnt te gebruiken. Volgens Tandler gebruiken niet alleen grote kranten het in hun voordeel, maar ook kleine webwinkels.

TF*IDF vormt het hart van OnPage.org. De identificatie van homoniemen ligt aan de basis van de formule. Tandler geeft graag “Java” als voorbeeld. Schrijf je een tekst over “Java” en er komen woorden als “Indonesië” en “eiland” in voor, zal de pagina niet scoren voor iemand die zoekt naar “Java programmeren”. De tekst kan wel scoren voor wie zoekt naar “Java vakantie”. Gaat een artikel over “Java” maar staan er ook woorden als “smaak” en “bonen” in, gaat de tekst vermoedelijk over koffie.

TF*IDF: hoe werkt het?

Zoals de naam aangeeft, bestaat de formule uit twee delen:

  • TF staat voor Term Frequency. Hiermee wordt de frequentie van het zoekbegrip gemeten. Hoe langer een tekst, hoe vaker een belangrijk zoekwoord erin voorkomt. TF = aantal malen dat zoekterm voorkomt / aantal woorden in de tekst (het document)
  • IDF betekent Inverse Document Frequency. Dit meet het belang van de zoekterm voor de relevantie van de tekst binnen het corpus. Veelvoorkomende woorden, stopwoorden dus, tellen niet mee. IDF = totaal aantal documenten binnen het corpus / totaal aantal zoektermen binnen document

Een voorbeeld. Je leest een tekst van 500 woorden waarin het woordje “rente” vijf keer voorkomt. Kortom, TF = 5/500 = 0.01. De tekst maakt deel uit van een geheel van honderd teksten. In veertig van die honderd komt “rente” voor. IDF = 100/40 = 2.5. Resultaat: TF*IDF = 0.01 x 2.5 = 0.025.

Hoe OnPage.org de formule gebruikt

Op OnPage.org wordt de top-15 in Google voor een bepaalde zoekterm geanalyseerd. Daarbij duikt niet alleen de onderzochte zoekterm op, maar worden ook alle andere relevante keywords voor dit onderwerp genoemd. Deze analyse vergelijkt de software met een van je eigen URL’s. Het resultaat wordt weergegeven in een staafdiagram.

DutchCowboys.nl Voorgesteld Beeldmateriaal TF-IDF Diagram
DutchCowboys.nl Voorgesteld Beeldmateriaal TF-IDF Diagram

Het voorbeeld hierboven, afkomstig uit een video van OnPage.org, betreft het woord “iPhone”. Donkerblauw staat voor de gemiddelde TF*IDF-score van de hoogste zoekresultaten in Google tezamen, voor elk van de onderzochte keywords. Het lichtere blauw geeft de score aan voor de mate waarin de term op afzonderlijke pagina’s wordt gebruikt. Om beter te scoren dan het gemiddelde, zonder je aan keyword spamming schuldig te maken, moet je de groene staaf bereiken.

OnPage.org heeft een handige feature waarbij je een tekst realtime op TF*IDF kunt analyseren. Je vindt vanzelf verwante begrippen (geen writer’s block meer!) en kunt ze in de juiste aantallen gebruiken. Dat is content optimaliseren terwijl je schrijft!

Google gebruikt TF*IDF al jaren, volgens Tandler en andere vooraanstaande search specialisten, en bij Yandex, de grootste Russische zoekmachine, schijnt het de op twee na belangrijkste rankingfactor te zijn. Alleen deze gegevens al maken het de moeite waard om deze aloude berekeningsmethode serieus te nemen. Een bijkomende reden is dat de zoektermanalyses met deze formule buiten Duitsland nog lang niet ingeburgerd zijn. Wie het nu toepast, zou zichzelf weleens een belangrijke voorsprong kunnen geven.

Deze blogpost is geschreven door Romano Groenewoud, Zoekmachine Optimalisatie Specialist.

[Afbeelding © Artur Marciniec- Fotolia]

Verder lezen over Content

​YoastCon: het evenement voor online marketeers en SEO-specialisten!

Ben jij een online marketeer of SEO-specialist en wil je je kennis en vaardigheden op het gebied van SEO naar een hoger niveau tillen? Dan mag je YoastCon zeker niet missen! YoastCon is hét evenement voor iedereen die g...

Search11.04.2023

​YoastCon: het evenement voor online marketeers en SEO-specialisten!

Die tekst voor je website? Die schrijf je gewoon zelf

Als ondernemer heb je veel zaken om aan te denken: de inkoop van producten, het verkopen van diensten en producten, de administratie, je personeel… Het is daardoor aantrekkelijk om sommige taken uit te besteden. Een bo...

DC Business27.01.2023

Die tekst voor je website? Die schrijf je gewoon zelf

​Wat is linkbuilding en wat maakt het belangrijk?

Als je een website runt, dan is de kans groot dat je wel eens mails graag met vragen over linkbuilding. Of het nu gaat om bedrijven die graag een linkje op jouw website reserveren of bedrijven die je ermee willen helpen:...

DC Business24.11.2022

​Wat is linkbuilding en wat maakt het belangrijk?

Twitter neemt Nederlandse start-up Revue over

Twitter is de plek waar mensen naartoe gaan om te zien wat er in de wereld gebeurt en om erover te praten. En het is ook de plek waar schrijvers - van individuele makers tot uitgevers - hun werk delen, zinvolle gesprekke...

Social Media26.01.2021

Twitter neemt Nederlandse start-up Revue over

Een beter thuis voor schrijvers
Duplicate content: wat is het en hoe voorkom je het?

1 van de onderwerpen waar je aandacht aan moet besteden als je aan SEO doet, is duplicate content. Deze dubbele inhoud is niet alleen vervelend voor de bezoekers van je website, maar ook voor zoekmachines. Na het lezen v...

Search14.12.2020

Duplicate content: wat is het en hoe voorkom je het?

​Help! De concurrent jat productomschrijvingen uit mijn webshop!

In deze column ga ik het hebben over de productbeschrijvingen in jouw webshop. Wat als je een luie concurrent hebt die jouw productteksten pikt? Dat is vervelend. Maar wat als iedere concurrent ze van jou pikt? Behalve ?...

Online07.09.2020

​Help! De concurrent jat productomschrijvingen uit mijn webshop!

​De onzichtbare kracht van SEO

Als jouw potentiële afnemers of klanten op zoek gaan naar een product of dienst die jij aanbiedt, hoe groot is dan de kans dat ze op jouw website terechtkomen? Hoeveel moeite doet een klant? Het antwoord is simpel, de g...

Search12.03.2020

​De onzichtbare kracht van SEO

Je productiviteit verhogen doe je met de MX Master 3 & MX Keys

Logitech kennen veel mensen vooral van de gaming-tak. Maar het bedrijf is al vele jaren bezig met hardware voor multitasking, voor developers en gewoon voor op kantoor om jouw productiviteit te verhogen. In 2015 was er d...

Gadgets07.11.2019

Je productiviteit verhogen doe je met de MX Master 3 & MX Keys

Verder lezen over Google

5 redenen waarom je goed moet slapen en 5 tips hoe

Het is een eeuwenoud cliché dat je goed moet slapen, maar net als dat beweging essentieel is, is slaap dat absoluut ook.

Nieuws24.07.2024

5 redenen waarom je goed moet slapen en 5 tips hoe

De nieuwe Chromecast is bijna tegenovergestelde van oude

De meest recente Chromecast dateert uit 2022 en is de Chromecast with Google TV. De nieuwe lijkt daar echter totaal niet op.

Gadgets23.07.2024

De nieuwe Chromecast is bijna tegenovergestelde van oude

Startup Wiz zegt nee tegen de 23 miljard dollar van Google

Wat zou jij doen als Google je twee keer zoveel wilde betalen voor je bedrijf als het op dit moment wordt gewaardeerd? Als je Wiz bent, zeg je nee.

Cybercrime23.07.2024

Startup Wiz zegt nee tegen de 23 miljard dollar van Google

En de nieuwe emoji van dit jaar is: een kale boom met dorre takken

Er zijn nieuwe emoji voor dit jaar gepresenteerd. Eén van de sterren van de show is… een dorre boom met kale takken.

Online17.07.2024

En de nieuwe emoji van dit jaar is: een kale boom met dorre takken

Google is van plan om grootste startup-overname ooit te doen

Google zou de grootste startup-acquisitie ooit zijn voor een bedrag van 23 miljard dollar. 

Cybercrime15.07.2024

Google is van plan om grootste startup-overname ooit te doen

Google Maps laat je op iPhone eindelijk zien hoe hard je mag

Op Android doet de app dit al jaren, maar nu krijgt Apple die mogelijkheid eindelijk ook. 

Mobile12.07.2024

Google Maps laat je op iPhone eindelijk zien hoe hard je mag

Google stopt met de doorlopende scroll op zijn zoekmachine

Het is volgens Google bedoeld om te zorgen dat zoekresultaten eerder laden, in plaats van dat je allemaal dingen geladen krijgt waar je helemaal niet om hebt gevraagd.

Search26.06.2024

Google stopt met de doorlopende scroll op zijn zoekmachine

Waarom verstuurt Google weer account- en inloglinks in mails?

Sinds enige tijd verstuurt Google accountnotificaties over veiligheidsissues of nieuwe functies naar de inbox van Gmail. Verontrustend feit daarbij is dat deze emails een directe link naar de desbetreffende accountinformatie bevatten.

Cybercrime26.06.2024

Waarom verstuurt Google weer account- en inloglinks in mails?