Search15.10.2016

​TF*IDF: Content optimaliseren voor de 21e eeuw


Hoe optimaliseer je content voor Google? De Duitse SEO-goeroe Marcus Tandler zweert bij TF*IDF. En hij niet alleen. Zeker de helft van de honderd populairste Duitse sites schijnt deze formule te gebruiken om te scoren met content. Als dat klopt, is het nu tijd om TF*IDF nader te onderzoeken. Spring op de kar voor hij zonder je vertrekt.

On-page criteria

Zoekmachines gebruiken bij de ranking van websites voor een bepaalde zoekterm zowel off-page als on-page criteria. Tot de eerste categorie behoren externe links die naar een URL leiden. Over de tweede categorie, de on-page criteria, heb je als webmaster de meeste macht. We vinden daar onder meer het gebruik van zoektermen.

Er zijn verschillende manieren om het gewicht van een zoekterm op een webpagina te bepalen. De frequentie waarmee ze wordt gebruikt, is de bekendste. Vroeger was dit zaligmakend. Pagina’s met de juiste keyword density, en met de zoektermen in de meta tags, scoorden haast vanzelf goed in Google. Die tijd is voorbij. Het was te gemakkelijk om te manipuleren.

Nu is er een complex aan factoren dat een rol speelt. Wil een tekst scoren, moeten er meerdere zoektermen op een pagina voorkomen die allemaal relevant zijn voor het overkoepelende onderwerp.

Wat is TF*IDF?

Alleen, hoe bepaal je welke zoektermen relevant zijn voor jouw topic? En hoe vaak moet je ze gebruiken om een kans te maken t.o.v. de concurrentie?

Een manier om hierachter te komen biedt TF*IDF. Het is een rekenkundige formule die de inhoud van een pagina nauwkeurig op waarde weet te schatten. TF*IDF vermenigvuldigt het gebruik van keywords binnen één document met de frequentie van dit begrip in een groter geheel van documenten, “corpus” genaamd. Het corpus kan een groep concurrerende webpagina’s zijn, maar ook een verzameling pagina’s van je eigen site.

Nieuw is de formule allerminst. Ze is afkomstig uit de statistiek en de geschiedenis gaat terug tot in de jaren vijftig van de vorige eeuw, lang voordat er van internet sprake was. Vandaag wordt TF*IDF intensief gebruikt op OnPage.org, een veelzijdige SEO-tool van Marcus Tandler. Hij is een van Duitslands meest vooraanstaande internetexperts en een pionier op het gebied van SEO.

TF*IDF: Een hit in Duitsland

Met OnPage.org kun je na een grondige analyse bestaande content optimaliseren. De tool is tevens geschikt om nieuwe content te creëren. Je kunt nagaan welke begrippen je nodig hebt om de strijd aan te gaan met met de topresultaten voor jouw zoekterm in Google.

OnPage.org is in Nederland niet zo bekend. Dat kan echter snel veranderen. Tandler richtte zich voordien uitsluitend op de Duitse markt en besloot zich onlangs op het buitenland te richten. Als sterkste argument kan gelden dat in Duitsland meer dan de helft van de top 100-websites OnPage.org schijnt te gebruiken. Volgens Tandler gebruiken niet alleen grote kranten het in hun voordeel, maar ook kleine webwinkels.

TF*IDF vormt het hart van OnPage.org. De identificatie van homoniemen ligt aan de basis van de formule. Tandler geeft graag “Java” als voorbeeld. Schrijf je een tekst over “Java” en er komen woorden als “Indonesië” en “eiland” in voor, zal de pagina niet scoren voor iemand die zoekt naar “Java programmeren”. De tekst kan wel scoren voor wie zoekt naar “Java vakantie”. Gaat een artikel over “Java” maar staan er ook woorden als “smaak” en “bonen” in, gaat de tekst vermoedelijk over koffie.

TF*IDF: hoe werkt het?

Zoals de naam aangeeft, bestaat de formule uit twee delen:

  • TF staat voor Term Frequency. Hiermee wordt de frequentie van het zoekbegrip gemeten. Hoe langer een tekst, hoe vaker een belangrijk zoekwoord erin voorkomt. TF = aantal malen dat zoekterm voorkomt / aantal woorden in de tekst (het document)
  • IDF betekent Inverse Document Frequency. Dit meet het belang van de zoekterm voor de relevantie van de tekst binnen het corpus. Veelvoorkomende woorden, stopwoorden dus, tellen niet mee. IDF = totaal aantal documenten binnen het corpus / totaal aantal zoektermen binnen document

Een voorbeeld. Je leest een tekst van 500 woorden waarin het woordje “rente” vijf keer voorkomt. Kortom, TF = 5/500 = 0.01. De tekst maakt deel uit van een geheel van honderd teksten. In veertig van die honderd komt “rente” voor. IDF = 100/40 = 2.5. Resultaat: TF*IDF = 0.01 x 2.5 = 0.025.

Hoe OnPage.org de formule gebruikt

Op OnPage.org wordt de top-15 in Google voor een bepaalde zoekterm geanalyseerd. Daarbij duikt niet alleen de onderzochte zoekterm op, maar worden ook alle andere relevante keywords voor dit onderwerp genoemd. Deze analyse vergelijkt de software met een van je eigen URL’s. Het resultaat wordt weergegeven in een staafdiagram.

DutchCowboys.nl Voorgesteld Beeldmateriaal TF-IDF Diagram
DutchCowboys.nl Voorgesteld Beeldmateriaal TF-IDF Diagram

Het voorbeeld hierboven, afkomstig uit een video van OnPage.org, betreft het woord “iPhone”. Donkerblauw staat voor de gemiddelde TF*IDF-score van de hoogste zoekresultaten in Google tezamen, voor elk van de onderzochte keywords. Het lichtere blauw geeft de score aan voor de mate waarin de term op afzonderlijke pagina’s wordt gebruikt. Om beter te scoren dan het gemiddelde, zonder je aan keyword spamming schuldig te maken, moet je de groene staaf bereiken.

OnPage.org heeft een handige feature waarbij je een tekst realtime op TF*IDF kunt analyseren. Je vindt vanzelf verwante begrippen (geen writer’s block meer!) en kunt ze in de juiste aantallen gebruiken. Dat is content optimaliseren terwijl je schrijft!

Google gebruikt TF*IDF al jaren, volgens Tandler en andere vooraanstaande search specialisten, en bij Yandex, de grootste Russische zoekmachine, schijnt het de op twee na belangrijkste rankingfactor te zijn. Alleen deze gegevens al maken het de moeite waard om deze aloude berekeningsmethode serieus te nemen. Een bijkomende reden is dat de zoektermanalyses met deze formule buiten Duitsland nog lang niet ingeburgerd zijn. Wie het nu toepast, zou zichzelf weleens een belangrijke voorsprong kunnen geven.

Deze blogpost is geschreven door Romano Groenewoud, Zoekmachine Optimalisatie Specialist.

[Afbeelding © Artur Marciniec- Fotolia]

Verder lezen over Content

​YoastCon: het evenement voor online marketeers en SEO-specialisten!

Ben jij een online marketeer of SEO-specialist en wil je je kennis en vaardigheden op het gebied van SEO naar een hoger niveau tillen? Dan mag je YoastCon zeker niet missen! YoastCon is hét evenement voor iedereen die g...

Search11.04.2023

​YoastCon: het evenement voor online marketeers en SEO-specialisten!

Die tekst voor je website? Die schrijf je gewoon zelf

Als ondernemer heb je veel zaken om aan te denken: de inkoop van producten, het verkopen van diensten en producten, de administratie, je personeel… Het is daardoor aantrekkelijk om sommige taken uit te besteden. Een bo...

DC Business27.01.2023

Die tekst voor je website? Die schrijf je gewoon zelf

​Wat is linkbuilding en wat maakt het belangrijk?

Als je een website runt, dan is de kans groot dat je wel eens mails graag met vragen over linkbuilding. Of het nu gaat om bedrijven die graag een linkje op jouw website reserveren of bedrijven die je ermee willen helpen:...

DC Business24.11.2022

​Wat is linkbuilding en wat maakt het belangrijk?

Twitter neemt Nederlandse start-up Revue over

Twitter is de plek waar mensen naartoe gaan om te zien wat er in de wereld gebeurt en om erover te praten. En het is ook de plek waar schrijvers - van individuele makers tot uitgevers - hun werk delen, zinvolle gesprekke...

Social Media26.01.2021

Twitter neemt Nederlandse start-up Revue over

Een beter thuis voor schrijvers
Duplicate content: wat is het en hoe voorkom je het?

1 van de onderwerpen waar je aandacht aan moet besteden als je aan SEO doet, is duplicate content. Deze dubbele inhoud is niet alleen vervelend voor de bezoekers van je website, maar ook voor zoekmachines. Na het lezen v...

Search14.12.2020

Duplicate content: wat is het en hoe voorkom je het?

​Help! De concurrent jat productomschrijvingen uit mijn webshop!

In deze column ga ik het hebben over de productbeschrijvingen in jouw webshop. Wat als je een luie concurrent hebt die jouw productteksten pikt? Dat is vervelend. Maar wat als iedere concurrent ze van jou pikt? Behalve ?...

Online07.09.2020

​Help! De concurrent jat productomschrijvingen uit mijn webshop!

​De onzichtbare kracht van SEO

Als jouw potentiële afnemers of klanten op zoek gaan naar een product of dienst die jij aanbiedt, hoe groot is dan de kans dat ze op jouw website terechtkomen? Hoeveel moeite doet een klant? Het antwoord is simpel, de g...

Search12.03.2020

​De onzichtbare kracht van SEO

Je productiviteit verhogen doe je met de MX Master 3 & MX Keys

Logitech kennen veel mensen vooral van de gaming-tak. Maar het bedrijf is al vele jaren bezig met hardware voor multitasking, voor developers en gewoon voor op kantoor om jouw productiviteit te verhogen. In 2015 was er d...

Gadgets07.11.2019

Je productiviteit verhogen doe je met de MX Master 3 & MX Keys

Verder lezen over Google

AI wint nu ook nog de Nobelprijs: twee zelfs

DeepMind, Google’s lab waarin volop met kunstmatige intelligentie wordt geexperimenteerd, is in de prijzen gevallen.

Artificial Intelligence09.10.2024

AI wint nu ook nog de Nobelprijs: twee zelfs

Epic krijgt gelijk: Google houdt Android te dicht

De rechter heeft nu bepaald dat Google de Google Play appwinkel drie jaar lang open moet stellen voor de concurrentie.

Mobile08.10.2024

Epic krijgt gelijk: Google houdt Android te dicht

Google komt met hulp voor als je telefoon wordt gestolen

Shit, telefoon gestolen. Google introduceert nu drie nieuwe opties om te zorgen dat de dief niet bij je data kan.

Mobile07.10.2024

Google komt met hulp voor als je telefoon wordt gestolen

Knoop straks in het Nederlands een gesprek aan met Gemini Live

Google Gemini Live was al beschikbaar, ook voor Nederlanders, maar nog niet officieel in het Nederlands. Daar komt in de komende weken dus verandering in.

Artificial Intelligence03.10.2024

Knoop straks in het Nederlands een gesprek aan met Gemini Live

Epic klaagt Google en Samsung aan om alternatieve appwinkels

Epic had Google vier jaar geleden al aangeklaagd voor het runnen van een monopolie op de appwinkel, maar nu komt daar een nieuwe rechtszaak bij. 

Mobile01.10.2024

Epic klaagt Google en Samsung aan om alternatieve appwinkels

Google introduceert een speelse doodle met popcorn

Search25.09.2024

Google introduceert een speelse doodle met popcorn

5 dingen die je moet weten over Google TV Streamer

Het is over en uit met Chromecast. Google ondersteunt ze nog wel, maar er worden geen nieuwe Chromecasts meer gemaakt. Dit is opvolger Google TV Streamer.

Gadgets23.09.2024

5 dingen die je moet weten over Google TV Streamer

Marketeer, je krijgt meer controle over Google Ads-campagnes

Volgens Google geven AI-gestuurde Google Ads campagnes betere resultaten voor kleine en grote bedrijven. Maar die bedrijven hebben wel wat te zeggen over de werking van die AI-advertenties en willen graag meer controle.

Marketing18.09.2024

Marketeer, je krijgt meer controle over Google Ads-campagnes