Google indexeert CSS en Javascript

1168298191logo-google-hand-small

De afgelopen dagen is er in zoekmachine-optimalisatie-land een discussie ontstaan over een post op Ekstreme.com waarin wordt aangetoond dat Google ook CSS en Javascript bestanden indexeert. Waarom zou Google dit doen?

Een klein stukje de techniek in, gecombineerd met de huidige ranking issues van Google, kan dit verklaren.

Wat is CSS? Met CSS bepaalt een webmaster snel en eenvoudig de opmaak van een website. CSS code (eenvoudigweg HTML) wordt meestal in een apart bestandje op de server gehost. Extern gehoste bestanden (zoals CSS, maar ook vaak Javascript) verlagen de 'download time' van een pagina (waar zoekmachines blij mee zijn en dus goed is voor zoekmachine optimalisatie). Zie ook Wikipedia over CSS, Javascript en HTML.

Waarom indexeert de Googlebot CSS en Javascript? Google zou extern gehoste CSS en Javascript bestanden kunnen indexeren om spammers te ontdekken die bijvoorbeeld witte tekst op een witte achtergrond plaatsen of links en/of tekst onzichtbaar willen maken (middels de command display: none of visibility: hidden). Ik denk echter dat de algoritmes van Google niet (meer) veel waarde hechten aan 'wit op wit' en display: none of visibility: hidden, maar dat Google andere zaken meer van belang acht.

AJAX (Asynchronous Javascript And XML) Partijen als Google, Yahoo! en Amazon hebben de nieuwe scripttaal Ajax (Asynchronous Javascript And XML) geadopteerd en maken steeds meer gebruik van deze techniek om interactieve webpagina's te maken die vaak gebruiksvriendelijk(er) zijn. Javascript, en dus ook AJAX, kan echter niet geïndexeerd worden door een crawler/spider van een zoekmachine, wat problemen voor de zoekmachine vriendelijkheid van jouw website zorgt.

Maar aangezien er veel informatie van AJAX in het CSS bestand te vinden kan zijn, heeft Google er baat bij bestanden als CSS te indexeren. Javascript kan worden gebruikt voor spam-doeleinden zoals cloaking en (fout gebruik van) redirects, dus ook daar heeft Google belang om te weten wat het Javascript inhoudt. Zie ook Wikipedia over AJAX.

Het gaat om de content Zoekmachines zijn altijd op zoek naar goede content (te weten: HTML tekst) dat wordt gewaardeerd (middels links van kwalitatieve en relevante websites). Ik denk dat de waarde voor Google zit in de combinatie van het indexeren van de HTML, CSS en Javascript, omdat al deze informatie Google vertelt welk element van jouw website content/tekst is (en dus welke elementen andere zaken vertegenwoordigen zoals headers, footers, sidebars, etc.).

Robots.txt en de zoekmachines Voor degene die toch eigenwijs willen spammen in de zoekmachines lijkt Robots.txt een uitkomst. Het tekstbestandje Robots.txt gebruik je om bepaalde delen van een website af te sluiten voor een crawler/spider van een zoekmachine...

...wat dus ook kan voor CSS en Javascript. Maar dat is niet aan te raden, omdat Google dit op kan merken als potentiële spam website (met alle negatieve gevolgen voor je ranking in Google van dien - t/m verwijdering uit de index...). Zie ook Wikipedia over Robots.txt.

Stel de eindgebruiker centraal! Als conclusie en advies kan ik eigenlijk alleen maar zeggen: stel altijd de eindgebruiker centraal! Schrijf goede content die de moeite waard is voor de eindgebruiker en de moeite waard is om naar te linken. Houd je niet bezig met trucjes om zoekmachines te misleiden, want dat werkt echt alleen op de korte termijn. Eerlijk duurt het langst!

Lees meer over hoe Google jouw website indexeert

Reacties (16)

  • Het indexeren van de javascript zou ik wel met een korrel zout nemen. Het enigste wat ik tot nu toe gezien heb is dat Google de files spidert en hier de eventueel aanwezige links uit stript. Deze worden vervolgens ook gespiderd. Indien deze code wat ingewikkelder wordt en een link uit eventuele variabelen samengesteld wordt kan de Googlebot hier al gauw niks meer mee.
    Een kleine aanvulling hierop is dat Google tegenwoordig ook de links uit flashfiles weet te strippen.

    Di 9 jan 2007, 09:30 [reply]

  • @Ivan
    Dank voor de aanvulling!

    Di 9 jan 2007, 10:03 [reply]

  • Nou, ik zou de hele posting met een korrel zout nemen. display: none of visibility: hidden in css is tegenwoordig heel normaal, het wordt vooral ook gebruikt om menuutjes die uitklappen initieel te verbergen. Ook het positioneren van div's maakt dat Google niet direct waarde het aan tags met color:#fff en background-color:#fff o.i.d., omdat deze weer boven bv. een foto gepositioneerd kunnen zijn.
    Ook robot.txt gebruiken om .css af te schermen wil niet zeggen dat Google die pagina's niet ophaalt en analyseert, alleen dat deze niet in de index terecht komen, zo ook meta-tags als no-index etc.
    Google werkt wel aan manieren op pagina's te renderen en dan te analyseren om verborgen links op te sporen, maar dit gebeurt (nog) niet op grote schaal. Flash-content via XML binnenhalen zorgt dat deze content in Google terecht kan komen, maar ik zie deze zeer zelden in de eerste viewport...
    Je kunt dus nog steeds resultaat behalen, helaas, met botte jaren-90 spamtechnieken. Vandaag gebruikt Google nog een vrij grove methode die er op neerkomt dat als het vleugels heeft, kakelt en een ei legt het naar alle waarschijnlijkheid een kip is. Met andere woorden, het is een optelsom van verschillende factoren die maakt dat een pagina slecht scoort of als spam wordt aangemerkt.

    Di 9 jan 2007, 11:12 [reply]

  • @Paul
    Ik denk ook dat display: none of visibility: hidden in css veel voorkomt en ik stel ook dat Google er om diverse redenen (zoals je ook terecht noemt) steeds minder waarde aan hecht.
    Ik denk echter dat het kort door de bocht is om te stellen dat je nog steeds met jaren-90 spamtechnieken weg komt. Spam in de SERP's is een probleem voor Google, maar juist jaren-90 spamtechnieken als display: none of visibility: hidden werken niet meer.

    Di 9 jan 2007, 11:51 [reply]

  • @Eduard
    Zou Google daarom JavaScript én CSS gaan indexeren! Als in de CSS de opmaak op "hidden" staat en Google nergens in het JavaScript de code vindt om de tekst weer tevoorschijn te toveren, dan lijkt me dat een goede manier om weer wat tegen de SPAM-technieken te kunnen doen.

    @Ivan
    Google kan al een hele tijd tekst en links uit Flash filteren!

    Di 9 jan 2007, 16:56 [reply]

  • Als google nog niet eens gewone keyword spamming tekst
    aan kan pakken waarom zouden ze dan moeilijk doen om javascript en css te kunnen lezen.
    Laten ze eerst een de gewone teksten bekijken.
    Jullie denken natuurlijk dat kunnen ze allang.
    Maar leg me dan eens uit waarom "mijndroomjapon .nl"
    als zolang zo hoog scoort op "bruidsmode".
    Scroll maar eens omlaag op die site dan zie je dat ie niet eens de moeite heeft genomen de tekst in dezelfde kleur van de achtergrond te maken.
    Pfff google op z'n best.

    Zo 20 jan 2008, 00:33 [reply]

  • @Bart: Dank voor je toevoeging. Het is inderdaad schandalig dat dergelijke websites zo hoog scoren in Google.

    Dit geeft echter GEEN representatief beeld van Google, want er gaat ook veel goed. Maar er is inderdaad nog meer dan voldoende verbetering mogelijk.

    Zo 20 jan 2008, 15:16 [reply]

  • Kom op jongens, wat is dit nu? Pakt de NS elke zwartrijder? Krijgt elke schuin overstekende voetganger een bekeuring? Nou dan. Het gaat om geld.Hoe hoger de AdWords-inkomsten (monetizing), hoe beter de resultaten worden gefilterd (vooral m.b.v. subindexen).
    Ik kom dit soort spam ook wel tegen in projecten in niet-zo-competitieve markten. Zo'n site vogel ik dan helemaal netjes uit en vul vervolgens een spamrapport in. Op die manier heb ik al veel spammende concurrenten geheel uit de index kunnen verwijderen. En dat is zowel terecht als commercieel interessant....

    Zo 20 jan 2008, 15:40 [reply]

    • Bart

    Ok, ik zal die laatste zin terug nemen. Ik gebruik google ook en
    heb nog geen betere kunnen ontdekken. Maar ik ben toch blij dat ik geen concurent ben van die droomjaponnenclub.
    Aangezien google monopolie heeft en daarmee een voorbeeldfunctie mogen ze wat mij betreft toch wel wat meer
    aan die spam doen. Ze hebben de beste programmeurs ter wereld dus dat kunnen ze best oplossen, ook voor de minder betaalde keywords. Google zegt trouwens over spamrapports dat ze die gebruiken om de algoritmes te verbeteren maar pakken ze dan alleen de grotere sites handmatig aan of....?

    Zo 20 jan 2008, 17:58 [reply]

  • Bij spamreports grijpt Google wel handmatig in, maar niet in elke situatie. Dit is afhankelijk van mediaonrust, AdWords-inkomsten of andere, tot nu toe onbewezen, indicatoren. Sterker nog, ze hebben een hele club mensen die handmatig ingrijpen en beoordelen. Voelspriet heeft hierover, naar ik meen, ooit een aantal interne .pdf's van Google gepubliceerd, maar die kan ik zo snel niet vinden.... via Google...
    Google doet veel aan het bestrijden van Spam, Matt Cutts (http://www.mattcutts.com/blog/) post daar regelmatig over, hij is hoofd van het anti-spam-team van Google.

    Zo 20 jan 2008, 18:33 [reply]

  • @Paul
    Natuurlijk is het invullen van een spamreport een goede optie. Maar dat laat onveranderd dat er nog voldoende ruimte is voor verbetering. Google zal best één en ander handmatig aanpassen en spamreport zijn daarvoor goede input, maar Google laat altijd het algoritme veruit het meeste werk doen (en dus zo min mogelijk handmatig).

    Heb je een bron die stelt dat de kwaliteit van de zoekresultaten samenhangt met de AdWords inkomsten?
    Ik denk dat op competitieve termen SEO veel actiever wordt bedreven, waardoor simpelere vormen van spam tekort schieten.

    Ma 21 jan 2008, 07:57 [reply]

  • wat ik me eigenlijk afvraag is:
    bij de pagerankverdeling zorg ik er altijd voor dat niet belangrijke links (en dus geen waarde mogen krijgen) een javascript link kregen zodat de linkjuice niet onnodig verdeeld wordt. Dit kan ook met flash. Maar werkt dit nu nog wel?

    Do 5 nov 2009, 11:41 [reply]

  • @Onne
    Goede vraag.

    Een link met JavaScript onzichtbaar maken voor zoekmachines werkt steeds minder goed. Dat geldt ook voor Flash.

    Google en andere zoekmachines worden steeds beter in het doorzoeken en volgen van links, die geplaatst zijn middels dergelijke technieken.

    Alleen het nofollow attribuut werkt nog om links niet mee te laten nemen in de linkwaardeberekening. Maar dat werkt minder goed voor het sturen van je linkjuice.

    Beter is om je sitestructuur dusdanig in te richten dat de linkwaarde goed wordt verdeeld. Dat zal meer effect hebben dan proberen links onzichtbaar te maken voor zoekmachines.

    Do 26 nov 2009, 11:00 [reply]

  • @edwords

    bedankt voor je antwoord:). Echter ontkom je er soms niet aan om bepaalde links op de site te plaatsen die je echt geen linkjuice wil meegeven zoals: algemene voorwaarden, disclaimer en soms ook grotere lettertypes etc. een nofollow is dan toch wel zonde lijkt me?

    Do 26 nov 2009, 12:14 [reply]

  • @Onne
    Google snapt inmiddels vrij goed of een link (bijv. de disclaimer) in de footer staat of op een andere plaats op elke pagina van de site.

    Op basis daarvan kunnen ze dergelijke links al minder waarde geven.

    Slim en doordacht omgaan met je sitestructuur is dus belangrijk en levert meer op.

    Do 26 nov 2009, 21:28 [reply]

  • @edwords, ok stel dat als ik op elke pagina (footer of ergens anders) naar 1 pagina toelink dan krijgt deze pagina uiteindelijk veel waarde door de interne linkstructuur. Als ik naar een andere site zou linken dan krijgt hij toch veel minder waarde mee?

    Do 26 nov 2009, 21:32 [reply]

Reageren

  • HTML niet toegestaan. URL's worden automatisch clickable.
    * E-mail adres wordt niet getoond

Recommend on Google

Headlines

© 2004-2011 Dutchcowboys.nl - All Rights Reserved.

All views and opinions expressed are those of the authors of Dutchcowboys.

All trademarks, slogans, text or logo representation used or referred to in this website are the property of their respective owners. Sitemap