126 variabelen waarop Google je site waardeert
Waarom staat mijn site niet hoger? Waarom wordt ik niet gevonden op dit specifieke keyword? Hoe kom ik op pagina 1? Zomaar wat vragen die mij regelmatig gesteld worden als we praten over de klant zijn website. Het probleem is dat niemand weet hoe het algoritme van Google nou exact opgebouwd is. De geruchten gaan dat het om 200 (of meer) variabelen gaat waar Google haar waardering op baseert. In dit artikel lees je in ieder geval welke 126 er (waarschijnlijk, want zeker weten doen we het niet) bij horen.
Juist omdat het mysterie rondom Google’s algoritme zo enorm groot is volg ik sinds een paar weken met grote aandacht een topic op webmasterworld.com waar men probeert de 200 variabelen inzichtelijk te maken. Inmiddels is de lijst gegroeid tot een overzicht van 126 variabelen waar iedereen het redelijk over eens is. Ondanks dat er nog genoeg onbekende parameters is de lijst mijn inziens wel het vermelden waard. Ann Smarty zette op Search Engine journal de lijst overzichtelijk onder elkaar met eventueel links naar artikelen met meer uitleg. Een ‘must read’ voor iedere online uitgever:
Domain: 12 factors
- Domain age;
- Length of domain registration;
- Domain registration information hidden/anonymous;
- Site top level domain (geographical focus, e.g. com versus co.uk);
- Site top level domain (e.g. .com versus .info);
- Sub domain or root domain?
- Domain past records (how often it changed IP);
- Domain past owners (how often the owner was changed)
- Keywords in the domain;
- Domain IP;
- Domain IP neighbors;
- Domain external mentions (non-linked)
Server-side: 2 factors
- Server geographical location;
- Server reliability / uptime
Architecture: 7 factors
- URL structure;
- HTML structure;
- Semantic structure;
- Use of external CSS / JS files;
- Website structure accessibility (use of inaccessible navigation, JavaScript, etc);
- Use of canonical URLs;
- “Correct” HTML code (?);
- Cookies usage;
Content: 14 factors
- Content language
- Content uniqueness;
- Amount of content (text versus HTML);
- Unlinked content density (links versus text);
- Pure text content ratio (without links, images, code, etc)
- Content topicality / timeliness (for seasonal searches for example);
- Semantic information (phrase-based indexing and co-occurring phrase indicators)
- Content flag for general category (transactional, informational, navigational)
- Content / market niche
- Flagged keywords usage (gambling, dating vocabulary)
- Text in images (?)
- Malicious content (possibly added by hackers);
- Rampant mis-spelling of words, bad grammar, and 10,000 word screeds without punctuation;
- Use of absolutely unique /new phrases.
Internal Cross Linking: 5 factors
- # of internal links to page;
- # of internal links to page with identical / targeted anchor text;
- # of internal links to page from content (instead of navigation bar, breadcrumbs, etc);
- # of links using “nofollow” attribute; (?)
- Internal link density,
Website factors: 7 factors
- Website Robots.txt file content
- Overall site update frequency;
- Overall site size (number of pages);
- Age of the site since it was first discovered by Google
- XML Sitemap;
- On-page trust flags (Contact info ( for local search even more important), Privacy policy, TOS, and similar);
- Website type (e.g. blog instead of informational sites in top 10)
Page-specific factors: 9 factors
- Page meta Robots tags;
- Page age;
- Page freshness (Frequency of edits and
% of page effected (changed) by page edits);- Content duplication with other pages of the site (internal duplicate content);
- Page content reading level; (?)
- Page load time (many factors in here);
- Page type (About-us page versus main content page);
- Page internal popularity (how many internal links it has);
- Page external popularity (how many external links it has relevant to other pages of this site);
Keywords usage and keyword prominence: 11 factors
- Keywords in the title of a page;
- Keywords in the beginning of page title;
- Keywords in Alt tags;
- Keywords in anchor text of internal links (internal anchor text);
- Keywords in anchor text of outbound links (?);
- Keywords in bold and italic text (?);
- Keywords in the beginning of the body text;
- Keywords in body text;
- Keyword synonyms relating to theme of page/site;
- Keywords in filenames;
- Keywords in URL.
Outbound links: 8 factors
- Number of outbound links (per domain);
- Number of outbound links (per page);
- Quality of pages the site links in;
- Links to bad neighborhoods;
- Relevancy of outbound links;
- Links to 404 and other error pages.
- Links to SEO agencies from clients site
- Hot-linked images
Backlink profile: 21 factors
- Relevancy of sites linking in;
- Relevancy of pages linking in;
- Quality of sites linking in;
- Quality of web page linking in;
- Backlinks within network of sites;
- Co-citations (which sites have similar backlink sources);
- Link profile diversity:
- Anchor text diversity;
- Different IP addresses of linking sites,
- Geographical diversity,
- Different TLDs,
- Topical diversity,
- Different types of linking sites (logs, directories, etc);
- Diversity of link placements
- Authority Link (CNN, BBC, etc) Per Inbound Link
- Backlinks from bad neighborhoods (absence / presence of backlinks from flagged sites)
- Reciprocal links ratio (relevant to the overall backlink profile);
- Social media links ratio (links from social media sites versus overall backlink profile);
- Backlinks trends and patterns (like sudden spikes or drops of backlink number)
- Citations in Wikipedia and Dmoz;
- Backlink profile historical records (ever caught for link buying/selling, etc);
- Backlinks from social bookmarking sites.
Each Separate Backlink: 6 factors
- Authority of TLD (.com versus .gov)
- Authority of a domain linking in
- Authority of a page linking in
- Location of a link (footer, navigation, body text)
- Anchor text of a link (and Alt tag of images linking)
- Title attribute of a link (?)
Visitor Profile and Behavior: 6 factors
- Number of visits;
- Visitors’ demographics;
- Bounce rate;
- Visitors’ browsing habits (which other sites they tend to visit)
- Visiting trends and patterns (like sudden spiked in incoming traffic)
- How often the listing is clicked within the SERPs (relevant to other listings)
Penalties, Filters and Manipulation: 12 factors
- Keyword over usage / Keyword stuffing;
- Link buying flag
- Link selling flag;
- Spamming records (comment, forums, other link spam);
- Cloaking;
- Hidden Text;
- Duplicate Content (external duplication)
- History of past penalties for this domain
- History of past penalties for this owner
- History of past penalties for other properties of this owner (?)
- Past hackers’ attacks records
- 301 flags: double re-directs/re-direct loops, or re-directs ending in 404 error
More Factors (6):
- Domain registration with Google Webmaster Tools;
- Domain presence in Google News;
- Domain presence in Google Blog Search;
- Use of the domain in Google AdWords;
- Use of the domain in Google Analytics;
- Business name / brand name external mentions.
Gerelateerde berichten:
- Autoriteit van auteurs bepalen met rel=”author”
- Een nieuwe website snel in Google in vijf stappen
- Google drukt slechte, nutteloze sites uit de zoekresultaten
- Sitelinks in Google uitgebreid
- Google Panda-algoritme: sites van hoge kwaliteit
Trefwoorden: algoritme, google, pagerank, ranking, score, search engine optimization, seo, site, waardering, website









Niet nieuw, maar erg goed om al deze variabelen eens bij elkaar te zien. Lijkt me een mooie checklist voor iedere website die wordt opgeleverd of geupdate!
Inderdaad niet helemaal nieuw, maar fijn dat je het zo op een rij zet.
Vandaag heb ik nog een businesscase besproken voor pageranking, dit vult lekker aan.
de overige 124 volgen waarschijnlijk nog?
Boudewijn
Interessante lijst… Wat ik merk is dat vrijwel alles terug te leiden is naar de #1 regel van google: Richt je op de gebruiker en de rest volgt vanzelf.
Sommige dingen liggen erg voor de hand, maar bij andere zou ik wel eens willen weten ‘wat nou beter is’, bijvoorbeeld bij backlinks: Location of a link (footer, navigation, body text). Welke is nou beter? navigation omdat dat prominenter is? of body text omdat dat inhoudelijker is? En moet je meer externe links hebben dan interne? etc. etc.
Ik zie ook Use of the domain in Google AdWords staan. We hebben het over de organische resultaten toch? Dan zou het een beetje dubieus zijn dat AdWords invloed heeft op de organische resultaten.
Al met al een goed stuk. Ik ga ‘t in iig in de gaten houden.
Jeroen
Thanx, gaan we eens doorlichten voor onze site.
Een aantal bronnen die Google een schat aan informatie opleveren en die blijkbaar over het hoofd worden gezien zijn:
Adsense
Doubleclick
Gmail
Chrome (browser)
FireFox(browser)
Feedburner
Google reader
Youtube
Google toolbar
Google Maps
Om er maar een paar te noemen
@Jeroen
Waarom zou het dubieus zijn dat AdWords invloed heeft op de organische resultaten ?
Ik begrijp wel wat je wil zeggen, maar Google heeft maar 1 doel en dat is de gebruiker van zijn zoekmachine de best mogelijke resultaten voorschotelen. Dit om de gebruiker tevreden te houden, zodat hij de service blijft gebruiken.
Dus, de manier waarop dit domein binnen Adwords wordt gebruikt, evenals de manier waarop dit domein Adsense, Feedburner, Google maps, YouTube of doubleClick etc. gebruikt heeft grote invloed op de rankings.
Belangrijker echter nog zijn de acties (of het ontbreken daarvan) van de gebruikers van de zoekmachine en de daaraan gekoppelde gereedschappen als Gmail, feedburner, reader, toolbar etc …
Filip
@ Filip
Google: ‘Uw deelname aan AdWords en AdSense is niet van invloed op de positie of opname van uw site in de zoekindex van Google’
Je hebt gelijk dat het eerste doel van google is om de gebruiker de beste resultaten te geven, maar waarom adwords dubieus is, is omdat je dan door te betalen direct je organische resultaten kan verbeteren. Maar je begreep al dat ik dat bedoelde. Indirect kan het gebruik van adwords je organische resultaten wel verbeteren, omdat je site waarschijnlijk bekender wordt en meer gelinkt zal worden.
Hoe jouw site gebruikt wordt in Googles eigen producten en diensten is voor Google natuurlijk de grootste schat aan informatie die ze kunnen hebben, maar dan wel gebaseerd op de gebruiker en niet hoe jij met jouw domein die diensten gebruikt.
Misschien is Analytics wel de grootste schat aan informatie. Dit representeert de gebruikerservaring het beste en een goede gebruikerservaring is wat google wil.
[...] bij vindbaarheid van zowel nieuwe als oudere content, moet optimaal vindbaar zijn via zoekmachines. Optimalisatie van de vindbaarheid is voor goede webbouwers een standaard onderdeel in het productieproces van een site, maar daarmee [...]
[...] ‘s wereld best bewaarde geheim. Een half jaar geleden publiceerde ik al een artikel waarin 126 variabelen door de ‘crowd’ werden geïdentificeerd, maar het lijkt er nu op dat het muisgedrag van [...]
[...] hoger in de zoekresultaten te verschijnen blijft fascinerend. Het is belangrijk om te weten welke factoren een rol spelen, maar nog belangrijker op welke wijze deze factoren te beïnvloeden zijn. Wat is [...]
[...] 126 variabelen waarop Google je site waardeert [...]
Laat een reactie achter!
Business »
‘Learnings’ van een dagje Business Modelling à la Osterwalder
Gisteren organiseerde het Stimuleringsfonds voor de Pers een ‘Business Modelling Day’. Een dagje stoeien met business modellen aan de hand van het business model canvas van Alexander Osterwalder.
Zoals gebruikelijk op dit soort dagen vliegen de …
Redactie »
De top 100 best gelezen Publishr.nl artikelen
De 100e nieuwsbrief van Publishr.nl wordt vandaag verzonden! Ter gelegenheid van onze jubileum nieuwsbrief publiceren wij de Publishr.nl top 100 best gelezen artikelen aller tijden.
Hot topics
Als we naar de belangrijkste topics kijken dan …
Social media »
Strategisch inzetten van social media in de mediabranche
Door de sterke positie die social media inneemt binnen het medialandschap, is het zeer belangrijk om social media niet meer als hype, maar als strategische tool te benaderen. Strategisch, omdat social media zeer veel mogelijkheden …
Techniek »
Eenvoudig inloggen met Facebook, Twitter of LinkedIn
De discussie over online datamining en de paywall blijft actueel. Uitgevers willen weten wie hun content consumeert, hier de content en campagnes op afstemmen en het liefst profielen van gebruikers samenstellen. Belangrijk hierin is het …
Trends »
Nieuw online verdienmodel: de concurrenten?
Webwinkel bol.com heeft het afgelopen jaar afgesloten met een recordomzet van 376 miljoen euro, 18 procent meer dan een jaar eerder. Steeds meer mensen kopen steeds meer producten bij Bol.com. De belangrijkste reden van deze …
Archief
Blogroll
Thema's
Willekeurige berichten
Laatste video
nieuwste berichten
Laatste reacties
Top 10 artikelen
Realisatie door Liones | Berichten (RSS) | LinkedIn Group: Online Publishing NL | Functioneel Ontwerpen, alles over FO's | Technisch Ontwerp, alles over TO's