Do Search Engines Hate Blogs?

Do Search Engines Hate Blogs? Bill Slawski veröffentliche kurz vor Weihnachten einen Patentantrag durch MSN, um Blogs eindeutig identifizieren zu können. Der tiefere Sinn dahinter? Blogs sollen in den Suchergebnissen reduziert werden. Nun ist MSN auf dem Suchmaschinenmarkt sicherlich nicht das Maß aller Dinge – es lässt jedoch aufhorchen. Google sammelt schon länger Informationen über das verwendete CMS, beispielsweise durch Test spezifischer Seiten. Das funktioniert recht einfach: Ist ein wp-admin.php vorhanden, ist es ein WP Blog System. Auch der Pfad des CSS (unter wp-content) oder die der Feeds sind eindeutige Kennzeichen.

Das verwendete System ist nur ein Anhaltspunkt. MSN erweitert um weitere Auffälligkeiten:

“A machine learning classifier is used to determine whether a web page belongs to a blog, based on a number of characteristics of web pages (e.g., presence of words such as ‘permalink’, or being hosted on a known blogging site). The classifier may be initially trained using human-judged examples. After classifying web pages as being blog pages, the blog pages may be further identified or categorized as top level blogs based on their URLs, for example.”

Bill listet einige Anhaltspunkte auf. Die Domain ist so einer (MSN Spaces, Blogspot, Yahoo 360, LiveJournal, Typepad, Xanga …), das Vorkommen von bestimmten Signalwörtern (Blog, Blogroll, Permalink …), ausgehende Links auf Blog Plattformen (WordPress.org, or movabletype.com, or blogger.com …), Das Wort /blog/ im Pfad der URL oder die schlichte Existenz von Feeds. Enige Kennzeichen sind eindeutig, andere können in Kombination zu einem eindeutigen Ergebnis führen. Allerdings haben auch viele Foren inzwischen Feeds und eine Nennung von WordPress dürfte auch nichts Ungewöhnliches sein. Die Google Variante finde ich besser.

N A C H T R A G : Die Diskussion zum Beitrag von Bill auf Seoroundtable und Sphinn.

Hinterlasse eine Antwort

Pflichtfelder sind mit * markiert.

*


Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Geschützt durch SpamBam
(389745 Spamkommentare gefiltert)