Schlagwort-Archive: Web-Statistiken

IP anonymisieren mit WordPress Google Analyticator Plugin

Aktuell ist der Statistik-Dienst Google Analytics wieder in den Medien. Scheinbar erfüllt Google-Analytics nicht die Vorgaben des Datenschutzbeauftragten Prof. Dr. Caspar. Aus meiner Sicht werden Google Auflagen abverlangt, die nicht sinnvoll realisierbar sind. Vieles liegt in der Natur eines Statistikdienstes und wird genauso auch bei anderen kostenpflichtigen und kostenlosen Diensten umgesetzt. Selbst die Website des Datenschutzbeauftragten selbst verwendet Statistiktools, welche die IP-Adresse der Busucher speichern schreibt Thomas Stadler von Internet Law:

[…] Website des Hamburger Datenschutzbeauftragten, der derzeit gegen Google Analytics vorgeht, selbst Tracking-Technologie einsetzt und dort kräftig getrackt würde. […]

Das Programm der IVW ist freilich, wie Google Analytics auch, ein Tracking-Tool, das Daten über die Besucher der Website sammelt und an die IVW weiterleitet, u.a. auch die IP-Adressen der Seitenbesucher. Und wenn man einem Artikel von golem.de glauben darf, werden auch von der IVW IP-Adressen vollständig, ohne Anonymisierung erfasst und gespeichert, weshalb hiergegen grundsätzlich dieselben datenschutzrechtlichen Bedenken bestehen müssen wie gegen Analytics.

Eigentlich sollte jedem klar sein, dass sich die Diskussion nicht nur um Google geführt werden sollte, sondern gesamthaft für alle Statistiktools. Inzwischen hat auch Google selbst zu den Artikeln Stellung genommen:

Uns ist ein Abbruch der Gespräche von seiten der Datenschutzbehörden nicht bekannt und wir arbeiten weiter aktiv daran, die Bedenken der Datenschutzbehörden auszuräumen.

Immerhin kann man die IP-Adresse anonymisieren, was dazu führt, daß, nachdem die IP-Adresse durch das Aufrufen der Seite natürlich dem Google-Server bekannt ist, diese verkürzt in der Statistik-Datenbank gespeichert wird. Dies würde ich vorerst jedem der Google-Analytics in Deutschland einsetzt empfehlen. Ob das langfristig ausreicht ist natürlich unbekannt.

IP Adresse anonymisieren

Im Datenschutz-Blog wird schön beschrieben, wie der Analytics Code dazu um _gaq.push(['_gat._anonymizeIp']); ergänzt werden muss.
Hier im Kontext:

<script type=”text/javascript”>
var _gaq = _gaq || [];
_gaq.push(['_setAccount', 'UA‐xxxxxxxx']);
_gaq.push(['_gat._anonymizeIp']);
_gaq.push(['_trackPageview']);
(function() { var ga = document.createElement(‘script’); ga.type = ‘text/javascript’; ga.async = true; ga.src = (‘https:’ == document.location.protocol ? ‘https://ssl’ : ‘http://www’) + ‘.google-analytics.com/ga.js’; var s = document.getElementsByTagName(‘script’)[0]; s.parentNode.insertBefore(ga, s);})();
</script>

WordPress Google-Analyticator

Nun doch noch zur eigentlichen Intension meines Artikels: Wer das WordPress-Plugin Google Analyticator verwendet und daher den Code nicht selbstständig im Theme einbaut, kann die Anonymisierung ebenfalls aktivieren. Dazu auf der Konfigurationsseite des Plugins im Bereich Additional tracking code
(before tracker initialization):
den Benötigten Parameter _gaq.push(['_gat._anonymizeIp']); eintragen.

Natürlich sollte man, wie im Datenschutz-Blog erwähnt,  die Datenschutzbestimmungen noch ein wenig ergänzen.

Bloggen ohne Google

In einem kleinen (unfreiwilligen) Selbstversuch habe ich gerade zwei Wochen lang den Google-Bot aus diesem Blog ausgesperrt. Das geht in WordPress recht einfach über die Option „Ich möchte Suchmaschinen blockieren, aber normale Besucher zulassen.“ unter Einstellungen › Privatsphäre. Diese hatte ich während meiner Übernahme des Blogs auf WordPress Multiuser eingestellt, damit die unter http://mzung.zungu.net importierten Seiten nicht unter dieser URL von Google indiziert werden. WordPress fügt dabei einen Metatag in den Seiten-Kopf ein, der verhindert, dass Google die Seiten durchsucht und im Suchindex speichert.

<meta name="robots" content="noindex, nofollow">

Nach dem meine Domain m.zung.us auf den neuen Ort des Blogs gemapped war, habe ich diese Einstellung schlicht vergessen zu entfernen.
Ergebnis des Selbstversuchs: In 14 Tagen haben sich die Anzahl der Besucher auf genau 25% verringert.

Verlauf der Statistik ohne Google Referer
Verlauf der Statistik ohne Google Referer

In solchen Fällen sollte man nicht vergessen sich der Google Webmaster-Tools zu bedienen. Im Bereich der Crawl-Errors haben mich dort heute die über 1500 durch robots.txt ausgesperrten Seiten erschreckt. Ich bin gespannt wie bis wann (und ob) sich diese Zahlen wieder erholen. Seitens der Geschwindigkeit dürfte meine Seite sich durch die Nutzung von WP-Super-Cache verbessert haben, was Google nun auch als Kriterium im Ranking aufnimmt und zukünftig über die Webmaster-Tools supporten möchte, wie Golem berichtet. Einige Tipps zur Verbesserung der Performance habe ich ja auch schon kürzlich vorgenommen und dokumentiert.
Update: Hier noch der Verlauf der Indexierung von Google. Man sieht ganz genau dass Google die Indexierung umgehend eingestellt hat.
Google Crawl Chart
Google Crawl Chart

Das "Web2.0" ist noch immer recht unbekannt

Das Marktforschungsunternehmen Dialego hat in Deutschland, Frankreich und Großbritannien untersucht wie bekannt das  Web2.0 wirklich ist. Dabei wurde folgendes Untersucht:

  • Bekanntheit Web 2.0 und User Generated Content (UGC)
  • Bekanntheit Blogs
  • Bekanntheit einzelner Web 2.0 Services
  • Nutzung einzelner Web 2.0 Services

Wer kennt User Generated Content?
Wer kennt User Generated Content?

In der Umfrage wurde Explizit nach Websites von 43 things, Blogger, Clipfish, Del.ici.ous, Digg, Facebook, Flickr, last.fm, myspace.com MySpace, StudiVZ, Twitter, Wikipedia, Xing und YouTube gefragt.
In Deutschland ist die Wikipedia am häufigsten besucht. Im Bereich der Social Networks wie Facebook liegt Deutschland jedoch weit hinten im Vergleich. Zum Zeitpunkt der Umfrage hatten nur 6% ein Facebook-Konto im Vergleich zu 27% der Franzosen und 47% der Briten. Meiner Meinung nach liegt dies aber auch an der noch lange fehlenden deutschen Übersetzung – was sich ja bekanntlich geändert hat. Auch mit dem Begriff User Generated Content fangen die Deutschen erstaunlich wenig an.
Hier ein Auszug aus dem Fazit der Studie:

Die Wandlung des Internet vom statischen Datenkanal zur interaktiven Plattform ist bereits seit langem Wirklichkeit. Heute nutzen viele Surfer das Web zum Chatten, Bloggen oder Einstellen von Fotos und Videos – und erstellen so interaktive Inhalte. Zu einem wirklichen Massenphänomen jedoch ist „Web 2.0“, das Internet zum Mitmachen, noch nicht geworden.

Der Bekanntheitsgrad von Web2.0 ist dennoch von 37% (200&) auf 52% (2008) angestiegen. Immer mehr Surfer verwenden mE interaktive Websites ganz selbstverständlich. Ein Einkauf ohne Meinungen und Kommentare anderer Käufer ist für mich  inzwischen fast unvorstellbar geworden. Zum Glück kann man im Media-Markt ja auch noch ein ausgetselltes Notebook mit Internet finden und sich dort kurzerhand die Kommentare zum favorisierten Produkt auf Amazon ansehen. Mit etwas Pech für den Media-Makrt wird der Artikel dann dort direkt bestellt, denn Geiz ist ja…
Wer sich zum Thema weiterbilden möchte, dem empfehle ich sich mal folgende in der Wikipedia gelistete Begriffe rund um Web2.0 anzusehen: User-Generated Content, Crowdsourcing, The Long Tail, Mass Customization, Folksonomy, Social Network, Social Commerce, Social Software, Citizen Journalism, Open Innovation, The Wisdom of Crowds, Viral-Marketing
Die Studie kann man als PDF-Dokument auf der Website von Dialego herunterladen.

[via heise]

Blogscouts unvermittelter Abgang

Dirk Olbertz hat vorgestern Blogscout den „Wegweiser durch die Blogosphäre“ sowie die dazugehörigen Statistiken abgeschaltet, wie man im Blogscout-Blog nachlesen kann. Reaktionen zum Ende von BlogscoutDie Reaktion in der Blogosphäre dazu ist recht groß, viele bekannte Weblogs schreiben darüber und viele Nutzer bedanken sich bei Blogscout. Das Ziel von Blogscout ein Wegweiser durch die Blogoshpäre zu sein wurde verfehlt, sagt Dirk Olbertz und schließt damit seinen kostenlosen Dinest:

Ich wollte mit Blogscout einen Wegweiser für die Blogosphäre schaffen. Diesem Anspruch kann ich aber nicht ansatzweise gerecht werden. Die breite Masse – oder auch “Longtail” – ist entweder gar nicht bei Blogscout vertreten, oder ist unterrepräsentiert.

Blogscout wurde unvermittelt abgeschaltet und die Statistiken und Benutzeraccounts ohne Vorwarnung deaktiviert, lediglich eine Email an die Nutzer informierte über diese Tatsache. Trotz einigen Problemen waren die Statistiken von Blogscout doch bei vielen Bloggern beliebt – was sich auch in der Reaktionen zu Dirk Olbertz‘ Post zeigt. Sicherlich, der Dienst rund um Blogscout war kostenlos und die Nutzer hatten deshalb auch kein Anrecht auf eine Kontinuität der Statistiken. Obwohl Olbertz‘ Hauptziel mit Blogscout weniger die Statistiken für die Blogs waren, sollte nicht vergessen werden, dass diese Funktion doch von einem großen Teil der Mitglieder hauptsächlich genutzt wurde. Schade dass den Nutzern letzlich kein Vorlauf zum Wechsel auf einen alternatives Trackingtool gegeben wurde. Aufgrund der großen Nachfrage gibt es aber immerhin die letzten Statistiken für jeden Nutzer zum Download.

 

Natürlich gibt es gute Alternativen. Aktuelle Bewegungen in der deutschen Blogosphäre kann man inzwischen schön bei Rivva verfolgen. Als alternative Trackingtools bieten sich z.B. Google-Analytics, W3Counter, reinvigorate (beta) oder eigene Installationen wie WP-Shortstat-Ex an.

Aufgebohrte WordPress-Statistiken mit SlimStat-Ex

WP-SlimStat-Ex ist ein mit vielen Optionen und netten AJAX-Effekten Zusammengefasste Statisktikenangereichertes Statistik Plugin, welches auf WP-SlimStat (bzw. Slimstat) basiert. Es ist zusätzlich mit sog. Pins erweiterbar, mit denen z.B. der Verlauf eines Besuchers (PathStats) oder Downloads von Dateien analysiert werden können. Weiter gibt es eine Admin-Oberfläche auf der viele Einstellungen gemacht, alte Statistiken von WP-Shortstat und WP-Slimstat importiert, sowie alte Statistik-Daten gelöscht werden können. Hier die Übersicht der Features:

  • Separated feed statistics
  • Ajax modules : You can browse each panels and modules without refresing entire page.
  • Filtered results : You can filter stats by remote addr, domain(referer), search terms and so on.
  • Plugable extensions(Pin): PathStats, Downloads, Micelleneous, BadBehaviour, FreshView, etc.
  • SlimStat-Admin tool : Support importing Wp-ShortStat and Wp-SlimStat, deleting old stats data, updating Ip-to-country database and performance management through adding or removing index keys from stats table.
  • Fix time offset between server and blog(manual)
  • Support Ignore-IP-List
  • Get post or page title from resource(url)
  • Support external tracking
  • Support external ip-to-country database

PathStats - Verlauf eines BesuchsIrgendwie erinnert das ganze stark an Mint von Shaun Inman der mit Shortstat wohl die Basis für Slimstat und seine eigenen kostenpflichtigen Mint Statistiken gelegt hat. Mint kenne ich natürlich nur von Berichten und Screenshots, da mir 30 USD/Domain bisher für ein privates Blog doch zuviel waren.
Seit gestern habe ich nun wp-slimstat-ex aktiviert. Optionen Der Import meiner 21MB großen Slimstat-Tabelle über die Admin-Oberfläche war recht zeitaufwändig. Ich bin mir nicht sicher, ob er korrekt abgeschlossen wurde. Die neue Slimstat-Ex Tabelle hatte da nach eine Größe von ca. 47MB. Deshalb habe ich gleich einige alten Statistiken gelöscht und sie auf ca. 30MB verkleinert. Admin Tool - Importieren von WP-SlimstatParallel verwende ich natürlich weiterhin WP-Slimstat. Seltsamer weise Stimmen die Hits und Visits von WP-Slimstat und WP-Slimstat-Ex nicht überein, was aber evtl. an einem fehlerhaften Import der alten Daten liegen könnte. Ich habe diesbezüglich eine Email an den Autor geschickt, dessen Seite größtenteils auf koreanisch ist. Eine genauere Auswertung ist deshalb erst im Laufe der Zeit möglich.
Auf den ersten Blick sieht WP-Slimstat-Ex gut aus und wäre dabei evtl. eine Alternative zu Mint. Also bitte einfach mal testen und darüber Berichten (ein Trackback in dem Fall wäre nett ;-))! Download und Infos auf der Seite das Autors.

Blog Traffic – and still counting

Damals, 2003 …. beim ersten Post hat es mich nicht wirklich interessiert. Aber irgendwann wird man dann doch neugierig viele Besucher sich täglich tummeln. Nach 3 1/2 Jahren ist es an Zeit ein paar Traffic-Zahlen zu veröffentlichen (aber mit Robert sollte man besser nicht vergleichen). In den ersten Monaten gab es durchschnittlich 7 Besuche täglich und ich möchte nicht wissen, wie viele der Besuche davon auf meine Kappe gingen. Inzwischen sind es täglich zwischen 100 und 500, je nachdem welchem Counter man glaubt ;-). Die Gesamtbesucherzahl liegt inzwischen bei ca. 62.000, vielleicht. Im Folgenden ein paar Details:
Blog Traffic – and still counting weiterlesen