Own your Data! – Webtracking mit PIWIK

Im zweiten Teil meiner own your data! Reihe wird Google Analytics durch PIWIK ersetzt.

Um die Nutzerzahlen für mein Blog zu zählen, nutze ich von Anfang an Google Analytics. Analytics ist für Webtracking der Markführer. Das Tool ist kostenlos, mächtig und bietet unzählige Auswertungsmöglichkeiten. Bei meinen bisherigen Arbeitgebern war Google Analytics immer Standard.

Google Analytics hat aber auch ein paar Nachteile. Meine Daten (bzw. die Daten meiner Leser, z.B. ihre IP-Adressen) liegen auf den Servern von Google. Deshalb ist es gar nicht so einfach Google Analytics in Deutschland datenschutzkonform einzusetzen. Außerdem ist Analytics sehr komplex und für ein kleines, privates Blog eigentlich überdimensioniert.

Betreibt man ein WordPress-Blog ist als Alternative die Statistik-Funktion des Jetpack-Plugins recht einfach integrierbar. Hier hat man aber auch wieder das Problem, dass die Daten auf einem fremden (US)-Server liegen.

Und da ich ja wieder Herr meiner Daten werden will, habe ich in den letzten Monaten, parallel zu Google Analytics und Jetpack, die Open-Source-Alternative PIWIK getestet.

PIWIK steht kostenlos zur Verfügung und kann auf dem eigenen Server selbst gehostet werden. Die technischen Voraussetzungen dafür sind PHP/MYSQL. Wer also ein WordPress-Blog selbst hosten kann, kann auch eine eigene PIWIK Instanz betreiben.

Auswertungsmöglichkeiten

PIWIK bietet die üblichen Auswertungsmöglichkeiten. PageViews, Visits, Unique Visits, Referrer, Browser/Betriebssystem/Bildschirmauflösung und sogar eine Echtzeit-Besucheranzeige (hier eine kurzes Erklärvideo zu den Features). Für eine privates Blog alles ausreichend.

Nutzerfreundlichkeit

Auf der Einstiegsseite von PIWIK kann man sich sein individuelles Dashboard mit Widgets zusammenstellen. Im Vergleich zu Google Analytics bietet PIWIK nicht ganz so professionelle Auswertungsmöglichkeiten. Das empfinde ich für den privaten Zweck durchaus als vorteilhaft, da es alles übersichtlicher macht.

Bei der Performance merkt man deutliche Unterschiede zu Google Analytics und Jetpack. PIWIK läuft bei mir auf einem Reseller-Account von all-inkl. Und es lädt einfach alles wesentlich langsamer.

Mit einem zusätzlichen Plugin lässt sich PIWIK über die API relativ gut in das WordPress-Backend integrieren, sodass man dort immer die wichtigsten Werte direkt anschauen kann. Das Plugin fügt auf Wunsch den Tracking-Code auch in den Quellcode ein, wenn man das nicht selbst im Template machen will oder kann.

Datenschutz

PIWIK läuft auf meinem Server, bzw. dem Server meines Hosting-Anbieters all-inkl. Einer deutschen Firma. Auf die Daten habe nur ich Zugriff.

Außerdem anonymisiert PIWIK die IP-Adresse der Nutzer automatisch. Eine der wichtigsten Anforderungen um das Tracking in Deutschland datenschutzkonform einzusetzen. Google Analytics bietet das auch an, allerdings muss man es dort aktiv anstellen (und erst mal in den Optionen finden).

Zusätzlich kann man eine One-Click-Opt-Out-Funktion integrieren und das globale DoNotTrack wird ebenfalls respektiert. Alle Privacy Optionen findet man hier nochmal aufgelistet.

Datenabweichungen

Benutzt man auf einer Webseite mehr als ein Zählverfahren ist es ziemlich wahrscheinlich, dass die Daten voneinander abweichen. Meine bisherigen Erfahrungen waren da bis zu 20% Unterschied bei der Zählung.

Das liegt daran, dass jedes Tool andere Techniken oder Auswertungsmechanismen verwendet. Von daher sind PageViews und Visits eigentlich immer nur aussagekräftig und über Webseiten vergleichbar, wenn sie mit dem gleichen Analysetool ausgewertet wurden.

Ich habe mir für das gesamte Jahr 2016 angeschaut, wie stark die PageViews und (Unique) Visits bei den drei Tools bei meinem Blog abweichen. Im Jetpack Vergleich werden nur die Unique Visits berücksichtigt, weil Jetpack nur diese ausweist.

Die Differenzen sind v.a. zu Google Analytics riesig, teilweise weist Google mehr als doppelt so viel aus. Warum das so ist, ist mir ein bisschen schleierhaft. Der PIWIK und Google-Tracking-Code sind beide an gleicher Stelle am Seitenende eingebunden. Die PIWIK-FAQ bietet ein paar Erklärungsansätze. So erfasst Google-Analytics standardmäßig auch Bots und Crawler, PIWIK filtert diese aber raus. PIWIK scheint von den drei Tools jedenfalls am konservativsten zu zählen und ich würde mal sagen, dass sich hinter den PIWIK Zahlen tatsächlich „echte“ Menschen verbergen, während bei den anderen auch viel automatisierte PageViews dabei sind.

 

Fazit

Zum professionellen Einsatz würde ich (ein selbst gehostetes) PIWIK nicht unbedingt empfehlen, für kleinere Seiten und Blogs, die ihre Daten nicht auf fremden Servern ablegen wollen, ist es eine gute Alternative. Datenschutzrelevante Einstellungen sind schon von Haus aus vorkonfiguriert. Verzichtet man auf ein bisschen Performance bekommt man zwar konservative aber zuverlässige Zahlen über die Besucher der eigenen Webseite und wie sie auf die Seite gekommen sind. Die Installation bekommt jeder hin, der auch sein WordPress selbst installiert hat.

Mit der Veröffentlichung dieses Posts entferne ich die Tracking Codes der beiden anderen Dienste aus meinem Blog.

7 Gedanken zu „Own your Data! – Webtracking mit PIWIK“

  1. @Fritz: Danke für den Hinweis. Probiere ich mal aus. Glaube aber, bei meinen PageViews (meistens <100/Tag) wird das nicht viel ausmachen.

  2. Hi Hike

    hast du mal die requests aus den logfiles gezählt und mit den Zahlen verglichen?
    Der Apache/nginx whatever schreibt ja normalerweise jeden request ins logfile wenn da weniger Einträge als bei deinem Analytic tool drin sind weißt du wer lügt 😉
    grüße
    Thomas

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.