Digitale Selbstverteidigung im Zeitalter von Google, Meta & Amazon
Suchmaschinen Privatsphäre
Wie sucht es sich am privatesten?
Die Schwierigkeiten
Die Google Suche hat in Deutschland einen Marktanteil von über 90% [1]. Der Wechsel weg, von der Google Suche fällt, sogar denen schwer, die sonst auf Google Produkte verzichten. Insbesondere, weil die Suche den wohl größten und aktuellsten Index hat und wir uns Google schlichtweg gewohnt sind. Aufgrund der Datensammelwut und die dadurch zahlreichen Verletzungen der Privatsphäre durch Google fühlen sich trotzdem immer mehr Nutzer zum Wechsel verleitet.
Die selbst gehostete SearXNG Instanz ist eine gute Alternative zu Google.
Herkömmliche Suchmaschinen
Werbung
Das Geschäftsmodell Werbung ist längst Realität. Es kommt auf die Umsetzung an, wie aufdringlich dieses Verfahren ist. Klar gekennzeichnete gesponserte Suchergebnisse, die sich alleinig auf die aktuelle Suche des Benutzers beziehen, verletzen die Privatsphäre des Suchers meistens nicht. Ein Problem wird es, wenn eine zugewiesene Werbe-ID für maßgeschneiderte Werbung eingesetzt wird mithilfe von über längere Zeit gesammelten Daten.
Tracking
Umso besser einem das Werbenetzwerk kennt, umso passendere Werbung kann gezeigt werden. Den großen Datensammlern liegt daher viel daran, die Trackingmethoden stetig zu optimieren. Diese ausgereiften Strategien sind durch Fingerprinting immer schwieriger zu entdecken[2].
Filterblase
Nicht nur Werbung wird in den großen Suchmaschinen auf den Nutzer angepasst, sondern auch die sogenannten organischen Suchergebnisse. Dies führt zu der Filterblase, die dafür sorgt, dass immer mehr Suchergebnisse mit der Meinung des Suchers übereinstimmen. So erhält also ein politisch engagierter Sucher eher Ergebnisse, die seine Richtung unterstützen und kritische Stimmen bleiben aus. Die von uns nun genauer angeschauten Suchmaschinen verzichten auf diese Verfälschung der Suchergebnisse[3].
Zensur
Die meisten Suchmaschinenanbieter zensieren pornografische Inhalte mit einem Filter, der eingestellt werden kann. Weiter zensiert werden oft gewaltverherrlichende Inhalte und politisch extreme Gruppierungen und Meinungen. Sobald Suchresultate manipuliert werden, wirft dies allerlei ethische Fragen auf. Wird dabei die Allgemeinheit geschützt oder bevormundet? Auch wenn eine Zensur eines Inhaltes von allen Benutzern gewünscht wäre, ist der Algorithmus nicht perfekt. So wie Resultate, die gefiltert werden sollten, angezeigt werden können, können genauso harmlose Resultate gesperrt werden.
Privatsphäre orientierte Suchmaschinen
Der Datenschutz ist für die meisten Suchanbieter ein Übel, dass dem Geldfluss im Wege steht. Diese hier vorgestellten Suchmaschinen drehen den Spieß um, indem sie sich als Privatsphäre respektierend verkaufen. Wie diese ihr Geld verdienen, variiert – meistens jedoch durch unpersonalisierte Werbung und Spenden.
Unternehmen: Duck Duck Go, Inc Gründung: 2008 Gerichtsstand: USA Datenschutz, EN Finanzierung: Werbung / Partner Open Source: Teilweise Dezentralisiert: Nein Self-hosting: Nein Tor Option: Ja
Unternehmen: Qwant SAS Gründung: 2013 Gerichtsstand: Frankreich Datenschutz, DE Finanzierung: Werbung / Partner / Fan-Shop Open Source: Nein Dezentralisiert: Nein Self-hosting: Nein Tor Option: Nein
Unternehmen: Surfboard Holding B.V. / System 1 / Privacy One Group Gründung: 2006 Gerichtsstand: Niederlande / USA Datenschutz, DE Finanzierung: Werbung Open Source: Nein Dezentralisiert: Nein Self-hosting: Nein Tor Option: Nein
Developer: Adam Tauber Erscheinungsjahr: 2014 Gerichtsstand: Individuell Lizenz, EN Finanzierung:Spenden Open Source: Ja(GPLv3) Dezentralisiert: Nein Self-hosting: Ja Tor Option: Ja
Developer: Michael Christen Erscheinungsjahr: 2004 Gerichtsstand: Dezentral Impressum, EN Finanzierung:Spenden Open Source: Ja(GPLv3) Dezentralisiert: Ja Self-hosting: Ja Tor Option: Ja
Legende
Eigener Index: Suchmaschinen, die das Internet mit einem Webcrawler eigenständig indexieren.
Proxy: Diese Suchmaschinen erhalten Ihre Ergebnisse von einem anderen Anbieter.
Meta: Wie Proxy-Suchmaschine, nur dass die Suchresultate von mehreren externen Suchmaschinen gleichzeitig kommen.
Peer-to-Peer: Bei einer P2P-Suchmaschine wird der Index von den Nutzern selbst erstellt.
Dezentralisiert: Die Software läuft nicht auf Servern einer einzigen Partei, sondern auf mehreren unabhängigen Instanzen.
Self-hosting: Auf dem eigenen Server, Webhosting oder lokal laufende Software.
Tor Option: Diese Suchmaschinen sind alternativ über eine Tor .onion Seite erreichbar.
DuckDuckGo
Die wohl bekannteste und aktivste Privatsphäre fördernde Suchmaschine ist DuckDuckGo. Gemäß den Datenschutzbestimmungen sammelt und teilt die Duck Duck Go, Inc. keine persönlich zuweisbaren Informationen. Anonymisierung des Referers und eine Implementation von HTTPS Everywhere sorgen für eine sicherere Kommunikation zwischen Suchmaschine und Zielwebseite[4]. DuckDuckGo funktioniert auch ohne JavaScript. Die Suchergebnisse kommen von DuckDuckGo's eigenem Webcrawler sowie von zahlreichen anderen Suchmaschinen (dabei bewusst nicht von Google)[5]. Es handelt sich also um ein Hybrid aus Indexierter- und Meta-Suchmaschine. DuckDuckGo schaltet Werbung relevant zu dem eingegebenen Suchbegriff über das Microsoft Advertising Netzwerk[6]. Weiter finanziert sich DuckDuckGo durch Amazon und eBay, die eine Kommission auszahlen, sobald ein Nutzer über eine DuckDuckGo Suche auf deren Seiten landet und etwas kauft[7]. DuckDuckGo macht auch selbst Werbung auf den konkurrierenden Suchanbietern. Es ist nur ein Teil des Codes Open Source. Der Gerichtsstand ist in den USA, welche zu den Five Eyes[8] gehören. Die 3-Buchstaben Institutionen der USA haben in der Vergangenheit von Privatsphäre orientierten Diensten verlangt, die User auszuspionieren[9]. Gehostet wird DuckDuckGo in der Amazon-Cloud (AWS).
Qwant
Qwant kommt aus Frankreich, was einen besseren Schutz der Privatsphäre bietet als etwa die USA oder die UK[8]. Laut den Datenschutzbestimmungen von Qwant erfolgt überhaupt kein Tracking. Suchbegriffe werden von der IP-Adresse losgelöst und sind somit anonym[10]. Eine Suche in zahlreichen Kategorien wie Videos, Social Media, Musik und mehr bietet einen guten Funktionsumfang. Die Suchergebnisse stammten dabei Anfangs von mehreren großen Suchmaschinen. Mittlerweile hat Qwant hauptsächlich einen eigenständigen Index, aber scheint immer noch Ergänzungen von Bing einzuholen[10]. Für die Schaltung von Werbung wird das Microsoft Advertising Netzwerk verwendet, welches laut der Qwant SAS auf eine sichere und Privatsphäre freundliche Weise implementiert wurde[10]. Neben Werbung, die auf den eingegebenen Suchbegriff bezogen ist, verdient Qwant Geld mit Partnershops, die ebenfalls über den organischen Suchergebnissen dargestellt werden. Sobald ein solcher Link angeklickt wird und etwas im entsprechenden Webshop gekauft wird, erhält Qwant eine Kommission[11]. Falls Scripts auf Qwant ausgeschaltet sind, wird man automatisch auf die Lite-Version lite.qwant.com weitergeleitet, die ohne JavaScript funktioniert und für schwächere Hardware vorgesehen ist. Wir hatten bei der Lite-Version das Problem, dass bei der Websuche keine Ergebnisse angezeigt werden. Wir mussten gelegentlich Captchas lösen, wenn wir unser VPN benutzten. Bei der VPN Nutzung auch zu beachten ist, dass Qwant als einzige hier vorgestellte Suchmaschine als Standard die Regionalsuche verwendet. Während also zum Beispiel über einen Server in Rumänien gesurft wird, erhält man auch rumänische Ergebnisse. Ein anderes Land kann über die Einstellungen gewählt werden.
Swisscows
Wie viele Privatsphäre freundlichen Dienste der letzten Jahre hat die Swisscows AG, dem Namen entsprechend, ihren Sitz in der Schweiz. Die Schweiz bietet einen besseren Schutz der Privatsphäre als etwa die USA oder die EU[8]. Die Schweiz arbeitet jedoch eng mit den beiden zusammen[12]. Somit erwähnt die Swisscows AG auch, dass mit einer richterlichen Verfügung persönliche Daten eines Nutzers gesammelt werden würden[15]. Bei Swisscows handelt es sich um eine Bing Proxy-Suchmaschine mit zusätzlich eigenem Index. Ein interessantes Detail von Swisscows ist, dass die Server im Rechenzentrum Swiss Fort Knox I + II mit einem eindrücklichen Sicherheitskonzept, in den Schweizer Alpen gelegen sind[13]. Swisscows zeigt mit jeder Suche eine Wortwolke mit relevanten Begriffen an. Ohne JavaScript und XHR funktioniert die Seite nicht. Die Firma legt großen Wert auf Kinder- und Jugendfreundlichkeit[14]. Die Suche nach pornografischen und gewaltverherrlichenden Begriffen ist somit gesperrt. Swisscows sammelt laut den Datenschutzbestimmungen gar nichts Persönliches über seine Benutzer, auch nicht die Suchbegriffe. Das einzige was gespeichert wird, sind die gesammelten Suchanfragen pro Tag, um die Performance im Griff zu haben[15]. Swisscows schaltet über jeder Suche ein zufälliges Werbebanner. Zusätzlich entdeckten wir gelegentlich Werbung, die sich auf die Suchergebnisse beziehen, mit Logo des Werbetreibers und einem Redirect Link. Als Produkt neben der Suche bietet Swisscows einen kostenpflichtigen VPN-Service an.
Mojeek
Suchmaschine mit eigenem Index, also erhält der Sucher hier reine Ergebnisse von Mojeek statt die von größeren Anbietern. Bei der Bildersuche stützt sich Mojeek auf wahlweise Pixabay oder Bing. Weitere Suchkategorien fehlen. Mojeek bietet über mojeek.de auch eine deutsche URL an. Als spezielles Feature ist eine Suche nach Emotionen möglich. Der Standort ist in Großbritannien, welches zu den Five Eyes[8] gehört und aggressive Internetzensur betreibt. Mojeek führt einen Log mit folgenden Informationen: Zeit des Besuches, angefragte Seite, Referer und (in einem separaten Log) Browser Informationen. Die IP-Adresse wird mit einem zweistelligen Ländercode ersetzt. Die gesammelten Daten sind laut Mojeek nicht einem individuellen Nutzer zuzuteilen und werden nicht an Dritte weitergegeben[16]. Mojeek ist rein über private Investoren finanziert, schaltet somit keine Werbung und bittet um keine Spenden. Dies könnte sich laut Mojeek in Zukunft ändern[17]. Das Mojeek für Web-Ergebnisse nicht auf andere Suchmaschinen zurückgreift, ist ein Gewinn für die Privatsphäre. Wir haben jedoch auch etwas weniger relevante Suchresultate erhalten als bei den Suchmaschinen, die sich Unterstützung holen.
Startpage
Startpage ist eine Proxy-Suchmaschine, die Google Resultate anonymisiert darstellt. Google erlaubt dies gegen Bezahlung. Wer sich Google Resultate gewöhnt ist, für den ist dies eine praktische Lösung, um dieselben Resultate ohne Filterblase und Tracking zu erhalten. Suchresultate können über den Link Anonymous View besucht werden, ohne dabei die Startpage Domain zu verlassen. Finanziert wird Startpage durch Werbung, die sich auf den aktuellen Suchbegriff bezieht. An die Werber wird laut Startpage keine Informationen über den Nutzer weitergegeben[18]. In 2019 hat die US-amerikanische Privacy One Group der System1 Marketing Firma die Mehrheit an der bis dahin rein niederländischen Firma aufgekauft. Die Server stehen seit dem Wechsel zum Teil in den USA und zum Teil in der Niederlande. Das Geschäftsmodell von System1 steht mit seinem Datensammel- und Profiling-Konzept im Kontrast zu der Privatsphäre orientierten Startpage Suche. [19][20]
MetaGer
MetaGer kommt aus Deutschland und ist eine Kooperation zwischen dem gemeinnützigen Verein SUMA-EV und der Universität von Hannover. Finanziert wird MetaGer über verschiedene Kanäle: Werbung in den Suchresultaten, Spenden, Mitgliedschaften, Fan-Shop und Partnershops. MetaGer ist hauptsächlich eine Meta-Suchmaschine, hat aber auch ein paar eigene spezialisierte Crawler. Es wird erwähnt, dass MetaGer Ergebnisse von bis zu 50 Suchmaschinen liefert, bei uns variierte dies je nach URL: metager.org suchte lediglich auf zwei Suchmaschinen, metager.de auf 11, darunter vier Varianten derselben Seite. Während Bing und Yahoo (Yahoo ist ein Bing Proxy) vertreten sind, scheinen Google-Resultate auszubleiben. Die Suchergebnisse waren weniger relevant als bei den meisten anderen Anbietern, wobei deutsche Suchen bessere Ergebnisse lieferten als englische. Der gesamte Quellcode ist Open Source, eine .onion Tor Adresse ist vorhanden. Wie Startpage kann MetaGer als Proxy benutzt werden, indem Links über Anonym Öffnen angeklickt werden.[21] Die IP-Adresse der Besucher wird von MetaGer 96 Stunden intern auf deutschen Servern gespeichert. Dies, um eine hohe Anzahl an Anfragen derselben IP-Adresse zu verhindern. Das könnte bei VPN-Nutzern aufgrund der mit anderen geteilten IP zu Problemen führen, bei uns bestätigte sich dies jedoch nicht. Weiter sendet MetaGer neben dem Suchbegriff die ersten zwei (von vier) Blöcken der IP-Adresse und ein Teil des User-Agent an die Werbepartner. Somit bezieht sich die Werbung nicht nur auf den eingegebenen Suchbegriff, sondern auch auf die ungefähre geografische Lage des Users und dessen verwendeten Gerätes[22]. MetaGer scheint überaus transparent zu sein. Die Datenschutzbestimmungen sind ausführlich und klar und wer will, kann den ganzen Source Code durchgehen. Hierbei wird auch klar, dass MetaGer mehr mit den Werbetreibenden teilt als nötig. Die viel kleinere Anzahl an tatsächlich verwendeten Suchmaschinen als versprochen ist schade und hoffentlich nur ein temporäres Problem.
SearX
Jeder kann SearX auf dem eigenen Server / Webhosting oder auch lokal installieren. Alternativ kann eine der öffentlichen Instanzen genutzt werden. Es handelt sich um eine Meta-Suchmaschine die wahlweise bis zu ca. 70 Provider gleichzeitig durchsucht. Wer auf im Cache klickt, erhält die entsprechende Webseite als Archiv-Page über achive.org geliefert. SearX entfernt oder verfälscht identifizierende Daten, bevor der Suchbegriff an die Suchanbieter gesendet wird. Ebenso blockiert SearX unerwünschte Daten, die vom Suchanbieter an uns zurückgesendet werden würden (wie Werbung). Als Drittes werden keine Daten an die Webseiten aus den Suchresultaten gesendet. Konkret sendet SearX keine Cookies zu den Suchanbietern und mit jeder Anfrage wird ein zufälliges Browser-Profil generiert. Die Referer Seite und die Suchanfrage werden beide den besuchten Webseiten nicht mitgesendet. Die IP-Adresse wird die der Instanz übertragen. Bei einer eigenen Searx Instanz empfiehlt sich daher ein VPN, Proxy oder Tor zu benutzen. Die beiden letzteren sind in Searx als Optionen bereits integriert[23]. Seit 2019 scheint Google ein Katz und Maus Spiel mit den öffentlichen Instanzen zu spielen. Seither funktioniert nach unserer Erfahrung Google meist nicht und auch das Suchen mit anderen Suchanbietern liefert oft nur eine Fehlermeldung. Den jeweiligen Anbietern von öffentlichen Instanzen muss vertraut werden, dass diese nichts loggen und die Ergebnisse nicht verfälschen. Bei der Self-Hosting Variante entfällt dieses Problem, dafür kommen alle Suchanfragen von einem selbst, statt dass diese mit anderen Nutzern vermischt werden. Dies könnte theoretisch ein Tracking vereinfachen.
Versuch einer selbst gehosteten SearX Instanz
Wir richteten eine lokale Searx Instanz ein. Als generelle Suchmaschinen wählten wir nach etlichem Probieren: Wikipedia, Currency (Währungsrechner), Wikidata, Wolfram Alpha, DuckDuckGo, Qwant, Startpage und Mojeek. Die Qualität der Suchergebnisse sind mit die besten und zusätzlich erhalten wir relevante Informationen in einer Seitenleiste von Wikipedia und Wolfram Alpha. Zwischendurch macht eine Fehlermeldung aufmerksam auf ein Timeout eines Providers. Im Großen und Ganzen ist der Versuch geglückt und wir behalten unser SearX bei.
YaCy
Die Open Source Suchmaschine YaCy läuft über ein Peer-to-Peer-Netzwerk (P2P). Somit ist diese Suche dezentral, also ohne einen fixen Server. Die Grundeinstellung von YaCy ist die Community Suche freeworld, bei der alle verbunden Benutzer sich einen Index teilen und diesen stetig erweitern. Alternativ kann YaCy persönlich genutzt werden, mit eigen erstelltem Webindex oder als lokale Suche für ein Intranet. Der freeworld Index des Webs kann durch einfaches Suchen erweitert werden oder indem man den eigenen Crawler für gezielte Webseiten einsetzt.[24] Suchen können bei YaCy wie auch bei Searx als RSS-Feed gespeichert werden. Bei YaCy kann zusätzlich ein externer RSS-Feed gecrawlt werden und diesen so in die Suchergebnisse integriert werden.
Versuch einer selbst gehosteten YaCy Instanz
Wir haben uns ein lokales YaCy eingerichtet. Die Installation auf Linux war innerhalb 2 Minuten erledigt. Für Windows und Mac gibt es eine simple Installationsdatei. Der RAM-Verbrauch liegt bei uns bei ca. 200 MB. Wir konnten erfolgreich das eigene YaCy der lokal installierten Searx Instanz hinzufügen. Die Suchergebnisse sind bei uns nicht sehr relevant, aber als Ergänzung im Searx macht sich YaCy ganz gut, mit einem Fokus auf Nachrichten. Um YaCy ohne Installation zu testen, gibt es eine Demo.
Mojeek hat als einziges beim falsch geschriebenen Begriff trupm keine Ergebnisse von Trump dargestellt. Die korrigierte Suche wurde angeboten.
Werbung erhielten wir wie erwartet bei: DuckDuckGo, Qwant, Swisscows, Startpage und Metager.
Swisscows, Startpage, MetaGer und YaCy konnten die Umrechnung der 12 Kilogramm in Pfund nicht bewältigt.
Die von den meisten Providern dargestellten Zusatzinformationen auf der rechten Seite waren bei Searx am ausführlichsten (je nach Einstellung)
Mojeek.de explizit auf Deutschland eingestellt lieferte uns als Top-Resultate englische Treffer.
Auch Searx lieferte bei der Hamster-Suche nur teilweise deutsche Resultate.
Die Werbung bei Startpage scheint sich der IP unseres VPN anzupassen und nicht der eingestellten Sprache.
Relevanz
YaCy hat die wenigst relevanten Ergebnisse, welche oft von Newsseiten kommen. Mojeek, auch mit eigenem Index, kommt ebenfalls nicht an die Großen ran. Gewohnt gute deutsche Google Ergebnisse erhielten wir bei Startpage und die besten englischen bei DuckDuckGo. MetaGer liefert gute deutsche Ergebnisse, weniger gute englische. Swisscows und Qwant sehen wir in der Mitte, mit keinen überragenden Schwächen oder Stärken. Ein großes Potenzial hat Searx aufgrund der für jeden Benutzer individuell wählbaren Suchprovidern. Die Ergebnisse variieren je nach Anwendungsfall, ein Test der Suchprovider sollte selbst durchgeführt werden.
Direktsuche
!bang
Einige Provider wie DuckDuckGo, MetaGer und Qwant bieten sogenannte !bangs an. Mit dem !bang Befehl kann direkt auf einer unterstützten Webseite gesucht werden, so sucht !wde direkt auf der deutschen Wikipedia Seite. Searx bietet eine ähnliche Suche an.
Schlüsselworte
Die !bang Funktion ist limitiert auf die vom Provider unterstützen Webseiten. Außerdem geht die Anfrage zuerst über den entsprechenden Anbieter was zu Privatsphären- und Geschwindigkeitseinbussen führen kann. So erhält DuckDuckGo z. B. eine Provision von Amazon, selbst wenn der Nutzer direkt über den !ade !bang auf Amazon einkauft. Als Alternative können in Firefox Suchmaschinen und Seiten mit Suchfunktion als Intelligente Schlüsselwörter eingerichtet werden. Also wenn für Wikipedia z. B. das Keyword !wde eingestellt wird funktioniert dies genau wie ein !bang, nur direkt. In der Mobile-Version von Firefox ist das Schlüsselwort nicht möglich, aber es kann aus den als Suchmaschinen eingerichteten Seiten während der Sucheingabe gewählt werden.
Fazit
Keine der hier vorgestellten Suchmaschinen ist perfekt, aber jede Einzelne ist ein großer Fortschritt gegenüber der Nutzung einer der üblichen Suchmaschinen. Wer Google Resultate möchte, für den liefert Startpage ideale Suchergebnisse. Dabei muss man sich im Klaren sein, dass man Google weiterhin finanziell unterstützt und ebenfalls die mit Startpage verknüpfte Werbeagentur System1. DuckDuckGo, Qwant und Swisscows sind ein guter Mittelweg, die immer noch auf große Suchmaschinen zugreifen (meistens Bing) und zusätzlich einen eigenen Index betreiben. Wer ganz auf die üblichen Provider verzichten möchte, für den ist Mojeek oder YaCy mit eigenem Index und ohne Werbung eine gute Option. Ob die Resultate relevant genug sind, muss jeder selbst entscheiden. Wer die großen Suchmaschinen (und die meisten hier vorgestellten Privatsphäre Suchmaschinen) ohne Werbung und ohne Tracking nutzen möchte, kann Searx als Meta-Suchmaschine nutzen oder in geringerem Ausmaß MetaGer. Eine gute Strategie ist es, zwischen mehreren der vorgestellten Maschinen hin und herzuwechseln, um die getätigten Suchen zu streuen. Dies kann auf simple Weise mit den vorgestellten Schlüsselworten erreicht werden.