Google ist die Internet-Suchmaschine der Firma Google Inc. mit Sitz in Mountain View (USA). Die Firma wurde am 7. September 1998 von Larry Page und Sergey Brin gegründet. Am selben Tag wurde eine erste Testversion des Programms auf den Markt gebracht. Noch im gleichen Jahr ging die Suchmaschine offiziell ans Netz.
Google bietet eine Vielzahl von größtenteils werbefinanzierten kostenlosen Dienstleistungen im World Wide Web an. Dabei handelt es sich vor allem um die Suche auf verschiedenen Datenquellen. Nachfolgend eine Übersicht der wichtigsten Dienste.
Die Bezeichnung Google basiert auf einem Wortspiel (manche Quellen sprechen auch von einem Rechtschreibfehler) bei der amerikanischen Aussprache des Wortes googol. Diesen Ausdruck erfand Milton Sirotta (Neffe des US-amerikanischen Mathematikers Edward Kasner) im Jahre 1938. Er wollte der Zahl mit einer Eins und hundert Nullen (10100) einen Namen geben. Die Google-Gründer wiederum waren auf der Suche nach einer treffenden Bezeichnung für die Fülle an Informationen, welche mit ihrer Suchmaschine im Web aufgefunden werden sollte.
Der Name soll die Assoziation mit einer ungeheuerlichen Zahl von indexierten Webseiten aufkommen lassen. In Wirklichkeit handelt es sich zurzeit um etwas über 8 Milliarden (laut Betreiberangaben: 8.168.684.336 am 11. August 2005 22:43 MESZ) Seiten. Diese Zahl wiederum nimmt sich noch klein aus gegenüber der geschätzten totalen Größenordnung von Webseiten von an die 500 Milliarden unter Berücksichtigung des Deep Web.
Google Inc. betreibt weltweit eine Reihe von Rechenzentren, die jeweils die komplette Funktionalität der Suchmaschine enthalten. Eine Benutzeranfrage wird, durch das Domain Name System (welches Namen wie google.com in IP-Adressen übersetzt) gesteuert, im Idealfall an das netztopologisch nächste Rechenzentrum – nur manchmal mit dem geographisch nächstgelegenen identisch – geleitet und von diesem beantwortet. Fällt ein Rechenzentrum komplett aus, können die verbleibenden Rechenzentren die Last übernehmen.
Jedes Rechenzentrum besteht aus einem Computercluster. Die verwendeten Rechner sind IBM-kompatible Personal-Computer, bestehen also aus preiswerten Standardkomponenten. Man verwendet eine verteilte Architektur, bei der alle Daten mehrfach redundant auf verschiedenen Geräten gespeichert sind. Ist einer der Rechner oder nur eine Festplatte eines Rechners ausgefallen, werden die entsprechenden Daten von einer anderen Stelle im Cluster auf einen Ersatzrechner umkopiert und die ausgefallene Hardware-Komponente kann im laufenden Betrieb ausgetauscht werden, ohne dass Ausfälle entstehen. Das Gesamtsystem ist auch leicht skalierbar, da nach Bedarf immer weitere Rechner und Festplatten hinzugefügt werden können.
Durch Ablage der einzelnen Datenstrukturen (Indizes, Dokumentenkopien, Verzeichnisse aller Art) auf verschiedenen Rechnern und die große Anzahl verfügbarer Einzelrechner lassen sich Anfragen auch relativ schnell beantworten, da die Einzelinformationen parallel gelesen werden. Eine Antwortzeit von höchstens einer halben Sekunde wird als Richtwert angestrebt. Die schnelle Lieferung von Ergebnissen hatte auch frühzeitig zur Popularität von Google beigetragen. Die Konkurrenz ließ sich mit der Anfragebeantwortung oft mehr Zeit. Insbesondere bei inkrementellen Anfragen, also immer weiter verfeinerten Anfragen des Benutzers, der das jeweils vorige Suchergebnis berücksichtigt, ist die Zeitersparnis insgesamt deutlich spürbar.
Als Betriebssystem wird eine abgespeckte Variante der Linux-Distribution Red Hat verwendet. Die Programmiersprachen C, C++ und Python spielen essentielle Rollen bei der Implementierung der proprietären Suchmaschinensoftware.
Nach einer Schätzung auf Basis der Unterlagen zum Börsengang (IPO) vom April 2004 sieht die Hardwareausstattung bei Google etwa wie folgt aus:
Mitte 2006 wurde zum Bau eines neuen Datacenters in Oregon die aktuelle Zahl der Server auf 450.000 Rechner beziffert.
Die Anzahl der zu einer Suchanfrage passenden Dokumente kann unüberschaubar groß ausfallen, hier bedarf es also einer Sortierung dieser Treffer nach ihrer Relevanz, um dem Anfragenden möglichst die bedeutendsten Dokumente zuvorderst anzuzeigen. Die Abschätzung der Brauchbarkeit der Quellen in Bezug auf die Anfrage ist eine der entscheidenden Kriterien, an denen Suchmaschinen gemessen werden. Aufgrund der Fülle der hierfür zu verwertenden Information wird das zugrundeliegende Ranking von Zeit zu Zeit automatisiert durch einen Algorithmus erhoben, dies muss in einem angemessenen zeitlichen Rahmen zu bewerkstelligen sein, um die Aktualität des Rankings zu gewährleisten.
Google verwendet zur Sortierung der Suchergebnisse unter anderem den sogenannten PageRank-Wert. Ermittelt wird der PageRank eines Dokuments rekursiv anhand von Verweisen auf dieses Dokument. Je mehr solcher Verweise existieren und je höher jener PageRank der hierauf verweisenden Dokumente ist, desto höher fällt entsprechend der Wert des Dokuments aus, auf das verwiesen wird. Der jeweilige Wert des PageRanks einer Seite lässt sich anhand des Browser-Plugins Google-Toolbar ermitteln. Allerdings ist der in der Toolbar angezeigte Wert meist einige Monate alt und steht in einem logarithmischen Verhältnis zum tatsächlichen Wert.
Neben dem PageRank werden weitere Faktoren in die Sortierung einbezogen, so wird etwa das Auftreten der Suchbegriffe im Dokumententitel oder in Überschriften gewertet. Des Weiteren spielt die Verwendung der Begriffe als Ankertext in verweisenden Dokumenten eine große Rolle. Letzteres wird bei Google-Bomben missbraucht.
Die exakte Funktionsweise der Seitensortierung ist Googles Betriebsgeheimnis, nicht zuletzt, um Manipulationen durch Website-Betreiber zu erschweren, die die eigene Site für gewisse Begriffe auf den Ergebnisseiten möglichst weit nach oben bringen möchten. Die Suchmaschinen-Optimierung beschäftigt sich mit Methoden, dies zu erreichen.
| Geschäftszahlen http://www.heise.de/newsticker/meldung/72201 | |||
|---|---|---|---|
| Jahr | Umsatz in Mio. Dollar | Gewinn in Mio. Dollar | |
| 1. Quartal 2006 | 2 253 | 592,3 | |
| 2005 | 6.139 | 1.465,4 | |
| 2004 | 3.200 | 399,1 | |
| 2003 | 961,9 | 105,6 | |
| 2002 | 347,8 | 99,7 | |
| 2001 | 86,4 | 7,0 | |
| 2000 | 19,1 | -14,7 | |
Google Inc. ist ein kommerzielles Unternehmen mit Hauptsitz im kalifornischen Mountain View. Es beschäftigte Ende September 2005 rund 5.000 Mitarbeiter. Im Jahr 2004 vollzog Google seinen lange erwarteten Börsengang (IPO). Google hat einen marktbeherrschenden Anteil an allen Suchanfragen im Internet (Stand 2005).
Google verkauft für beliebige Suchbegriffe das Einblenden gesponserter Links im Rahmen seines Google-AdWords-Programms. Diese reine Textwerbung ist optisch speziell hervorgehoben, so dass der Benutzer sie von den eigentlichen Suchergebnissen unterscheiden kann. Auf diese Weise wird Werbung angezeigt, die inhaltlich zur Suchanfrage passt und somit den werbenden AdWords-Kunden mit der Benutzerklientel zusammenbringt, die mit höherer Wahrscheinlichkeit an seinen Produkten und Dienstleistungen interessiert ist. Der Kunde legt die Vergütung pro Klick selbst fest, wobei eine höhere Vergütung eine höhere Position gegenüber konkurrierenden Anzeigen erzielt.
Zusätzlich entstehen Gewinne durch das Google „AdSense“- Partnerprogramm; dies ist kontextabhängige Werbung, welche Webmaster auf ihren Webseiten einbinden können. Hierüber können seit Mai 2004 auch grafische Werbebanner in vier Standardgrößen platziert werden. Seit Juni 2005 können die Kunden über das „Site Targeting“ außerdem gezielt auf bestimmten Seiten werben, statische und animierte Werbebanner einsetzen und diese über die Zahl der Abrufe bezahlen. Bislang war nur eine Bezahlung pro Klick möglich.
Googles Suchtechnik wird auch an Internetportale lizenziert, um dort eine Websuche anbieten zu können, ohne dass Benutzer das Portal verlassen müssten.
Mit der Google Appliance verkauft Google seine Suchtechnologie an Firmen, die sie im eigenen Intranet einsetzen möchten. Bei der Appliance handelt es sich um einen Server mit vorinstallierter Software, der im firmeneigenen Netz dieselbe Aufgabe übernimmt, die Google für das World Wide Web leistet. Dokumente werden im Index vorgehalten und Suchanfragen beantwortet.
Aufgrund seiner bedeutenden Marktposition ist Google Hauptziel von Suchmaschinen-Spamming. Dabei wird versucht, gute Positionen bei möglichst vielen Suchbegriffen zu erzielen. Diese Suchbegriffe haben oft nichts mit dem eigentlichen Inhalt der Seite zu tun. Es werden Techniken wie Doorway-Seiten, Linkfarmen oder Page-Cloaking eingesetzt.
Erstmals im größeren Umfang öffentlich wahrgenommen wurde die Möglichkeit der Suchmaschinenmanipulation im Zusammenhang mit einer Google-Bombe, die sich auf den amerikanischen Präsidenten George W. Bush bezog. Der Suchbegriff „miserable+failure miserable failure“miserable failure (zu deutsch: „klägliches Scheitern“ oder „jämmerlicher Versager“) wurde von Bush-Gegnern mit seiner offiziellen Biografie verknüpft. Im Gegenzug versuchten Bush-Unterstützer dasselbe mit Michael Moore. Die Plätze wechseln seither gelegentlich.
Manipulationen, die zum Zweck haben, das Ranking von Websites speziell bei Google zu verbessern, werden auch als Google-Spamming bezeichnet. Versuche, fremde Internetseiten aus den Google-Ergebnissen herauszukegeln, bezeichnet man als Google Bowling.
Google ändert seine Algorithmen zur Bestimmung des Rankings regelmäßig ab, um Missbrauch zu erschweren. Die Spammer ziehen stets nach und passen ihre Seiten entsprechend an.
Im Januar 2006 wurde bekannt, dass Google stärker gegen unseriöse Methoden bei der Optimierung von internationalen Webseiten vorgehen will. Als erste Konsequenz des von Google-Mitarbeiter Matt Cutts (http://www.mattcutts.com/blog/seo-mistakes-spam-in-other-languages/) angekündigten verschärften Kampfes gegen Spam in Deutschland und anderen nicht-angelsächsischen Ländern entfernte die Suchmaschine die Online-Fahrzeugbörse Automobile.de und den Fahrzeughersteller BMW aus ihrem Indexhttp://www.golem.de/0602/43155.html. Ihr wird vorgeworfen, durch massiven Einsatz von Keywords (Spam), Doorway-Pages und Javascript-Weiterleitungen Suchergebnisse zum eigenen Vorteil unlauter optimiert zu haben. Die Seite von BMW wurde bereits nach wenigen Tagen wieder in den Index aufgenommen, nachdem der Betreiber die strittigen Doorway-Pages entfernt hattehttp://www.golem.de/0602/43211.html.
Google entfernt auf seinen Ergebnisseiten Einträge wegen gesetzlicher Auflagen. Da Google in verschiedenen Ländern Zweigstellen unterhält, variieren auch die Art und das Ausmaß der Entfernung von Ergebnissen.
Die erste Gruppe umfasst Websites, die Inhalte anbieten, obwohl sie nicht das Urheberrecht oder eine entsprechende Genehmigung dazu besitzen. Dazu gehörten anfangs vor allem Websites, die geschütztes Material der Church of Scientology anboten. Mittlerweile entfernt Google alle Inhalte, für die jemand bei Google eine infringement notification (etwa: Rechtsverletzungsbescheid) gemäß dem US-amerikanischen DMCA-Gesetz einreichthttp://www.google.com/dmca.html#notification. Wird auf einer bestimmten Google-Ergebnisseite ein Eintrag aus diesem Grund unterdrückt, blendet Google unten auf der Seite einen entsprechenden Hinweis ein (Beispiel: http://www.google.de/search?q=thong+picture&hl=de&lr=&safe=off&start=10&sa=N, funktionierend am 9. Mai 2006).
Kritik an Google wird vor allem wegen der zweiten Gruppe von Eingriffen in den eigenen automatisierten Ranking-Betrieb laut. Dabei werden Ergebnisse entfernt, weil die Verbreitung der Inhalte auf den Seiten, auf die verwiesen wird, in dem betreffenden Land verboten ist.
So werden auf Google.de und Google.fr (der deutschen bzw. französischsprachigen Domain der Suchmaschine) einige Seiten mit Inhalten entfernt, die strafbar sind, in Deutschland z. B. nach §130 StGB („Volksverhetzung“). Die Gesetzgebung in Frankreich und Deutschland verbietet das Anbieten solcher Inhalte. Neben der eigentlichen Zensur wird auch Kritik an Googles Informationspolitik geübt. Google beschränkt sich auf den eigenen Hilfeseiten auf einen allgemeinen Hinweis, dass nur aufgrund lokaler Vorschriften Ergebnisse entfernt werden, dies aber mit einer Einblendung gekennzeichnet wird. Tatsächlich findet eine solche Einblendung in manchen Fällen aber nach wie vor nicht statt (Stand Januar 2006).
Besonderes Aufsehen erlangte Googles am 25. Januar 2006 freigeschaltete chinesische Suchmaschine Google.cn (Meldung http://www.heise.de/newsticker/meldung/68792). Wie bei der deutschen und französischen Ausgabe ist das Ausmaß der Filterungen von den Behörden vorgeschrieben. Im Falle Chinas ist wegen der spezifischen Gewichtung verbotener Texte, die Filterung entsprechend intensiver, gleichwohl aber in Übereinstimmung mit den Gesetzen. In der Ausschlussliste finden sich Begriffe wie 法轮功 (Falungong), 六四 (Aufstand vom 4. Juni, Tian'anmen-Massaker 1989) oder 台湾独立 (Unabhängigkeit für Taiwan). Seiten, die den chinesischen Behörden nicht gefallen, werden nicht aufgelistet und bei Eingabe der Begriffe sind nur noch Seiten zu finden, die einen regierungsfreundlichen Tenor aufweisen. Google weist Nutzer bei der Suche nach Begriffen, die auf der Zensurliste stehen, auf die Entfernungen hin.
Kritiker verurteilen das Vorgehen von Google Inc. als Anbiedern aus Profitgründen an die chinesische Regierung mit ihren immer noch praktizierten Menschenrechtsverletzungen (Beispiel http://www.savetibet.org/de/news/news.php?id=219). Google entgegnet, dass man die aufgelegten Einschränkungen missbilligt, aber davon überzeugt sei, dass die zensierten Google-Ergebnisse eine Verbesserung gegenüber dem Status Quo zuvor seien http://googleblog.blogspot.com/2006/01/google-in-china.html.
Googles selbstgewähltes Firmenmotto Don't be evil (Tu nichts Böses), gegen das sie nun in der Wahrnehmung der Kritiker verstoßen, ist zusammen mit Googles hohem Marktanteil ein Grund dafür, dass der Protest gegen das China-Geschäft größer ist als bei den Konkurrenten Yahoo! und MSN Search, die bereits mit ähnlichen Filterungen auf dem chinesischen Markt vertreten sind.
Die Geschäftsmethoden von Google geraten seit einigen Jahren unter Beschuss, weil unter die Weigerung der Firma, Interna preiszugeben, auch konkrete Aussagen zum von der Firma praktizierten Datenschutz fallen (bzw. ob dieser überhaupt existiert).
Erster Kritikpunkt war die Vergabe von individuellen Cookies durch die Suchmaschine an ihre Benutzer. Offiziell dienen diese Cookies nur dazu, Einstellungen zu speichern; warum dazu automatisch eine für jeden Browser eindeutige und über 30 Jahre gültige Nummer vergeben wird, und dies selbst, wenn keine Einstellungen vorgenommen wurden, will Google nicht klären. Technisch ist es unumstritten einfacher, anstatt der Identifikationsnummer die Einstellungen selbst im Cookie zu speichern. Interessant ist in diesem Zusammenhang, dass eine Möglichkeit, persönliche Einstellungen auch ohne Cookie zu nutzen, kurz nach ihrer Entdeckung durch Google Watch seitens Google wieder abgestellt wurde.
Es wird deshalb vermutet, dass diese Identifikationsnummer nicht nur den Einstellungen dient, sondern auch dazu, Suchanfragen jedes Benutzers zu protokollieren, zumindest um daraus Rückschlüsse auf Interessengebiete zu ziehen.
Mit dem Webmaildienst GMail kam weitere Kritik auf. Google hatte angekündigt, die Inhalte der über GMail empfangenen E-Mails zu durchsuchen, in erster Linie um dazu passende Werbung einzublenden. Nachdem dieses Vorhaben sogar unter kalifornischen Abgeordneten auf Ablehnung stieß, rückte Google zumindest offiziell davon wieder ab.
Das soziale Netzwerk Orkut steht zu guter Letzt ebenfalls unter argwöhnischer Beobachtung, da jeder Teilnehmer vor Benutzung detaillierte Auskünfte über sich machen muss. Dies ist zwar prinzipbedingt, da andernfalls der Nutzen eines solchen Netzwerks eher gering ist, jedoch wäre Google mit Hilfe aller drei Dienste in der Lage, über einzelne Benutzer genaue Profile zu erstellen und sie somit zum „gläsernen Kunden“ zu machen.
Die Bürgerrechtsgruppe Public Information Research nominierte Google 2003 in den USA für den „Big Brother Award“ (vgl. zum Thema http://www.nytimes.com/2006/01/26/technology/26privacy.html ).
Bei Suchmaschinenanfragen im deutschen Internet besitzt Google bereits einen Marktanteil von über 80 Prozent http://www.webhits.de/deutsch/index.shtml?webstats.html c't (Mario Sixtus): Jenseits von gut und böse, 02.Mai.2006 . Medienforscher sehen die Meinungsmacht von Google mittlerweile als problematisch an. http://www.heise.de/newsticker/result.xhtml?url=/newsticker/meldung/65485 . Kritiker sprechen bereits von einer zukünftigen Google-Gesellschaft http://www.heise.de/newsticker/meldung/59709 . Googles Expansionsstrategie ähnelt der von Microsoft, nur agiert Google viel schneller http://www.heise.de/ct/06/10/162/ . Der Leiter der Pariser Nationalbibliothek sieht mit Google die Hegemonie des Englischen voranschreiten und will, in der Tradition des Gaullismus, eine eigene europäische Suchmaschine Quaero unter staatlicher Kontrolle etablieren. Seine Forderung bezieht sich ausdrücklich nicht nur auf das Buch-Digitalisierungsprojekt Google Book Search, sondern auf das ganze Google-System. Nötig sei ein europäischer Algorithmus. Einer privatwirtschaftlichen Suchmaschine wie Google fehle es vor allem an Dauerhaftigkeit. Das Ranking-System belohne grundsätzlich den Stärkeren gegenüber dem Schwächeren.
Neben der einfachen Suche steht noch eine weitere Suchmaske (erweiterte Suche) zur Verfügung, über welche bestimmte Filter angewendet werden können.
Die einfache Suche verwendet bei Eingaben standardmäßig den booleschen Operator „UND“ (Konjunktion: UND, wahlweise auch „+“) beim Eintrag mehrerer Begriffe. Es wird dabei nach allen Dokumenten gesucht, in denen diese Begriffe vorkommen. Gewichtet wird, neben dem Page Rank, meist danach, wo die Begriffe stehen – ob im Titel einer Seite, dem Dokumenten-Namen oder Verzeichnis, einer Überschrift etc.
Neben der booleschen Standardverknüpfung UND kann auch ein boolesches „ODER“ (Disjunktion OR, wahlweise auch „|“) verwendet werden. Suchbeispiel: „Strand OR Beach“. Google berücksichtigt dabei alle Wörter, die innerhalb einer OR-Kette vorkommen. Hat man mehr als zwei Wörter zur Auswahl, verknüpft man diese also zu „Wort1 OR Wort2 OR Wort3 …“. Die Verknüpfung mit Klammern funktioniert bei Google nicht, z. B. „(auto fahren) OR (flugzeug fliegen)“.
Um die Suche weiter einzugrenzen, kann man nach exakten Phrasen suchen. Die Suchbegriffe tauchen dann nicht wahllos im Dokument auf, sondern müssen in einer bestimmten Anordnung vorhanden sein. Exakte Suchphrasen werden mit Anführungszeichen „"…"“ kenntlich gemacht. Suchbeispiel: „"Bearbeiten von Google"“. Es werden keine Dokumente gesucht, in denen irgendwo das Wort „Bearbeiten“ und irgendwo das Wort „Google“ steht, sondern nur solche, in denen die Wörter in dieser Reihenfolge vorkommen. Wahlweise kann auch für ein Wort ein Platzhalter, kenntlich gemacht durch ein Sternchen „*“, gesetzt werden.
Als weiteres Ausschlusskriterium kann ein Minuszeichen „-“ Verwendung finden. Suchbeispiel: „Hannibal -Lecter“. Sucht nach einem antiken Feldherrn und schließt aber Seiten aus, in denen der Name in Verbindung mit einer Filmfigur namens „Lecter“ steht.
Die oft übliche Suche mit Wildcards ist bei Google indes nicht möglich. So wird bei der Suche nach „Googl*“ nicht nach den Begriffen „Googlin“ oder „Googler“ gesucht, sondern nur nach „Googl“.
Die Suche erlaubt eine Abfrage mit bis zu 32 Suchbegriffen (auch als Phrase). Diese Option ist hilfreich für das Suchen nach Dubletten oder Zweitverwertungen eines Textes.
Anhand dieser Verknüpfungen (die kombiniert angewendet werden können), sind schon sehr präzise Abfragen möglich. Die Abfrageergebnisse werden umso besser, je intelligenter man Fragen an Google stellt. Fragen nach banalen Suchbegriffen ergeben meist ziemlich dürftige Ergebnisse.
Weitere Funktionen:
2+5(4/5)^8“ gibt Google standardmäßig keine Seiten aus, in denen diese Formulierung vorkommt, sondern gibt das Ergebnis der Rechnung (= 2.8388608) zurück.
inch in cm“
Es kann zusätzlich zu dieser einfachen Such-Syntax eine erweiterte Syntax in die Suchmaske eingegeben, bzw. größtenteils auch über die „erweiterte Suche“ zusammengeklickt werden. Folgende, teils undokumentierte Schlüsselbegriffe sind derzeit bekannt. Diese Schlüsselbegriffe werden durch einen Doppelpunkt „:“ gekennzeichnet.
Die angewendeten Suchformeln lassen sich auch in Form der URL, die Google bei einer Suche ausgibt, speichern bzw. wiederholen und verlinken.
Weitere Funktionen bieten die zusätzlichen Google-Funktionen Google-Funktionen: Übersicht http://www.google.at/intl/de/features.html, siehe auch Google-Dienstleistungen
Internetunternehmen | Google | Unternehmen (USA) | Gegründet 1998
ጉግል | جووجل | Google | Google | Google | Google | Google | Google | Google | Google | Google | Google | Google | Google | گوگل | Google | Google | Google | גוגל | Lगुगल | Google | Google | Google | Google | Google | Google | Google | 구글 | Google | Google | Google | Google | गूगल | Google | Google | Google | Google | Google | Google | Google | Google | Google | Google | Гугл | Google | கூகிள் | กูเกิ้ล | Google | Google | Google | Google | Google