Das Google Zeitalter
Von der Suchmaschine zur
künstlichen Intelligenz
Professor Dr. Eduard Heindl
Themen





Woher kommt Google
Wie arbeitet Google
Was ist an Google einmalig
Warum ist Google so mächtig
Wohin geht Google
Eduard Heindl, FH-Furtwangen
Googlesteinzeit
 1995 treffen sich
Sergey Brin (23) und
Larry Page (24)
 1996 BackRub
System an der
Stanford University
 100.000$ von
Andy Bechtolsheim
 7. September 1998
Start Google Inc.
*September 21, 1999, the beta label came off the website.
Eduard Heindl, FH-Furtwangen
Firmenphilosophie
perfect search engine
defined by co-founder Larry Page
as something that:
"understands exactly what you mean
and gives you back exactly what you
want."
Eduard Heindl, FH-Furtwangen
Live of a Query
Quelle: http://www.google.com/corporate/query.html
Eduard Heindl, FH-Furtwangen
Der PageRank
 Google sortiert nach
PageRank
 Je mehr Links auf ein
Dokument deuten, um so
besser
 Algorithmus berücksichtigt
aber auch den PageRank
der Verweisseiten
 Rekursives Problem
 „solving an equation of
more than 500 million
variables and 2 billion
terms“ (laut Google)
Eduard Heindl, FH-Furtwangen
A
E
D
H
I
L
C
B
K
M
G
F
Link
O
N
Die Linkmatrix
A
B
C
D
E
F
G
H
I
K
L
M N
O
A
0
0
0
0
0
0
0
1
0
0
0
0
0
0
B
0
0
0
0
0
0
0
0
0
0
0
0
0
0
C
0
0
0
0
1
0
0
0
0
0
0
0
0
0
D
0
0
0
0
0
0
0
0
0
0
0
0
0
0
E
0
0
0
0
0
1
0
0
0
0
0
0
0
0
F
0
0
0
0
1
0
0
0
0
0
0
0
0
1
G
0
0
0
0
0
0
0
0
0
0
0
0
0
0
H
0
2
0
0
0
0
0
0
0
1
0
0
0
0
I
0
0
0
1
0
0
0
1
0
1
0
0
0
0
K
0
0
0
0
0
0
0
0
0
0
0
1
0
0
L
0
0
0
0
0
0
0
0
1
0
0
0
0
0
M 0
0
0
0
0
0
0
1
0
0
1
0
0
0
N
0
0
0
0
0
0
1
0
0
0
0
1
0
0
O
0
0
0
0
0
0
0
0
0
0
0
0
1
0
Eduard Heindl, FH-Furtwangen
A
E
D
H
I
L
C
B
K
M
G
F
Link
O
N
Was ist Intelligenz
 Wissen wo was wichtiges steht
 Google's technology uses the collective
intelligence of the web to determine a
page's importance1
 There is no human involvement or
manipulation of results1
 'The ultimate search engine would be
smart; it would understand everything in
the world,' says Page.2
[1] http://www.google.com/corporate/tech.html
[2] http://www.aaai.org/AITopics/assets/AIalerts/alert.12.18.02.html
Eduard Heindl, FH-Furtwangen
Besonderheiten an Google
Eduard Heindl, FH-Furtwangen
Domainnamen unter den Top 5oo












Yahoo
Go
Goo
Gooooal
Cool
Room
Moon
Wanadoo
Football
Book
Cartoon
OO Objekt Orientiert
http://www.alexa.com/site/ds/top_500
Eduard Heindl, FH-Furtwangen










Goodday tool
School
Choose
Look
Kategorie
Gold
Gov
Pogo
Bingo
God
 Google
 Googelb?
Die größte Maschine
 Das Rechenzentrum von Google hat 100.000
Rechenknoten mit 6 PetaByte Festplattenspeicher
(Größte Rechnerkapazität der Welt)*
 Google hat „alle“ Dokumente des Webs gespiegelt
>30 Terabyte
 4.285.199.774 Dokumente, warum?
 232=4.294.967.296 Aktuelles Limit für Longinteger!
 >1.000 Anfragen pro Sekunde
 Erstmals ist ein Firmennamen zu einem Verb
geworden „googeln“
Anmerkung: ein PetaByte = 250 Byte = 1024 TeraByte
* John Markoff in der NYT vom 13. April 2003
Eduard Heindl, FH-Furtwangen
Forschung
 Ungewöhnlich
schnelles Wachstum
bei den R&D
Ausgaben!
 Über 100 Ph.D.´s
bei Google,
„industry's most
unorthodox
portfolio of human
capital “*
*NYT, June 6, 2004
Eduard Heindl, FH-Furtwangen
Zeitgeist
 Google kennt die
Trends
 Aufgelöst nach
Länder
 Aufgelöst nach
Themen
 Statistisch
aussagekräftig?
www.google.com/press/zeitgeist.html
Eduard Heindl, FH-Furtwangen
Google News
 Ein Roboter der Zeitung liest und schreibt



Google News sortiert
aus über 2400 Quellen
wichtige Meldungen in
die einzelnen Rubriken
Zusätzlich können zu
Suchbegriffen News
Meldungen abgefragt
werden
Zweiter Platz hinter
Washington Post im
Online Journalismus
EPpy Award
Eduard Heindl, FH-Furtwangen
Noch ist der Roboter nicht perfekt
 Autofahren, Autorennen und schwere
Verletzungen liegen nahe zusammen
Eduard Heindl, FH-Furtwangen
Der kleine Unterschied
 Technik und Techno
Eduard Heindl, FH-Furtwangen
Google Ads
 Werbung leicht gemacht
 Jeder kann zu beliebigen Worten
Textanzeigen schalten
 Bezahlt wird nur wenn jemand klickt
 Selten geklickte Worte werden
entfernt
 Gute Anzeigen werden öfter
eingeblendet
Eduard Heindl, FH-Furtwangen
Gute Texte schlechte Texte
 Auf diese Anzeige
haben 1,2% der
Nutzer geklickt!
 Auf diese 50%
mehr! (1,9%)
 Werbung
optimieren zum
Preis einer Pizza
Eduard Heindl, FH-Furtwangen
Noch ein Beispiel
 Welche Anzeige hat
mehr Besucher?
 0,7%
 2,8%
 Die Daten sind
hochsignifikant, da
3000 mal geklickt
wurde
Eduard Heindl, FH-Furtwangen
Google Adsense
 Geldverdienen leicht
gemacht
 Bezahlung nach
Klicks
 Einnahmen bis zu
XX€1 pro tausend
Besucher
 Einblendung ist
kontextsensitiv
 Wesentlich höhere
Klickrate als bei
klassischer
Bannerwerbung
[1]Google untersagt seinen Content-Partnern die Einnahmen offen zu legen
Eduard Heindl, FH-Furtwangen
Und so lautet der
Beschluß
Daß die
Maschine
etwas lernen muß
Eduard Heindl, FH-Furtwangen
Der Lernvorgang
 Lernen bedeutet Ergebnisse liefern
und diese verbessern
WWW
Eduard Heindl, FH-Furtwangen
Suchmaschine
Nutzer
Suchmachinen Version 0.1
 Keywords vor 1995
 Fiz Karlsruhe
 Patentsuche
Suchmaschine
Content
Bib
liothekar
Eduard Heindl, FH-Furtwangen
Nutzer
Suchmaschinen I. Art
 Volltextsuche ~ 1995
 Lycos
 Altavista
WWW
Eduard Heindl, FH-Furtwangen
Suchmaschine
Nutzer
Suchmaschine II. Art
 Neue Algorithmen
 Linkstruktur
 Textcluster
WWW
Suchmaschine
Vorverarbeitung
Eduard Heindl, FH-Furtwangen
Nutzer
Suchmaschinen III. Art
 Textverständnis
 Rückkopplung
 Neuronale Algorithmen
Suchmaschine
WWW
lesen
IQ
verstehen
Eduard Heindl, FH-Furtwangen
Nutzer
Triebkräfte
Suchmaschine
liefert Link
Nutzer
Kommt wieder
zufrieden
Suchmaschinenoptimierer
Verbessert
Algorithmus
Nutzt Link
Neue
Suchmaschine
Webseite
Nutzt Link
Geht fremd
Bekommt
Werbeeinnahmen
Eduard Heindl, FH-Furtwangen
Nutzer
unzufrieden
Suchmaschinenoptimiert
Zyklus
Kluge
Nutzer
Verbessert
Algorithmus
Suchsystem
Bekommt
Werbeeinnahmen
Eduard Heindl, FH-Furtwangen
Content
Anbieter
Fragen
 Wie vollständig ist die Welt im
WWW repräsentiert?
 Fast alle Dokumente sind
Produkte menschlicher Ansichten
 Viel Dokumente sind, zumindest
in Fragmenten, Kopien
 Wahrheitsgehalt nur über Kontext
zu erschließen
WWW
 Es gibt keine vollständigere
digitale Wissensbasis
Eduard Heindl, FH-Furtwangen
Wissen im Internet
 Datenbestand ist mehrsprachig
 wenige Sprachen relevant, 50% englisch
 Daten sind hochgradig redundant
 Vorteil wenn Interpretation nötig
 Multimediadaten (Bilder, Filme)
 Erfordert komplexe Analyse
 Bild-Text Kopplung vorhanden
 Erlaubt lernen aus Bildern
Eduard Heindl, FH-Furtwangen
Fragen zum Lesen
 Einfaches Einlesen
lesen
 Problem: viele Seiten
haben unklare Strukturen
(Tabellen!)
 Problem: häufig
wechselnde Inhalte
 Datenbank sollte die
Link-Struktur des WWW
nutzen
Eduard Heindl, FH-Furtwangen
Frage nach Weltbild
verstehen
Eduard Heindl, FH-Furtwangen
 Wird ein Vorwissen
benötigt
 Kann das System aus
Nutzerverhalten lernen
 Spielt die Datenstruktur
eine Rolle
 Welche Algorithmen
lernen effizient
Was ist Intelligenz
IQ
Eduard Heindl, FH-Furtwangen
 Wissen für erfolgreiches
Handeln bereithalten
 Wissen verarbeiten
 Wissen richtig einsetzen
 Wissen durch
Information erweitern
 Neues Wissen
generieren
Schleifen I
Einstellen von
Dokumenten
durch Menschen
Menschen lesen
Dokumente
und erstellen
neue Dokumente
Menschen
fragen
Google
„Lesen“ der
Dokumente
durch Google
Eduard Heindl, FH-Furtwangen
Schleifen II
Einstellen von
Dokumenten
durch Google
Google liest
Dokumente
und erstellt
neue Dokumente
„Lesen“ der
Dokumente
durch Menschen
Google
frägt
Menschen
Eduard Heindl, FH-Furtwangen
Zukunft
1000 Touché ©Tom / Thomas Körner. Berlin 1998
Eduard Heindl, FH-Furtwangen
Die Googlemauer
Anbieter
Anzeigentunnel
Medien
Adwords
Eduard Heindl, FH-Furtwangen
Google
Adsense
Interessent
Effiziente Märkte
 Zwischen Informationen vermitteln
Anbieter
Kunde
Optimal vermitteln
Eduard Heindl, FH-Furtwangen
Strategisches Risiko
 Was passiert wenn:
Dunkelheit
 Google
ausfällt? im Internet!
 Hackerangriff
 Physischer Angriff
 Für manche Länder manipuliert wird
 Zensiert
 Ergebnisse vertauscht
 Verkauft wird (z.B. an Microsoft)
Eduard Heindl, FH-Furtwangen
Von der Steinzeit
 Zeitalter
Wenn zwischen der Hand des Menschen
und der zu behandelnden Materie ein
bestimmendes Material wirkt
Wenn zwischen dem Gehirn des Menschen und dem zu
findenden Wissen eine bestimmende Instanz steht?
Eduard Heindl, FH-Furtwangen
Google geht an die Börse
2.718.281.828 Aktien zu einem Preis von 0,01 $
DON’T BE EVIL
Don’t be evil. We believe strongly that in the long term, we will be
better served—as shareholders and in all other ways—by a
company that does good things for the world even if we forgo
some short term gains. This is an important aspect of our culture
and is broadly shared within the company.
Risks Related to Our Business and Industry
We face significant competition from Microsoft and Yahoo.
Eduard Heindl, FH-Furtwangen
Börsenwert von Google
 Abschätzungen (kurzfristig)
 200.000.000 Suchergebnisse täglich
 Wert pro Ergebnis 5ct
 Jährliche Einnahme $ 3,6 Mrd.
 Maximalwert (langfristig)
 500 Mio. Google Nutzer
 Täglich 5 min gespart = $ 1,0
 Jährliche Einnahmen = $ 182,5 Mrd.
Eduard Heindl, FH-Furtwangen
Zum Weiterlesen
 Dieser Vortrag: heindl.de/google







google.com/about.html
google.com/ads
google.com/adsense
labs.google.com
labs.google.com/papers.html
google.indicateur.com
searchenginewatch.com
The End
Eduard Heindl, FH-Furtwangen

Das Google Zeitalter ppt