Was kommt nach Google? —
Trends bei Suchmaschinen
Winfried Neun
Zuse-Institut-Berlin
ÖMG-DMV Congress 2009 -- Graz
heute kein MathML?
MathML geht es gut. Man arbeitet auf die
Version 3 hin. Openmath 3.0 hinkt ein wenig
hinterher.
Aber : In den letzten Monaten gibt es staendig
Neuigkeiten ueber Suchmaschinen, positive
und auch negative. Die Nachrichten stossen
auch ausserhalb der Community auf
Interesse (Spiegel,Focus, Tageszeitungen)
Was ist los?
Die Kandidaten
Google
Bing (neu)
Wolfram|Alpha (neu)
Tendenzen

Suchmaschinen verdienen viel (Werbe-)Geld
und werden ihrerseits heftig beworben.

Es werden enorme Mittel in den Aufbau von
Suchmaschinen gesteckt. “Berge” von
Rechnern. (Stromverbrauch!)

Genaues wie immer: Company Private..
Tendenzen II

Bsp: “ Berlin to Graz”

Auffinden spezifischer (auch wissenschaftlicher) Information, nicht nur Millionen von
Links

Neu: Aufbau von WebSeiten mit (wissenschaftlicher) Information aus freien Texten.
Math-Net project

Collecting information about mathematics
worldwide (e.g. Institutions, People ,
Publications...)

Provide high quality information and search
facilities to the working mathematician.

A community effort under the aegis of the
IMU
Google



Der Pionier erwirbt ein Imperium
Suche “Google kauft” in Google (wo sonst?”)
droht ein Monopol beim Zugang zu Wissen?
-> SuMa e.V
problematisches Verhaeltniss zum Copyright
siehe Digitalisierungsprojekt von Literatur
Google





“Marktfuehrer” (ca. 80 %) nicht nur bei
Suchmaschinen
Hohe Diversifikation (Maps, Pictures, Earth
Streets, Books
Google Chrome (Browser nur Windows)
eigenes OS (Linux -artig)
Page Rank, vgl. Langville/Meyer:
Google's PageRank and Beyond, Princeton
UP
PageRank
(Definition von L. Page and S. Brin)
We assume page A has pages T1...Tn which point to it (i.e., are
citations). The parameter d is a damping factor which can be set
between 0 and 1. We usually set d to 0.85. There are more
details about d in the next section. Also C(A) is defined as the
number of links going out of page A. The PageRank of a page A
is given as follows:
pr(A) = (1 – d) + d
pr(T1)
( C(T )
1
+
…
+
pr(Tn)
C(Tn)
http://infolab.stanford.edu/backgrub/google.html
HITS algorithm
• Ausserdem gibt es den HITS Algorithmus von
Jon Kleinberg (Cornell U), etwa so alt wie Page
Rank.
• Grundlage der Suchmaschine Teoma. (??)
Bing



Microsofts Nachfolger von Live Search.
Im Juni 2009 freigegeben, noch keine
vollstaendige deutsche Version erhaeltlich.
“Bing is a search engine that finds and
organizes the answers you need so you can
make faster, more informed decisions.
Hoffnung auf Synergien,z.B. mit Wolfram
oder Shopping Portalen
Bing II




Derzeit spezialisiert auf Bilder und Videos,
Shopping. “Modernes Design”
Soll gut die lokalen Beduerfnisse befriedigen.
“Dining in NYC”
Wird ueber den Internet Explorer gepusht als
Suchmaschine
Erfolg nicht garantiert (siehe Live Search)
Wolfram|Alpha
ist eigentlich keine Suchmashine, sondern eine
Antwortmaschine.Bsp “x = e** x”
basiert auf Mathematica fuer Berechnungen,
ist daher auch als Mma Server benutzbar.
Derzeit 5 Mio lines of Mma code
Die Anfrage muss analysiert werden und das
Feld bestimmt werden (Bsp Pi - e)
Wolfram|Alpha II
Es muss immenses Fachwissen akkumuliert
werden und die linguistische Analyse muss
verfeinert werden und auf viele Sprachen
ausgedehnt. Bsp “Pi is rational”
Geruechte:
Ein API ist geplant, damit man die Webseite
vermeiden kann.
Zusammenarbeit mit Bing.
Wolfram|AlphaIII
Eigendarstellung:
Wolfram|Alpha's long-term goal is to make all systematic
knowledge immediately computable and accessible to
everyone. We aim to collect and curate all objective data;
implement every known model,
Wolfram|Alpha is an ambitious, long-term intellectual endeavor
that we intend will deliver increasing capabilities over the
years and decades to come. With a world-class team and
participation from top outside experts in countless fields, our
goal is to create something that will stand as a major
milestone of 21st century intellectual achievement.
Bei der Praesentation im
September 2009 wurden
folgende Webseites aufgerufen
www.google.com, www.bing.com and
www.wolframalpha.com
mit folgenden Eingaben
z = e**z , pi -e, Berlin to Graz,
clebschgordan({a,1/2},{1/2,1/2},{1,1})
Die Resultate koennen bei spaeteren
Wiederholungen natuerlich abweichen.
Danke fuer die Aufmerksamkeit!


Focus sagt “Es wird spannend!”
Wird es spannend oder funktionieren die
alten Mechanismen weiterhin?

Der Markt wird es richten.
linguistisc
linguistisc

Was kommt nach Google? — Trends bei Suchmaschinen