MissingLinks' Blog Das sagenhafte Blog von MissingLinks

10Okt/093

Beyond Google – Die hohe Kunst der Internet-Recherche

Informationen validieren - Reputationen überprüfen


Internet-Recherche_336782_R_by_Bernd-Boscolo_pixelio_deWie kann ich Informationen im Internet validieren bzw. die allgemeine Meinungstendenz zu einem Thema im Internet herausfinden? Oder wie steht es um die Reputation eines potentiellen Auftragnehmers?

Die Anwendungsmöglichkeiten sind vielfältig. Zwei Fragen die mich aus gegebenem Anlass besonders interessieren:

  1. Soll ich ein bestimmtes Produkt oder eine Dienstleistung kaufen?
  2. Wohin tendiert die öffentliche Meinung zu einem umstrittenen Thema?

Eine weiteres interessantes und vor allem sensibles Feld ist, vor allem bei einem ständigen Anstieg der Nutzerzahlen, z.B. die Glaubwürdigkeit von Gesundheitsinformationen im Internet.

Mittlerweile stehen im Internet so unglaublich viele Informationen zur Verfügung, dass daraus, vorausgesetzt diese werden in der entprechenden Art und Weise ausgewertet und aufbereitet, eine Art "Neue Weisheit der Vielen" extrahiert werden können sollte. (Vgl. Semantisches Web).

Viele haben wahrscheinlich schon einmal von WoframAlpha gehört, einem Projekt, welches es sich im Prinzip zur Aufgabe gemacht hat, dass Wissen der Welt berechenbar zu machen. Wenn der Plan funktioniert - und so scheint es zu sein - wird WolframAlpha eines Tages also eine Art Antwortmaschine sein. Bisher ist WolframAlpha allerdings leider erst ausschließlich auf englische Sprache ausgelegt.

Vor einiger Zeit habe ich mal einen Artikel gelesen, in welchem eine Software vorgestellt wurde, welche es ermöglichen soll bestimmte Artikel zu einem Thema hinsichtlich deren Aussage mit anderen themenverwandten Artikeln im Internet zu vergleichen und die Gemeinsamkeiten sowie auch die Unterschiede komfortabel darzustellen. So könnte schließlich eine Information annähernd validiert und eine Frage leichter, besser und schneller beantwortet werden.

Was auch immer mich damals geritten hat, diesen Artikel entgegen meiner Gewohnheit nicht zu bookmarken - ich finde ihn nicht wieder! Im Rahmen meiner Suche nach dieser Software bin ich über eine Reihe interessanter Dokumente und Websites gestolpert, die thematisch um die Themen Suchmaschinen, Internet-Recherche und Informationsverarbeitung kreisen und welche ich Ihnen - dem interessierten Leser - nicht vorenthalten möchte.

Die Top 100 alternativen Suchmaschinen

Die meisten Wissen, dass Google seit verhältnismäßig geraumer Zeit den Suchmaschinenmarkt mit Abstand domiert. Doch wer dort sucht wo alle suchen, wird auch nur das finden was alle finden! Kein Zweifel, Google ist nicht zuletzt auf Grund der hervorragenden Qualität seiner Suchergebnisse so erfolgreich. Bei einer intensiven Internet-Recherche kann es aber nicht schaden auch mal andere "Quellen" anzuzapfen. [Engl.]

Web-Information-Retrieval.de

Website von Prof. Dr. Joachim Griesbaum, Juniorprofessor für Informationswissenschaft an der Universität Hildesheim mit den Forschungsschwerpunkten Information Retrieval, Suchmaschinenmarketing, Soziale Software und E-Learning. Das Angebot umfasst u.a. einen Webkatalog zu den Themen Internetsuchdienste, Suchmaschinenmarketing und Internetrecherche.

SPRINT - Schweizer Portal für die Recherche im Internet

SPRINT bietet nach eigenen Angaben "einen Einstieg in das Gebiet der Internetsuchdienste. Neben theoretischen Grundlagen werden auch praktische Tipps für eine effiziente und effektive Recherche gegeben."

Wikipedias kleiner Bruder

Kritischer Beitrag über das Projekt Wissen.Spiegel.de, bei welchem zu einem Suchbegriff gleichzeitig Informationen aus einem Lexikon, der freien Wissensdatenbank Wikipedia, von Spiegel-Online, dem Manager-Magazin sowie des Statistik-Anbieters Statista ausgegeben werden.

Validierung wissenschaftlicher Informationen aus dem Internet

PDF-Dokument von Dr. Claudia Arnold zum Thema Validierung von (wissenschaftlichen) Informationen aus dem Internet. Leider sind für die Website des dort auf der ersten Seite genannte Projektes namens GERHARD (German Harvest Automated Retrieval and Directory, www.gerhard.de) - ich vermutete schon das Ziel meiner Suche - keine Inhalte mehr hinterlegt. Eine Google-Suche brachte dann folgendes Ergebnis: Projekt: GERHARD - Nachweissystem für deutsche Internetressourcen. Offenbar bereits im Jahr 2000 abgeschlossen (und eingestellt?). (Erscheinungsjahr der Publikation bis auf Weiteres unbekannt). (PDF;1,61 MB) (Update: Siehe Kommentar)

Schlüsselfaktoren für glaubwürdige Gesundheitsinformationen: Web 2.0 oder Semantic Web?

Master Thesis im Rahmen des Universitätslehrganges "Professional MSc in Informationstechnologien im Gesundheitswesen" von Johann Kalhs (2007) zum Thema valide Gesundheitsinformationen aus dem Internet. (PDF; 953 kB)

Personas

Ein kritisches Kunstprojekt zur Berechenbarkeit von Informationen. Geben Sie Ihren Namen ein, beobachten Sie quasi live wie damit in Verbindung stehende Informationen im Web ausgewertet werden und erfreuen Sie sich schließlich an einer Grafik, welche die mit Ihrem Namen in Verbindung gebrachten Themen im Verhältnis Ihres Vorkommens im Web grafisch darstellt. Für "MissingLinks" sieht das aktuell dann so aus:
missinglinks-bei-personas-2009-10-07

SocialMention.com - Online Reputations-Monitoring

SocialMention is "Searching content from across the universe...". Hier können entweder Blogs, Microblogs, Bookmarks, Kommentare, Events, Bilder, News, Videos, Audiofiles, Fragen&Antworten oder alle Medien gleichzeitig nach der Reputation im Zusammenhang mit einem Suchbegriff gesucht werden. Unter anderem wird hier dargestellt, ob im Zusammenhang mit dem Suchbegriff gefundene Äußerungen eher positiver oder negativer Natur sind. Zudem gibt es einen Strenght-Faktor (Häufigkeit in der beispielsweise über eine Marke in den Sozialen Medien besprochen wird), einen Passion-Faktor, welcher angibt wie viele einzelne Personen sich wiederholt zu einer Marke (bzw. einem Begriff äußern) sowie einen Reach-Faktor, der die Reichweite des Einflusses eines Begriffs wiederspiegeln soll. (Standardmäßig arbeitet SocialMention auf Englisch, kann aber, nachdem man die erste Suche durchgeführt hat, über "Preferences" u.a. auch auf Deutsch umgestellt werden.)

Ähnlich arbieten wohl Anbieter wie

www.Management-Monitor.de *

mit Produkten wie dem Management-Monitor, einer "plattformunabhängigen, internetbasierten (...) Software, die es einem ermöglicht, Informationen aus verschiedenen IT-Systemen in einer Anwendung intelligent zusammenzuführen und Prognosen für die Zukunft zu erstellen."
Oder dem Webscanner zur "kontinuierlichen und systematischen Überprüfung des Meinungsbildes im Internet" sowie das Wettbewerbsradar, "das Stärken-/Schwächenprofil der Konkurrenzprodukte und die Änderungs-Aktivitäten der Wettbewerber auf den Websites oder auf speziellen Einzelseiten im Internet verfolgt" *

oder

www.massklusive.com - Social Media Monitoring *

Massklusive bietet ebenfalls eine Monitoring-Software an, welche filtert was und wie im Web über das eigene Unternehmen sowie auch über seine Mitbewerber gesprochen wird. Die Screenshots des Software auf der Website des Anbieters sehen auf jeden Fall relativ vielversprechend aus.

*Die enstprechenden Angebote dieser Anbieter scheinen darauf ausgelegt zu sein, ausschließlich die Online-Reputation von Unternehmen zu monitoren. Auf keiner der beiden Websites waren Preise zu finden. Es ist davon auszugehen, dass die Software browserbasiert arbeitet und man diese monatsweise mietet. Eine entsprechende Anfrage an beide Unternehmen ist gestellt. (Update: Wurde so bestätigt.)

Getreu dem Motto der Gedanke kommt beim Sprechen bzw. beim Schreiben, weiß ich jetzt auch genau was ich will:

  1. Ein Online-Reputations-Check-Tool, mit welchem ich in kurzer Zeit die Reputation eines Unternehmens, eines Produktes, einer Dienstleistung oder Person überprüfen kann.
  2. Ein Internet-Informations-Validierungs-Tool, welches Hinweise auf den Wahrheitsgehalt einer Information gibt und bestimmte Fragen zumindest tendenziell (auf Basis der Meinung der Vielen) beantworten kann.
  3. Ein Informationskanalisierungs-Tool, welches mir die stete Flut an Informationen zu einem Thema meines Interesses bündelt, so dass ich diese Übersichtlich und effizient "konsumieren" kann.

Was machen wir jetzt mit dieser Erkenntnis? Genau: Wir bauen uns eine oder mehrere SUPER-SUCHMASCHINEN! Da sich die Themen an dieser Stelle sehr stark konkretisieren, werde ich jeder der herausgearbeiteten Fragestellungen bei Gelegenheit einen eigenen Blogpost widmen. Interessante Beispiele dafür habe ich bereits gefunden.

Fest steht allerdings jetzt schon, die Möglichkeiten des grundlegenden Prinzips sind vielfältig. Das erfolgreiche Soziale Netzwerk Facebook misst einem Focus-Artikel zur Folge z.B. neuerdings die Bruttoinlandslaune.

Wir sind gespannt was da noch kommen mag.

PS: Wer sachdienliche Hinweise zur eingangs erwähnten Internet-Informations-Validierungs-Software hat, der wird ausdrücklich gebeten ein entsprechenden Kommentar zu hinterlassen oder mir eine E-Mail zu schreiben! Vielen Dank im Voraus.

Titelbild: © 2008 Bernd Boscolo / pixelio.de

Post to Twitter

Verwandte Artikel

Kommentare (3) Trackbacks (3)
  1. Vielen Dank, Sie machen mich auf den üblen Fehler aufmerksam, schlecht dokumentierte Informationen ins Internet einzustellen. Ich habe das zumindest für den von Ihnen zitierten Vortrag beseitigt.
    “GERHARD” war 2004 noch online, allerdings damals seit einiger Zeit nicht mehr ergänzt. Trotzdem schien es damals nicht so, als ob die Website bald verschwinden würde. Interessant erschien mir damals vor allem der dahinterstehende Prozess, der einen guten Teil Handarbeit (besser gesagt, subjektive Hirnarbeit) beinhaltete. Die Seiten wurden gesucht und dann von einem Mitarbeiter beurteilt, ehe sie Aufnahme in die Datenbank fanden. Es hieß ausdrücklich, dass man bisher noch keine Möglichkeit gefunden habe, diese Tätigkeit einem Algorithmus zu überlassen.

    Vielleicht kann eine automatisierte Validierung so funktionieren wie ein Spam-Filter: Nutzer füttern eine Datenbank mit Quellen, die sie für glaubwürdig halten, und das Plugin für eine Suchmaschine schickt die Resultate über diesen Proxy, wo sie dann, je nachdem, wie viele Nennungen eine bestimmte Webquelle erfahren hat, als mehr oder weniger glaubwürdig eingestuft werden. Natürlich ist das nicht völlig manipulationssicher und benachteiligt Nischenbereiche, weil dort wegen der geringeren allgemeinen Interesses weniger Bestätigungen hinterlegt werden. So würden z. B. Informationen über die Kartographie zu Wikingerzeiten a priori weniger Bestätigungen erhalten als solche über, sagen wir, Schuppenflechte, ohne deswegen weniger glaubwürdig zu sein.
    Beste Grüße, Claudia Arnold

  2. Zu Punkt 3, also dem Informationskanalisierungs-Tool, bin ich mittlerweile schon weiter. Auf http://news.seo101.de finden Sie einen Newsaggregator für den Bereich Suchmaschinenoptimierung, welcher sich aus über 100 Quellen speist. Noch befindet sich dieser allerdings in der Betaphase.

  3. Gerade gefunden: http://www.empolis.de/ – scheint sehr relevant für das Thema zu sein.


Kommentar schreiben