committance AG | Web Intelligence

Datenhaltung und -auswertung

Web Intelligence zielt auf die systematische und automatisierte Identifikation relevanter Daten im World Wide Web sowie deren Auswertung zur Gewinnung neuer noch unbekannter Informationen ab. Verschiedene Ausprägungen zeigen, welche vielfältigen Szenarien dem Oberbegriff "Web Intelligence" zugeordnet werden können. Hierzu zählen insbesondere die Identifikation relevanter Daten aus Social Media (siehe Social Media Analytics), die Auswertung von Server-Logfiles zur Analyse des Besucherverhaltens ("Web Usage Mining") und auch die Analyse von öffentlich zugänglichen Daten und Strukturen im World Wide Web: Man spricht hierbei von "Web Content Mining" bzw. "Web Structure Mining" oder auch zusammenfassend vom "Web Information Retrieval".

Web Information Retrieval meistert hierbei die Aufgabe

potentiell relevante Daten im World Wide Web zu identifizieren,
die Daten zu bereinigen und maximal effizient zu indizieren,
die Daten - soweit sinnvoll - zu aggregieren und zu transformieren und
diese Datenbasis für Analysen bereit zu stellen.

Die weitere Analyse führt nun zurück zum Begriff der "(Web) Intelligence", da nur die Ableitung relevanter Informationen aus den gesammelten Daten heraus dazu führt, dass gewonnene Erkenntnisse Eingang in die unternehmerischen Prozesse (etwa im CRM, Marketing oder zur Strategieplanung) finden.

Die committance AG als unabhängige Unternehmensberatung betreibt bereits seit Jahren eine entsprechende Lösung, einen sogenannten Web-Crawler bzw. Scraper, welcher für unsere Kunden in regelmäßigen Intervallen die jeweils aktuellen Inhalte von mehreren Millionen deutschsprachiger Websites erfasst, persistiert und hinsichtlich vordefinierter Merkmale (bspw. in der Frage, ob eine Website gewerblich betrieben wird oder nicht) analysiert. Erweiterungen wie eine vollautomatisierte Extraktion von Impressumsdaten oder die Anreicherung um Daten aus dem Handelsregister erweitern die Einsatzzwecke der gewonnenen Daten deutlich.

Die Vielfalt der Fragestellungen, die durch diesen Prozess beantwortet werden können, ist nahezu unendlich:

Welche Websites werden gewerblich, privat oder durch einen Verein betrieben?
Welche Websites nutzen welche CMS, Shopsysteme, Plugins etc.?
Werden Social Media Plugins eingesetzt und wenn ja, welche?
Zu welcher Branche gehört eine Website?
Auf welchen Websites werden mein Unternehmen, meine Marke, meine Produkte genannt?
Wo werden möglicherweise Plagiate meiner Produkte eingesetzt?
Welche Websites sind von einer bestimmten Sicherheitslücke betroffen?
u. v. m.

Eine stetige Weiterentwicklung dieser Lösung adaptiert auch moderne Technologien zur Datenhaltung und -auswertung, um bspw. die Kundensegmentierungsprozesse unserer Kunden stets mit maximaler Effizienz und höchster Analysegüte anzureichern.

Als Betreiber dieser eigenentwickelten Crawler- und Analyselösung sorgt ein Höchstmaß an Flexiblität dafür, dass wir stets kurzfristig auf kundenindividuelle Wünsche reagieren können. Gerne ermitteln wir gemeinsam mit Ihnen in einem ersten unverbindlichen Gespräch, ob auch Sie von unserer Lösung oder unserem langjährigen Know-How im Web Information Retrieval profitieren können.