Wenn Du wirklich Wissen willst.
Dann lerne, was Daten und Informationen bedeuten.
Daten stehen in Beziehungen zueinander, sie bilden Formationen und durch Art der Betrachtung ergeben sich Informationen. Bsp.: Name Rocky. Hier sind zwei Daten(einheiten) in einer bestimmten Form(ation) miteinander verknüpft und so zusammen betrachtet bilden diese eine Information, nämlich das der "Name Rocky" ist. Beachtenswert ist, dass diese Form willkürlich festgelegt werden kann. Das menschliche Gehirn ist ein Meister darin, Daten in Formationen zu bringen und zu Informationen zu verarbeiten. Bsp.: Ein Glas ist zur Hälfte mit Wasser gefüllt. Die Art der Betrachtung legt nun fest, welche Information entsteht. Es kann die Information entstehen, dass das Glas halb voll ist, oder die Information, dass das Glas halb leer ist. Beide Informationen haben die gleiche Datengrundlage und sind plausibel!
Hat man eine Menge von Informationen (verstanden), nennt man diese Menge Wissen. Menschen, die sich dem "in Form bringen" von vielen Daten widmen, nennt man Wissenschaftler. Sie schaffen Wissen, in dem sie letztendlich viele Daten in eine (bestimmte) Form bringen, aufbewahren und verbreiten (wollen). Auf wenn.de finden Sie z.B. Wissen zu kaufmännischen oder gesundheitlichen Themen.Verbreitet werden Daten durch Menschen meist verpackt in Form von Informationen. Es sollte daher für den Empfänger immer die erste Regel sein, zu überprüfen, WER die Daten zu Informationen verpackt, d.h. verarbeitet hat, WARUM er diese Informationen genau so verarbeitet und in Umlauf bringt und verbreitet. Dann kann man darauf schließen, ob die Informationen die zu Grunde liegenden Daten wiedergeben oder nicht. Je nach Interesse (z.B. halb volles oder halb leeres Glas) kann man bei der Informationsbildung Daten weglassen, hinzufügen, verändert darstellten u.v.m., die Informationen müssen nicht die Daten wiederspiegeln. Und in vielen Fällen tun sie dies auch nicht (zu 100%). Über Methoden wie Reverse Engineering oder Hacking werden die auf den Informationen basierenden Daten wieder sichtbar.
Unternehmen und Organisationen, auch Staaten, tragen die Verantwortung, in und um ihrem Geschäftsbetrieb alle relevanten Daten zu berücksichtigen. Eine Berücksichtigung sämtlicher Daten erscheint zunächst utopisch und weniger für den laufenden Geschäftsbetrieb notwendig. Werden die Zusammenhänge dann aber klar, können Geschäftsprozesse effizienter gestaltet und die Zufriedenheit der Beteiligten gesteigert werden.
Zufriedenheit erzeugen und zu erhalten ist die Grundlage jeden Erfolges. Die richtigen Daten als Zutaten für den Erfolg zu kennen - wer will das nicht? Nur: Was sind die richtigen Daten? Welche Daten führen zum Erfolg? Wo kann man sie finden?» BIG DATA Analysen ergeben Theorie vom Sinn des Lebens
Data Mining sind Analyseverfahren, mit welchem sich aus sehr großen Datenmengen (Big Data) semi-automatisch Zusammenhänge, Abweichungen, Abhängigkeiten oder etwaige Datenmuster erkennen lassen. Anders gesagt extrahiert Data Mining bis dahin unerkanntes Wissen aus vorliegenden Datenbeständen.
Data Mining erfolgt durch statistische Methoden in Verbindung mit Datenbanksystemen. Im Unterschied zu klassischen Statistikverfahren werden mit Data Mining oft sehr große Gesamt- oder Teildatenbestände systematisch untersucht, was spezielle Anforderungen an die Performance der Data Mining Algorithmen stellt.
Dem Data Mining liegen folgende Annahmen zugrunde:
Die wichtigsten Aufgaben des Data Minings sind die folgenden:
Dabei werden verschiedene statistische Verfahren genutzt. Die Verfahren lassen sich in zwei verschiedene Kategorien einteilen, das überwachte und das unüberwachte Lernen.
Dem überwachten Lernen liegen bereits Trainingsbeispiele vor, für die eine richtige Klassifikation bekannt ist. Das Verfahren besteht dann aus zwei Schritten: Zunächst muss das lernende System anhand der Trainingsbeispiele eine Klassifikation erlernen und diese im zweiten Schritt auf die Gesamtmenge der Objekte anwenden.
Dem unüberwachten Lernen liegen noch keine Trainingsbeispiele vor und das System muss ohne Vorgaben neue Zusammenhänge innerhalb der Daten erlernen. Dafür stehen wiederum zwei unterschiedliche Ansätze zur Auswahl: Segmentierung und Assoziation. Bei der Segmentierung wird jeder Datensatz einem Segment zugeordnet. Bei der Assoziation werden Beziehungen bzw. Hypothesen für Beziehungen zwischen den Datensätzen hergestellt, mit deren Hilfe dann die Datensätze zugeordnet werden.
Phasen im Data Mining Prozess (nach CRISP-DM):
Maschinelles Lernen
Während das Data Mining häufig den Schwerpunkt auf die Musterkennung bei vergangenen und abgeschlossenen Geschäftsvorfällen legt, liegt der Schwerpunkt der Anwendung des maschinellen Lernens auf künftigen Geschäftsvorfällen im Sinne von Prognosen. In diesem Zusammenhang wird auch der Begriff Predictive Analytics verwendet. Streng genommen lassen sich die Verfahren zum maschinellen Lernen den Verfahren des Data Minings zuordnen. Andererseits wird in der Praxis und daher auch hier eine Unterscheidung zum Data Mining vorgenommen. Dies liegt daran, dass Data Mining in der Praxis häufig eher auf vergangenheitsbezogene Geschäftsvorfälle bezieht, währenddessen sich das maschinelle Lernen eher auf zukunftsbezogene Fragen konzentriert.
© 1998 - 2024
wENn.DE gut, Alles gut.
Datenschutz, Cookies, Analytics, Adsense
Impressum
Datenverarbeiter A. W e n d e
M a r k g r ö n i n g e r S t r. 1 9
7 1 6 3 4 Ludwigsburg
P h o n e: 0 7 1 4 1 1 4 5 9 0 3 7
M a i l: i n f o @ w e n n . d e