{"id":993,"date":"2014-05-19T11:11:12","date_gmt":"2014-05-19T09:11:12","guid":{"rendered":"http:\/\/wiegehtdasmitdemcloud.de\/?p=993"},"modified":"2016-01-12T17:28:51","modified_gmt":"2016-01-12T16:28:51","slug":"was-ist-eigentlich-dieses-hadoop-teil1","status":"publish","type":"post","link":"https:\/\/vrealize.it\/de\/2014\/05\/19\/was-ist-eigentlich-dieses-hadoop-teil1\/","title":{"rendered":"Was ist eigentlich dieses Hadoop? &#8211; Teil 1"},"content":{"rendered":"<p>In der IT-Branche gibt es momentan 3 dominierende Themen, die auf der Agenda eines jeden Unternehmens stehen und die nahezu in jeder Pr\u00e4sentation heutzutage eine Rolle spielen oder zumindest referenziert werden:<\/p>\n<ul>\n<li>Social\/Mobile<\/li>\n<li>Cloud Computing<\/li>\n<li>Big Data<\/li>\n<\/ul>\n<p>Dieser Artikel besch\u00e4ftigt sich mit Hadoop, einem der Schlagworte, dass eigentlich immer im Zusammenhang mit Big Data genannt wird und derzeit eine regelrechte Euphorie ausl\u00f6st.<!--more--><\/p>\n<p>Um Hadoop zu verstehen, empfiehlt es sich auf die IT-Vergangenheit der letzten 20 Jahre zu schauen:<\/p>\n<p>Im Jahr <strong>1995<\/strong> gab es eine Reihe von Programmen, die helfen sollten, Informationen im schnellwachsenden Internet zu indizieren und durchsuchbar zu machen: AltaVista, Lycos, Fireball, Infoseek, eXcite und Webcrawler waren sog. Suchmaschinen. Jedes dieser Unternehmen erzielte beachtliche Erfolge im schnellwachsenden Internet und war zu seiner\u00a0Zeit unbestrittener Marktf\u00fchrer.<\/p>\n<p>Heutzutage sind viele dieser damals erfolgreichen\u00a0Marken entweder verschwunden, wurden \u00fcbernommen oder sind nur noch in Marktnischen des Internets erfolgreich und vertreten.<\/p>\n<p>Wie kam es aber dazu? Warum sind die vielen einstigen Pioniere des heutigen Internets verschwunden oder nahezu bedeutungslos?<\/p>\n<p>Die Antwort auf die Frage gibt das Jahr <strong>2000<\/strong>, in dem eine neue Suchmaschine die Spielwiese des Internets betrat: Google.<\/p>\n<p>Aus heutiger Sicht ist Google aus dem Internet nicht mehr wegzudenken &#8211; wie aber kam es dazu?<\/p>\n<p>Der Erfolg von Google war die Qualit\u00e4t der Suchergebnisse (Google PageRank), die Schnelligkeit der Suche und das wahnsinnig schnelle Indizieren neuer Inhalte.<\/p>\n<p>Google ging hierbei komplett neue Wege; man beschloss das gesamte Internet als Kopie im eigenen Rechenzentrum vorzuhalten und alle Daten des Internets zu analysieren. Schnell wurde offensichtlich, dass eine derartige Massenspeicherung von Daten mit einer traditionellen Architektur (Relationale Datenbanken, Enterprise-Storage, Enterprise-Server) aus Kosten- und Technologiegr\u00fcnden nicht umsetzbar war und man erfand zwei revolution\u00e4re, neue Ans\u00e4tze:<\/p>\n<ul>\n<li>Das Google File System (GFS)<\/li>\n<li>Google MapReduce<\/li>\n<\/ul>\n<p>Das Google File System ist in der Lage riesige Datenmengen auf Clustern von Commodity-Hardware (LowCost) zu speichern und Hardware-Fehler zu tolerieren.<\/p>\n<p>Um diese riesigen Datenmengen berechnen und auswerten zu k\u00f6nnen, erfand Google den Alghoritmus MapReduce, der im Gegensatz zu bisherigen Methoden, entwickelt wurde einen Nutzen aus den verteilten Dateien auf dem Google File System zu ziehen.<\/p>\n<p>Im Wesentlichen vereinfacht MapReduce die Programmierung von distribuierten Systemen, in dem es die Rechenoperationen (Compute) zu den Daten schickt; jedes System im Filesystem-Cluster berechnet gleichzeitig einen Teilbereich der Gesamtdaten (Map) und die Ergebnisse werden am Ende aufsummiert auf Basis von Key-Value-Paaren (Reduce).<\/p>\n<p>Google ver\u00f6ffentliche entsprechende Papiere \u00fcber das Design von GFS und MapReduce in 2003 und 2004: daraus wurde das Apache-Projekt Hadoop geboren, das im Grundsatz ebenfalls aus 2 Komponenten besteht:<\/p>\n<ul>\n<li>Distribuiertes Filesystem: Hadoop Distributed Filesystem (HDFS)<\/li>\n<li>MapReduce: Hadoop MapReduce<\/li>\n<\/ul>\n<p>Ist Hadoop ein Produkt?<\/p>\n<ul>\n<li>Hadoop ist ein \u00d6kosystem von Software-Projekten<\/li>\n<li>Hadoop basiert auf Konzepten von Google<\/li>\n<li>Hadoop ist ein gro\u00dfer \u201cComputer\u201d, der Daten verarbeitet<\/li>\n<li>Hadoop ist ein Data-OS<\/li>\n<li>Hadoop ist ein verteiltes Dateisystem<\/li>\n<li>Hadoop nutzt Commodity-Hardware<\/li>\n<\/ul>\n<p>Hadoop ist KEIN Produkt.<\/p>\n<p>Im n\u00e4chsten Teil dieser Reihe wird Hadoop spezifischer erkl\u00e4rt und es wird beschrieben wie Hadoop und das damit verbundene \u00d6kosystem f\u00fcr Unternehmen hilfreich sein kann.<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>In der IT-Branche gibt es momentan 3 dominierende Themen, die auf der Agenda eines jeden Unternehmens stehen und die nahezu in jeder Pr\u00e4sentation heutzutage eine Rolle spielen oder zumindest referenziert werden: Social\/Mobile Cloud Computing Big Data Dieser Artikel besch\u00e4ftigt sich mit Hadoop, einem der Schlagworte, dass eigentlich immer im Zusammenhang mit Big Data genannt wird\u2026 <span class=\"read-more\"><a href=\"https:\/\/vrealize.it\/de\/2014\/05\/19\/was-ist-eigentlich-dieses-hadoop-teil1\/\">Weiterlesen &raquo;<\/a><\/span><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_exactmetrics_skip_tracking":false,"_exactmetrics_sitenote_active":false,"_exactmetrics_sitenote_note":"","_exactmetrics_sitenote_category":0,"footnotes":""},"categories":[11],"tags":[],"class_list":["post-993","post","type-post","status-publish","format-standard","hentry","category-unkategorisiert"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.4 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Was ist eigentlich dieses Hadoop? - Teil 1 &#187; vrealize.it - TechBlog VMware SDDC<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/vrealize.it\/de\/2014\/05\/19\/was-ist-eigentlich-dieses-hadoop-teil1\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Was ist eigentlich dieses Hadoop? - Teil 1 &#187; vrealize.it - TechBlog VMware SDDC\" \/>\n<meta property=\"og:description\" content=\"In der IT-Branche gibt es momentan 3 dominierende Themen, die auf der Agenda eines jeden Unternehmens stehen und die nahezu in jeder Pr\u00e4sentation heutzutage eine Rolle spielen oder zumindest referenziert werden: Social\/Mobile Cloud Computing Big Data Dieser Artikel besch\u00e4ftigt sich mit Hadoop, einem der Schlagworte, dass eigentlich immer im Zusammenhang mit Big Data genannt wird\u2026 Weiterlesen &raquo;\" \/>\n<meta property=\"og:url\" content=\"https:\/\/vrealize.it\/de\/2014\/05\/19\/was-ist-eigentlich-dieses-hadoop-teil1\/\" \/>\n<meta property=\"og:site_name\" content=\"vrealize.it - TechBlog VMware SDDC\" \/>\n<meta property=\"article:published_time\" content=\"2014-05-19T09:11:12+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2016-01-12T16:28:51+00:00\" \/>\n<meta name=\"author\" content=\"admin\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"admin\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"2\u00a0Minuten\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/vrealize.it\\\/de\\\/2014\\\/05\\\/19\\\/was-ist-eigentlich-dieses-hadoop-teil1\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/vrealize.it\\\/de\\\/2014\\\/05\\\/19\\\/was-ist-eigentlich-dieses-hadoop-teil1\\\/\"},\"author\":{\"name\":\"admin\",\"@id\":\"https:\\\/\\\/vrealize.it\\\/de\\\/#\\\/schema\\\/person\\\/82e6ae52e830379f87709f472bb0d99e\"},\"headline\":\"Was ist eigentlich dieses Hadoop? &#8211; Teil 1\",\"datePublished\":\"2014-05-19T09:11:12+00:00\",\"dateModified\":\"2016-01-12T16:28:51+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/vrealize.it\\\/de\\\/2014\\\/05\\\/19\\\/was-ist-eigentlich-dieses-hadoop-teil1\\\/\"},\"wordCount\":506,\"commentCount\":0,\"articleSection\":[\"Unkategorisiert\"],\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\\\/\\\/vrealize.it\\\/de\\\/2014\\\/05\\\/19\\\/was-ist-eigentlich-dieses-hadoop-teil1\\\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/vrealize.it\\\/de\\\/2014\\\/05\\\/19\\\/was-ist-eigentlich-dieses-hadoop-teil1\\\/\",\"url\":\"https:\\\/\\\/vrealize.it\\\/de\\\/2014\\\/05\\\/19\\\/was-ist-eigentlich-dieses-hadoop-teil1\\\/\",\"name\":\"Was ist eigentlich dieses Hadoop? - Teil 1 &#187; vrealize.it - TechBlog VMware SDDC\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/vrealize.it\\\/de\\\/#website\"},\"datePublished\":\"2014-05-19T09:11:12+00:00\",\"dateModified\":\"2016-01-12T16:28:51+00:00\",\"author\":{\"@id\":\"https:\\\/\\\/vrealize.it\\\/de\\\/#\\\/schema\\\/person\\\/82e6ae52e830379f87709f472bb0d99e\"},\"breadcrumb\":{\"@id\":\"https:\\\/\\\/vrealize.it\\\/de\\\/2014\\\/05\\\/19\\\/was-ist-eigentlich-dieses-hadoop-teil1\\\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/vrealize.it\\\/de\\\/2014\\\/05\\\/19\\\/was-ist-eigentlich-dieses-hadoop-teil1\\\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/vrealize.it\\\/de\\\/2014\\\/05\\\/19\\\/was-ist-eigentlich-dieses-hadoop-teil1\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Startseite\",\"item\":\"https:\\\/\\\/vrealize.it\\\/de\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Was ist eigentlich dieses Hadoop? &#8211; Teil 1\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/vrealize.it\\\/de\\\/#website\",\"url\":\"https:\\\/\\\/vrealize.it\\\/de\\\/\",\"name\":\"vrealize.it - TechBlog VMware SDDC\",\"description\":\"Information zu sicherem Hybrid und Multi-Cloud Computing - dispruptive Technologien im IT- Umfeld\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/vrealize.it\\\/de\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"de\"},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/vrealize.it\\\/de\\\/#\\\/schema\\\/person\\\/82e6ae52e830379f87709f472bb0d99e\",\"name\":\"admin\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/c496960fb41f514bddb6eead79f0ba339bab37246d1ab3ceb01f8ac94221e5b0?s=96&d=mm&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/c496960fb41f514bddb6eead79f0ba339bab37246d1ab3ceb01f8ac94221e5b0?s=96&d=mm&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/c496960fb41f514bddb6eead79f0ba339bab37246d1ab3ceb01f8ac94221e5b0?s=96&d=mm&r=g\",\"caption\":\"admin\"},\"url\":\"https:\\\/\\\/vrealize.it\\\/de\\\/author\\\/admin\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Was ist eigentlich dieses Hadoop? - Teil 1 &#187; vrealize.it - TechBlog VMware SDDC","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/vrealize.it\/de\/2014\/05\/19\/was-ist-eigentlich-dieses-hadoop-teil1\/","og_locale":"de_DE","og_type":"article","og_title":"Was ist eigentlich dieses Hadoop? - Teil 1 &#187; vrealize.it - TechBlog VMware SDDC","og_description":"In der IT-Branche gibt es momentan 3 dominierende Themen, die auf der Agenda eines jeden Unternehmens stehen und die nahezu in jeder Pr\u00e4sentation heutzutage eine Rolle spielen oder zumindest referenziert werden: Social\/Mobile Cloud Computing Big Data Dieser Artikel besch\u00e4ftigt sich mit Hadoop, einem der Schlagworte, dass eigentlich immer im Zusammenhang mit Big Data genannt wird\u2026 Weiterlesen &raquo;","og_url":"https:\/\/vrealize.it\/de\/2014\/05\/19\/was-ist-eigentlich-dieses-hadoop-teil1\/","og_site_name":"vrealize.it - TechBlog VMware SDDC","article_published_time":"2014-05-19T09:11:12+00:00","article_modified_time":"2016-01-12T16:28:51+00:00","author":"admin","twitter_card":"summary_large_image","twitter_misc":{"Verfasst von":"admin","Gesch\u00e4tzte Lesezeit":"2\u00a0Minuten"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/vrealize.it\/de\/2014\/05\/19\/was-ist-eigentlich-dieses-hadoop-teil1\/#article","isPartOf":{"@id":"https:\/\/vrealize.it\/de\/2014\/05\/19\/was-ist-eigentlich-dieses-hadoop-teil1\/"},"author":{"name":"admin","@id":"https:\/\/vrealize.it\/de\/#\/schema\/person\/82e6ae52e830379f87709f472bb0d99e"},"headline":"Was ist eigentlich dieses Hadoop? &#8211; Teil 1","datePublished":"2014-05-19T09:11:12+00:00","dateModified":"2016-01-12T16:28:51+00:00","mainEntityOfPage":{"@id":"https:\/\/vrealize.it\/de\/2014\/05\/19\/was-ist-eigentlich-dieses-hadoop-teil1\/"},"wordCount":506,"commentCount":0,"articleSection":["Unkategorisiert"],"inLanguage":"de","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/vrealize.it\/de\/2014\/05\/19\/was-ist-eigentlich-dieses-hadoop-teil1\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/vrealize.it\/de\/2014\/05\/19\/was-ist-eigentlich-dieses-hadoop-teil1\/","url":"https:\/\/vrealize.it\/de\/2014\/05\/19\/was-ist-eigentlich-dieses-hadoop-teil1\/","name":"Was ist eigentlich dieses Hadoop? - Teil 1 &#187; vrealize.it - TechBlog VMware SDDC","isPartOf":{"@id":"https:\/\/vrealize.it\/de\/#website"},"datePublished":"2014-05-19T09:11:12+00:00","dateModified":"2016-01-12T16:28:51+00:00","author":{"@id":"https:\/\/vrealize.it\/de\/#\/schema\/person\/82e6ae52e830379f87709f472bb0d99e"},"breadcrumb":{"@id":"https:\/\/vrealize.it\/de\/2014\/05\/19\/was-ist-eigentlich-dieses-hadoop-teil1\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/vrealize.it\/de\/2014\/05\/19\/was-ist-eigentlich-dieses-hadoop-teil1\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/vrealize.it\/de\/2014\/05\/19\/was-ist-eigentlich-dieses-hadoop-teil1\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Startseite","item":"https:\/\/vrealize.it\/de\/"},{"@type":"ListItem","position":2,"name":"Was ist eigentlich dieses Hadoop? &#8211; Teil 1"}]},{"@type":"WebSite","@id":"https:\/\/vrealize.it\/de\/#website","url":"https:\/\/vrealize.it\/de\/","name":"vrealize.it - TechBlog VMware SDDC","description":"Information zu sicherem Hybrid und Multi-Cloud Computing - dispruptive Technologien im IT- Umfeld","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/vrealize.it\/de\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"de"},{"@type":"Person","@id":"https:\/\/vrealize.it\/de\/#\/schema\/person\/82e6ae52e830379f87709f472bb0d99e","name":"admin","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/secure.gravatar.com\/avatar\/c496960fb41f514bddb6eead79f0ba339bab37246d1ab3ceb01f8ac94221e5b0?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/c496960fb41f514bddb6eead79f0ba339bab37246d1ab3ceb01f8ac94221e5b0?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/c496960fb41f514bddb6eead79f0ba339bab37246d1ab3ceb01f8ac94221e5b0?s=96&d=mm&r=g","caption":"admin"},"url":"https:\/\/vrealize.it\/de\/author\/admin\/"}]}},"_links":{"self":[{"href":"https:\/\/vrealize.it\/de\/wp-json\/wp\/v2\/posts\/993","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/vrealize.it\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/vrealize.it\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/vrealize.it\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/vrealize.it\/de\/wp-json\/wp\/v2\/comments?post=993"}],"version-history":[{"count":6,"href":"https:\/\/vrealize.it\/de\/wp-json\/wp\/v2\/posts\/993\/revisions"}],"predecessor-version":[{"id":1032,"href":"https:\/\/vrealize.it\/de\/wp-json\/wp\/v2\/posts\/993\/revisions\/1032"}],"wp:attachment":[{"href":"https:\/\/vrealize.it\/de\/wp-json\/wp\/v2\/media?parent=993"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/vrealize.it\/de\/wp-json\/wp\/v2\/categories?post=993"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/vrealize.it\/de\/wp-json\/wp\/v2\/tags?post=993"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}