{"id":712,"date":"2025-11-02T10:22:14","date_gmt":"2025-11-02T09:22:14","guid":{"rendered":"https:\/\/jankiewicz.pl\/?p=712"},"modified":"2025-11-04T15:14:10","modified_gmt":"2025-11-04T14:14:10","slug":"apache-spark-z-wykorzystaniem-jezyka-python","status":"publish","type":"post","link":"https:\/\/jankiewicz.pl\/index.php\/apache-spark-z-wykorzystaniem-jezyka-python\/","title":{"rendered":"Apache Spark z wykorzystaniem j\u0119zyka Python"},"content":{"rendered":"\n<h2 class=\"wp-block-heading\"><span style=\"color: revert; font-size: revert; font-weight: revert;\">Harmonogram<\/span><\/h2>\n\n\n\n<h3 class=\"wp-block-heading\"><a href=\"#day1\" data-type=\"internal\" data-id=\"#day1\">Dzie\u0144 1<\/a><\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Spark &#8211; wprowadzenie<\/li>\n\n\n\n<li>Spark Core (RDD API)<\/li>\n\n\n\n<li>Spark SQL (DataFrame API)<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><a href=\"#day2\" data-type=\"internal\" data-id=\"#day2\">Dzie\u0144 2<\/a><\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Spark SQL<\/li>\n\n\n\n<li>Spark WebUI<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Wprowadzenie<\/h2>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"alignright size-large is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"852\" height=\"1024\" src=\"https:\/\/jankiewicz.pl\/wp-content\/uploads\/2023\/11\/image-852x1024.png\" alt=\"\" class=\"wp-image-732\" style=\"width:205px;height:auto\" srcset=\"https:\/\/jankiewicz.pl\/wp-content\/uploads\/2023\/11\/image-852x1024.png 852w, https:\/\/jankiewicz.pl\/wp-content\/uploads\/2023\/11\/image-250x300.png 250w, https:\/\/jankiewicz.pl\/wp-content\/uploads\/2023\/11\/image-768x923.png 768w, https:\/\/jankiewicz.pl\/wp-content\/uploads\/2023\/11\/image.png 944w\" sizes=\"auto, (max-width: 852px) 100vw, 852px\" \/><\/figure>\n<\/div>\n\n\n<p>Apache Spark okre\u015blany jest mianem standardu de-facto przetwarzania Big Data. <br>Jego popularno\u015b\u0107, wyst\u0119powanie praktycznie w ramach ka\u017cdej z platform chmurowych, w \u015brodowiskach <em>on-premise<\/em>, API dla j\u0119zyk\u00f3w Python, Scala, Java, ale tak\u017ce R oraz przede wszystkim zakres dostarczanej funkcjonalno\u015bci pe\u0142ni uzasadnia to twierdzenie.<\/p>\n\n\n\n<p>Szkolenie <strong><em>Apache Spark z wykorzystaniem j\u0119zyka Python<\/em><\/strong> prezentuje praktyczne wykorzystanie platformy Apache Spark w kontek\u015bcie przetwarzania Big Data.<\/p>\n\n\n\n<p>Szkolenie prowadzone we wsp\u00f3\u0142pracy z firm\u0105 <a href=\"https:\/\/www.sages.pl\/szkolenia\/apache-spark-z-wykorzystaniem-jezyka-python\" data-type=\"URL\" data-id=\"https:\/\/www.sages.pl\/szkolenia\/apache-spark-z-wykorzystaniem-jezyka-scala\">Sages<\/a>.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Podstawowe cele szkolenia<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Zapoznanie z platform\u0105 Spark oraz jej API dla j\u0119zyka Python<\/li>\n\n\n\n<li>Wykorzystanie Apache Spark w r\u00f3\u017cnych przypadkach analizy du\u017cej ilo\u015bci danych<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">G\u0142\u00f3wne jego zalety<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Kompleksowe wprowadzenie do platformy Spark &#8211; po zako\u0144czonym szkoleniu znasz mo\u017cliwo\u015bci i zakres funkcjonalno\u015bci Sparka.<\/li>\n\n\n\n<li>Przedstawienie praktycznych przyk\u0142ad\u00f3w oraz praktyk zwi\u0105zanych z analiz\u0105 du\u017cej ilo\u015bci danych<\/li>\n\n\n\n<li>Praktyka przed teori\u0105 &#8211; nie tylko wiesz jak, ale tak\u017ce dlaczego<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">Dla kogo?<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Programi\u015bci i analitycy, kt\u00f3rzy znaj\u0105 podstawy Big Data oraz hurtowni danych i chc\u0105 rozpocz\u0105\u0107 przygod\u0119 z<br>wykorzystaniem platformy Spark w oparciu o API dla j\u0119zyka Python<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">Wymagania<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Dobra znajomo\u015b\u0107: j\u0119zyka SQL, relacyjnego modelu danych oraz hurtowni danych<\/li>\n\n\n\n<li>Podstawowa znajomo\u015b\u0107 j\u0119zyka programowania Python<\/li>\n\n\n\n<li>Znajomo\u015b\u0107 zagadnie\u0144 Big Data, platformy Hadoop oraz powi\u0105zanych z ni\u0105 narz\u0119dzi<\/li>\n\n\n\n<li>Zalecany jest wcze\u015bniejszy udzia\u0142 w szkoleniu: <em><a href=\"https:\/\/jankiewicz.pl\/index.php\/2022\/06\/18\/krzysztof-jankiewicz-big-data-i-platforma-hadoop-wprowadzenie\/\" data-type=\"post\" data-id=\"52\">Big Data i platforma Hadoop &#8211; wprowadzenie<\/a><\/em><\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Struktura kursu<\/h2>\n\n\n\n<p>Kurs podzielony jest na tematy. Ka\u017cdy z temat\u00f3w obejmuje wyk\u0142adowy materia\u0142 wprowadzaj\u0105cy i zestaw \u0107wicze\u0144\/zada\u0144\/tutoriali,<br>kt\u00f3ry w praktyczny spos\u00f3b pozwala zaznajomi\u0107 si\u0119 z przedstawianym tematem.<\/p>\n\n\n\n<p>Materia\u0142 <strong>wyk\u0142adowy<\/strong> ilustrowany jest slajdami z du\u017c\u0105 liczb\u0105 przyk\u0142ad\u00f3w.<\/p>\n\n\n\n<p>Materia\u0142 <strong>praktyczny<\/strong> ma charakter zada\u0144\/warsztat\u00f3w\/tutoriali do samodzielnego wykonania.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Lista temat\u00f3w<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"day1\">Dzie\u0144 1<\/h3>\n\n\n\n<ol start=\"0\" class=\"wp-block-list\">\n<li>Big Data, Hadoop &#8211; wprowadzenie\n<ul class=\"wp-block-list\">\n<li>Prezentacja\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP01-l1_25-Co-to-jest-Big-Data.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Big Data &#8211; wprowadzenie<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP01-l2_25-Czym-jest-Hadoop-short.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Hadoop &#8211; co to jest?<\/a><\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Warsztat\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP01_w1_25-\u015arodowisko-BigData25.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Zapoznanie si\u0119 ze \u015brodowiskiem<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Spark &#8211; Wprowadzenie\n<ul class=\"wp-block-list\">\n<li>Prezentacja\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP02_l1_25-Spark-wprowadzenie.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; wprowadzenie<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP02_l2_24-Spark-wprowadzenie-WordCount.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark Core (RDD API) &#8211; na przyk\u0142adzie WordCount<\/a><\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Warsztat\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP02_w1_25-Spark-wprowadzenie.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark &#8211; wprowadzenie &#8211; tutorial<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Spark Core (RDD API)\n<ul class=\"wp-block-list\">\n<li>Prezentacja\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP03_l1_23-Spark-RDD.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark Core (RDD API) &#8211; podstawy &#8211; notatnik (Jupyter)<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP03_l2_25-Spark-RDD-par.ipynb\" target=\"_blank\" rel=\"noreferrer noopener\">Spark Core (RDD API) &#8211; RDD par &#8211; notatnik (Jupyter)<\/a><\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Warsztat\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP03_w1_25_Spark-RDD-zadania.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark Core (RDD API)<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Spark SQL (DataFrame API)\n<ul class=\"wp-block-list\">\n<li>Prezentacja\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP04_l1_25-DataFrames-API-SQL.ipynb\" target=\"_blank\" rel=\"noreferrer noopener\">Spark SQL (DataFrame API) &#8211; notatnik (Jupyter)<\/a><\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Warsztat 1 &#8211; podstawy\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP04_w1_25-Spark-DataFrames-API-SQL-zadania.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark SQL (DataFrame API) &#8211; warsztat 1<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP04_w1_25-Spark-DataFrames-API-SQL.ipynb\" target=\"_blank\" rel=\"noreferrer noopener\">Spark SQL (DataFrame API) &#8211; warsztat 1 &#8211; notatnik (Jupyter)<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ol>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"day2\">Dzie\u0144 2<\/h3>\n\n\n\n<ol start=\"1\" class=\"wp-block-list\">\n<li>Spark SQL (DataFrame API) &#8211; cd\n<ul class=\"wp-block-list\">\n<li>Warsztat 2 &#8211; elementy zaawansowane\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP04_w2_25-Spark-DataFrames-API-SQL.pdf\" data-type=\"link\" data-id=\"SP04_w2_24-Spark-DataFrames-API-SQL-gcp-zadania.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark SQL (DataFrame API) &#8211; warsztat 2<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP04_w2_25-Spark-DataFrames-API-SQL.ipynb\" target=\"_blank\" rel=\"noreferrer noopener\">Spark SQL (DataFrame API) &#8211; warsztat 2 &#8211; notatnik (Jupyter)<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Spark SQL (SQL API)\n<ul class=\"wp-block-list\">\n<li>Warsztat\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP04-w3-25-Spark-SQL.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark SQL (SQL API) &#8211; warsztat<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Spark WebUI\n<ul class=\"wp-block-list\">\n<li>Prezentacja\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP09_l1_25-Spark-WebUI.pdf\" target=\"_blank\" rel=\"noreferrer noopener\">Spark WebUI<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP09_l1_25-Spark-WebUI.ipynb\" target=\"_blank\" rel=\"noreferrer noopener\">Spark WebUI &#8211; notatnik (Jupyter)<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ol>\n\n\n\n<h3 class=\"wp-block-heading\">Dodatek<\/h3>\n\n\n\n<ol class=\"wp-block-list\">\n<li>Spark &#8211; ML\n<ul class=\"wp-block-list\">\n<li>Warsztat\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP05_w1_24-Spark-ML-zadania.pdf\" data-type=\"URL\" target=\"_blank\" rel=\"noreferrer noopener\">Spark ML &#8211; warsztat<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP05_w1_24-Spark-ML-zadania-solns.ipynb\" target=\"_blank\" rel=\"noreferrer noopener\">Spark ML &#8211; notatnik 1 (Jupyter)<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP05_w2_24-Spark-ML-zadania-solns.ipynb\" target=\"_blank\" rel=\"noreferrer noopener\">Spark ML &#8211; notatnik 2 (Jupyter)<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-sp\/SP05_w3_24-Spark-ML-zadania-solns.ipynb\" target=\"_blank\" rel=\"noreferrer noopener\">Spark ML &#8211; notatnik 3 (Jupyter)<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ol>\n\n\n\n\n\n\n\n\n\n<p><\/p>\n\n\n\n<p><\/p>\n\n\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Jeszcze niedawno dokumentacja Apache Spark przyk\u0142adowe fragmenty kodu w ramach dostarczanych API prezentowa\u0142a w kolejno\u015bci: Scala, Java, Python R.<br \/>\nOd wersji 3.5.0 ta kolejno\u015b\u0107 jest ju\u017c inna: Python, Scala, Java, R. Popularno\u015b\u0107 j\u0119zyka Python robi swoje, znaczenie dla \u015bwiata Data Science to jeszcze pot\u0119guje.  <\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"inline_featured_image":false,"footnotes":""},"categories":[7],"tags":[14,44,32,45,17,18],"class_list":["post-712","post","type-post","status-publish","format-standard","hentry","category-big-data","tag-apache-kafka","tag-gcp","tag-hadoop","tag-python","tag-spark","tag-sql"],"_links":{"self":[{"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/posts\/712","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/comments?post=712"}],"version-history":[{"count":71,"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/posts\/712\/revisions"}],"predecessor-version":[{"id":1228,"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/posts\/712\/revisions\/1228"}],"wp:attachment":[{"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/media?parent=712"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/categories?post=712"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/tags?post=712"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}