{"id":46,"date":"2025-12-07T10:06:55","date_gmt":"2025-12-07T09:06:55","guid":{"rendered":"http:\/\/wp.jankiewicz.pl\/index.php\/krzysztof-jankiewicz-apache-spark-z-wykorzystaniem-jezyka-scala\/"},"modified":"2025-12-10T08:58:01","modified_gmt":"2025-12-10T07:58:01","slug":"apache-spark-z-wykorzystaniem-jezyka-scala","status":"publish","type":"post","link":"https:\/\/jankiewicz.pl\/index.php\/apache-spark-z-wykorzystaniem-jezyka-scala\/","title":{"rendered":"Apache Spark z wykorzystaniem j\u0119zyka Scala"},"content":{"rendered":"\n<h2 class=\"wp-block-heading\"><span style=\"color: revert; font-size: revert; font-weight: revert;\">Harmonogram<\/span><\/h2>\n\n\n\n<h3 class=\"wp-block-heading\"><a href=\"#day1\" data-type=\"internal\" data-id=\"#day1\">Dzie\u0144 1<\/a><\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Scala<\/li>\n\n\n\n<li>Spark &#8211; wprowadzenie<\/li>\n\n\n\n<li>Spark &#8211; <em>RDD API<\/em> (<em>Spark Core<\/em>)<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><a href=\"#day2\" data-type=\"internal\" data-id=\"#day2\">Dzie\u0144 2<\/a><\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Spark &#8211; <em>DataFrame API<\/em> (<em>Spark SQL<\/em>)<\/li>\n\n\n\n<li>Spark &#8211; <em>Dataset API<\/em> (<em>Spark SQL<\/em>)<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><a href=\"#day3\" data-type=\"internal\" data-id=\"#day3\">Dzie\u0144 3<\/a><\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Spark &#8211; <em>SQL API<\/em> <\/li>\n\n\n\n<li>Biblioteka <em>Delta Lake<\/em><\/li>\n\n\n\n<li>Dodatek<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Wprowadzenie<\/h2>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"alignright size-large is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"249\" height=\"300\" src=\"https:\/\/jankiewicz.pl\/wp-content\/uploads\/2022\/06\/spark_scala_b86ec74a38.svg\" alt=\"\" class=\"wp-image-210\" style=\"width:200px;height:200px\"\/><\/figure>\n<\/div>\n\n\n<p class=\"wp-block-paragraph\">Apache Spark okre\u015blany jest mianem standardu de-facto przetwarzania Big Data. <br>Jego popularno\u015b\u0107, wyst\u0119powanie praktycznie w ramach ka\u017cdej z platform chmurowych, w \u015brodowiskach on-premise, API dla j\u0119zyk\u00f3w Scala, Java, ale tak\u017ce Python i R w pe\u0142ni uzasadnia to twierdzenie. <\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Szkolenie <strong><em>Apache Spark z wykorzystaniem j\u0119zyka Scala<\/em><\/strong> prezentuje praktyczne wykorzystanie platformy Apache Spark w kontek\u015bcie przetwarzania Big Data.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Szkolenie prowadzone we wsp\u00f3\u0142pracy z firm\u0105 <a href=\"https:\/\/www.sages.pl\/szkolenia\/apache-spark-z-wykorzystaniem-jezyka-scala\" data-type=\"URL\" data-id=\"https:\/\/www.sages.pl\/szkolenia\/apache-spark-z-wykorzystaniem-jezyka-scala\">Sages<\/a>.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Podstawowe cele szkolenia<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Zapoznanie z platform\u0105 Spark oraz jej API w j\u0119zyku Scala<\/li>\n\n\n\n<li>Pokazanie metod analizy du\u017cej ilo\u015bci danych<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">G\u0142\u00f3wne jego zalety<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Kompleksowe wprowadzenie do platformy Spark &#8211; po zako\u0144czonym szkoleniu znasz mo\u017cliwo\u015bci i zakres funkcjonalno\u015bci Sparka.<\/li>\n\n\n\n<li>Przedstawienie praktycznych przyk\u0142ad\u00f3w oraz praktyk zwi\u0105zanych z analiz\u0105 du\u017cej ilo\u015bci danych<\/li>\n\n\n\n<li>Praktyka przed teori\u0105 &#8211; nie tylko wiesz jak, ale tak\u017ce dlaczego<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">Dla kogo?<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Programi\u015bci i analitycy, kt\u00f3rzy znaj\u0105 podstawy Big Data oraz hurtowni danych i chc\u0105 rozpocz\u0105\u0107 przygod\u0119 z<br>wykorzystaniem platformy Spark oraz j\u0119zykiem Scala<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">Wymagania<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Dobra znajomo\u015b\u0107: j\u0119zyka SQL, relacyjnego modelu danych oraz hurtowni danych<\/li>\n\n\n\n<li>Podstawowa znajomo\u015b\u0107 obiektowych j\u0119zyk\u00f3w programowania np.: Java, Python lub Scala<\/li>\n\n\n\n<li>Znajomo\u015b\u0107 zagadnie\u0144 Big Data, platformy Hadoop oraz powi\u0105zanych z ni\u0105 narz\u0119dzi<\/li>\n\n\n\n<li>Zalecany jest wcze\u015bniejszy udzia\u0142 w szkoleniu: <em><a href=\"https:\/\/jankiewicz.pl\/index.php\/2022\/06\/18\/krzysztof-jankiewicz-big-data-i-platforma-hadoop-wprowadzenie\/\" data-type=\"post\" data-id=\"52\">Big Data i platforma Hadoop &#8211; wprowadzenie<\/a><\/em><\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Struktura kursu<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Kurs podzielony jest na tematy. Ka\u017cdy z temat\u00f3w obejmuje wyk\u0142adowy materia\u0142 wprowadzaj\u0105cy i zestaw \u0107wicze\u0144\/zada\u0144\/tutoriali,<br>kt\u00f3ry w praktyczny spos\u00f3b pozwala zaznajomi\u0107 si\u0119 z przedstawianym tematem.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Materia\u0142 <strong>wyk\u0142adowy<\/strong> ilustrowany jest slajdami z du\u017c\u0105 liczb\u0105 przyk\u0142ad\u00f3w.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Materia\u0142 <strong>praktyczny<\/strong> ma charakter zada\u0144\/warsztat\u00f3w\/tutoriali do samodzielnego wykonania.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Lista temat\u00f3w<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"day1\">Dzie\u0144 1<\/h3>\n\n\n\n<ol start=\"0\" class=\"wp-block-list\">\n<li>Wprowadzenie\n<ul class=\"wp-block-list\">\n<li>Warsztat\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS00_w1_25-\u015arodowisko-BigData25.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">\u015arodowisko warsztat\u00f3w &#8211; wprowadzenie<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Scala\n<ul class=\"wp-block-list\">\n<li>Materia\u0142 wyk\u0142adowy\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS01_l1_25-Scala.zpln\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Scala &#8211; wprowadzenie<\/a> (notatnik Zeppelin) <\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Warsztat\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS01_w1_25-Scala-intellij-zadania.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Scala &#8211; warsztat<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Spark &#8211; Wprowadzenie\n<ul class=\"wp-block-list\">\n<li>Materia\u0142 wyk\u0142adowy\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS02_l1_25-Spark-wprowadzenie.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark &#8211; wprowadzenie<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS02_l2_25-Spark-wprowadzenie-WordCount.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark Core (<em>RDD API<\/em>) \u2013 na przyk\u0142adzie WordCount<\/a><\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Warsztat\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS02_w1_25-Spark-wprowadzenie-intellij-tutorial.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark &#8211; wprowadzenie &#8211; tutorial (IntelliJ IDEA)<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Spark Core &#8211; <em>RDD API<\/em>\n<ul class=\"wp-block-list\">\n<li>Materia\u0142 wyk\u0142adowy\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS03_l1_25-Spark-RDD-podstawy.zpln\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark &#8211; <em>RDD API<\/em><\/a> (notatnik Zeppelin)<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Warsztat\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS03_w1_25-Spark-RDD-podstawy-zadania.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark &#8211; <em>RDD API<\/em> &#8211; warsztat<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS03_w1_25-Spark-RDD-podstawy-zadania.zpln\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark &#8211; <em>RDD API<\/em> &#8211; notatnik (Zeppelin)<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ol>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"day2\">Dzie\u0144 2<\/h3>\n\n\n\n<ol start=\"1\" class=\"wp-block-list\">\n<li>Spark SQL &#8211; <em>DataFrame API<\/em>\n<ul class=\"wp-block-list\">\n<li>Materia\u0142 wyk\u0142adowy\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS04_l1_25-Spark-DataFrameAPI.zpln\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark &#8211; <em>DataFrame API<\/em><\/a> (notatnik Zeppelin) <\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Warsztat\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS04_w1_25-Spark-DataFrameAPI-zadania.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark &#8211; <em>DataFrame API<\/em> &#8211; warsztat<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS04_w1_25-Spark-DataFrameAPI-zadania.zpln\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark &#8211; <em>DataFrame API<\/em> &#8211; notatnik (Zeppelin)<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Spark SQL &#8211; <em>Dataset API<\/em>\n<ul class=\"wp-block-list\">\n<li>Materia\u0142 wyk\u0142adowy\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS05_l1_25-Spark-Dataset.zpln\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark &#8211; <em>Dataset API<\/em><\/a> (notatnik Zeppelin)<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Warsztat\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS05_w1_25-Spark-DataSet-zadania.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark &#8211; <em>Dataset API<\/em> &#8211; warsztat<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Dodatki\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/RozszerzeniaGrupowania.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Rozszerzenia grupowania<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/FunkcjeAnalityczne.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Funkcje analityczne<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ol>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"day3\">Dzie\u0144 3<\/h3>\n\n\n\n<ol start=\"1\" class=\"wp-block-list\">\n<li>Spark SQL &#8211; <em>SQL API<\/em>\n<ul class=\"wp-block-list\">\n<li>Warsztat\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS06_w1_25-Spark-SQL.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark &#8211; <em>SQL API<\/em> &#8211; warsztat<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Spark &#8211; <em>Delta Lake<\/em>\n<ul class=\"wp-block-list\">\n<li>Materia\u0142 wyk\u0142adowy\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS07_l1_25-Spark-Delta-Lake.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark &#8211; Delta Lake<\/a><\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Warsztat\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS07_w1_25-Spark-Delta-Lake-zadania.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark &#8211; Delta Lake &#8211; zadania<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS07_w1_25-Spark-Delta-Lake-zadania.zpln\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark &#8211; Delta Lake &#8211; notatnik (Zeppelin)<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Dodatki\n<ul class=\"wp-block-list\">\n<li>Spark WebUI\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS09_l1_25-Spark-WebUI.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark WebUI<\/a><\/li>\n\n\n\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS09_l1_25-Spark-WebUI.zpln\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark WebUI<\/a> (notatnik Zeppelin)<\/li>\n<\/ul>\n<\/li>\n\n\n\n<li>Spark SQL &#8211; projekt HD\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/jankiewicz.pl\/szkolenia\/bigdata-ss\/SS08_w1_25-Spark-SQL-projekt.pdf\" target=\"_blank\" rel=\"noreferrer noopener nofollow\">Spark SQL &#8211; projekt HD<\/a> &#8211; warsztat<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<\/li>\n<\/ol>\n\n\n\n\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Apache Spark okre\u015blany jest mianem standardu de-facto przetwarzania Big Data. Jego popularno\u015b\u0107, wyst\u0119powanie praktycznie w ramach ka\u017cdej z platform chmurowych, w \u015brodowiskach on-premise, API dla j\u0119zyk\u00f3w Scala, Java, ale tak\u017ce Python i R w pe\u0142ni uzasadnia to twierdzenie.<br \/>\nKurs Apache Spark z wykorzystaniem j\u0119zyka Scala prezentuje praktyczne wykorzystanie platformy Apache Spark w kontek\u015bcie przetwarzania Big Data.<\/p>\n","protected":false},"author":2,"featured_media":185,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"inline_featured_image":false,"footnotes":""},"categories":[7],"tags":[32,37,17,18],"class_list":["post-46","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-big-data","tag-hadoop","tag-scala","tag-spark","tag-sql"],"_links":{"self":[{"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/posts\/46","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/comments?post=46"}],"version-history":[{"count":96,"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/posts\/46\/revisions"}],"predecessor-version":[{"id":1342,"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/posts\/46\/revisions\/1342"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/media\/185"}],"wp:attachment":[{"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/media?parent=46"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/categories?post=46"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/jankiewicz.pl\/index.php\/wp-json\/wp\/v2\/tags?post=46"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}