Implementing a Lakehouse with Microsoft Fabric
kod szkolenia: DP-601 / PL DL 1dTen kurs zbada potężne możliwości Apache Spark do rozproszonego przetwarzania danych oraz podstawowe techniki wydajnego zarządzania danymi, wersjonowania i niezawodności dzięki pracy z tabelami Delta Lake. Ten kurs będzie również badać pozyskiwanie i orkiestrację danych przy użyciu potoków Dataflows Gen2 i Data Factory.
Ten kurs ma na celu zbudowanie podstawowych umiejętności w zakresie inżynierii danych w Microsoft Fabric, koncentrując się na koncepcji Lakehouse.
Powinieneś znać podstawowe pojęcia dotyczące baz danych i terminologię dotyczącą Microsoft Azure. Sugeruje się wcześniejsze zapoznanie się z materiałami szkoleniowymi AZ-900 i DP-900 lub wzięcie udziału w tych szkoleniach. Potrzebna będzie umiejętność korzystania z angielskojęzycznej dokumentacji (w tym opis laboratoriów).
Kurs DP-601 należy do ścieżek:
-
Data Analyst
-
Data Engineer
-
Data Scientist
Dla zwiększenia komfortu pracy oraz efektywności szkolenia zalecamy skorzystanie z dodatkowego ekranu. Brak dodatkowego ekranu nie jest przeciwwskazaniem do udziału w szkoleniu, ale w znaczący sposób wpływa na komfort pracy podczas zajęć.
Informacje oraz wymagania dotyczące uczestniczenia w szkoleniach w formule zdalnej dostępne na: https://www.altkomakademia.pl/distance-learning/#FAQ
-
Szkolenie: polski
-
Materiały: angielski
* podręcznik w formie elektronicznej dostępny na platformie:
https://learn.microsoft.com/pl-pl/training/
* dostęp do portalu słuchacza Altkom Akademii
Ten kurs obejmuje połączenie wykładów i ćwiczeń praktycznych, które przygotują Cię do pracy z Lakehouse w Microsoft Fabric
Moduł 1: Wprowadzenie do kompleksowej analizy przy użyciu Microsoft Fabric
Wprowadzenie do Microsoft Fabric
Zespoły ds. danych i sieć szkieletowa
Włączanie i używanie Microsoft Fabric
Moduł 2: Wprowadzenie do Lakehouse w usłudze Microsoft Fabric
Co to jest Lakehouse?
Praca z Fabric Lakehouse Eksploruj, przekształcaj i wizualizuj dane w Lakehouse
Moduł 3: Korzystanie z platformy Apache Spark w usłudze Microsoft Fabric.
Przygotowanie do korzystania z platformy Apache SparkPrepare to use Apache Spark Uruchamianie platformy Spark w sieci szkieletowej Ładowanie danych w ramce danych platformy SparkLoad data in a Spark DataFrame
Przekształcanie danych w ramce danych platformy SparkTransform data in a Spark DataFrame
Praca z danymi przy użyciu języka SQL platformy Spark
Wykonywanie zapytań dotyczących danych przy użyciu interfejsu API SQL platformy SparkQuery data using Spark SQL API
Wizualizacja danych
Moduł 4: Praca z tabelami Delta Lake w Microsoft Fabric
Zrozumieć Delta Lake
Tworzenie tabel różnicowych przy użyciu kodu w platformie SparkCreate
Praca z tabelami różnic w platformie Spark
Wersjonowanie danych i podróże w czasie
Używanie tabel różnicowych z danymi przesyłanymi strumieniowo
Moduł 5: Pozyskiwanie danych za pomocą przepływów danych Gen2 w sieci szkieletowej Microsoft Fabric
Opis przepływów danych (Gen2)
Korzyści i ograniczenia przepływu danych (Gen2)
Poznaj przepływy danych (Gen2) w usłudze Microsoft Fabric
Integrowanie przepływów danych (Gen2) i potoków w sieci Microsoft Fabric
Moduł 6: Używanie potoków usługi Data Factory w Microsoft Fabric
Potoki w Microsoft Fabric
Wspólne działania – kopiowanie danych
Wspólne działania — szablony potoków Uruchamianie i monitorowanie potoków.