Python. Uczenie maszynowe w przykładach. TensorFlow 2, PyTorch i scikit-learn

Python jako silnik nowoczesnego uczenia maszynowego

Uczenie maszynowe przestało być domeną laboratoriów — dziś napędza rekomendacje, analizę obrazów, prognozy i inteligentne decyzje w aplikacjach biznesowych. W praktyce jednak największe wyzwanie nie polega na „wiedzy”, tylko na umiejętności wdrożenia algorytmu tak, aby działał na danych, a nie tylko na slajdzie. Dlatego tak ważne jest uczenie się przez działanie: krok po kroku, na realnych problemach i z kodem.

Python. Uczenie maszynowe w przykładach. TensorFlow 2, PyTorch i scikit-learn to trzecie wydanie popularnego podręcznika, które prowadzi czytelnika przez kluczowe techniki uczenia maszynowego w języku Python. Autor pokazuje, jak przejść od podstaw do bardziej zaawansowanych zastosowań — od eksploracji danych i inżynierii cech, po modele klasyfikacyjne, regresyjne, klastrowanie oraz przetwarzanie języka naturalnego.

Jeśli chcesz tworzyć systemy uczące się sprawnie i bez zgadywania, ta książka jest zaplanowana pod praktykę. Naturalnie pojawia się też wątek współczesnych narzędzi, w tym TensorFlow 2, PyTorch oraz scikit-learn.

Od danych do modeli: eksploracja, inżynieria cech i dobre praktyki

Zanim model zacznie „myśleć”, trzeba przygotować dane. Właśnie od tego zaczyna się praca z uczeniem maszynowym: od zrozumienia celu projektu, zebrania istotnych pól i ujednolicenia danych. Książka kładzie nacisk na to, że skuteczność systemu zależy od jakości przygotowania wejścia — a nie tylko od wyboru algorytmu.

W trakcie nauki poznasz typowe pułapki, takie jak nadmierne i niedostateczne dopasowanie modelu oraz kompromis między obciążeniem a wariancją. Autor pokazuje też, jak temu przeciwdziałać: poprzez weryfikację krzyżową, regularyzację, selekcję cech i redukcję wymiarowości. To podejście jest szczególnie ważne, gdy pracujesz z danymi, które nie zachowują się idealnie — szum, braki, różne skale i nieoczywiste zależności są normą.

W praktycznych rozdziałach zobaczysz, jak łączyć modele (m.in. głosowanie i uśrednianie), jak korzystać z metod zespołowych oraz jak budować solidny pipeline treningu i oceny. Całość jest spójna z hasłem: Python. Uczenie maszynowe w przykładach. TensorFlow 2, PyTorch i scikit-learn — czyli nauka przez kod, ale z myśleniem inżynierskim.

Rekomendacje, obrazy i prognozy: modele, które realnie rozwiązują problemy

Jednym z największych atutów podręcznika jest różnorodność zastosowań. Zamiast ograniczać się do jednego typu zadania, książka prowadzi przez wiele scenariuszy, w których liczą się inne własności danych. Dzięki temu łatwiej zrozumieć, dlaczego czasem lepiej sprawdza się klasyfikacja, a czasem regresja, a innym razem klastrowanie lub uczenie sekwencyjne.

W części poświęconej systemom rekomendacji poznasz podejście oparte o naiwnego klasyfikatora Bayesa, w tym mechanizm Bayesa w przykładach oraz implementacje: od podstaw i z użyciem scikit-learn. Dalej pojawia się rozpoznawanie twarzy z wykorzystaniem maszyny wektorów nośnych — w różnych scenariuszach, także wtedy, gdy problem jest nierozdzielny liniowo i trzeba sięgnąć po jądro (w tym wybór między jądrem liniowym a radialną funkcją bazową).

W kolejnych rozdziałach książka przechodzi do prognozowania kliknięć reklam internetowych przy użyciu algorytmów drzewiastych oraz regresji logistycznej. Autor pokazuje, jak budować drzewa decyzyjne, jak działa las losowy i drzewa ze wzmocnieniem gradientowym, a także jak trenować regresję logistyczną z gradientem prostym i stochastycznym gradientem prostym — z regularyzacją i selekcją cech. To podejście przekłada się na praktykę: nauczysz się nie tylko „jak uruchomić model”, ale jak go stroić.

Skalowanie do dużych zbiorów i uczenie na tekstach

Gdy dane rosną do rozmiarów, które trudno obsłużyć w typowym środowisku, potrzebujesz narzędzi do przetwarzania rozproszonego. W rozdziale o Apache Spark książka przeprowadza przez podstawy, komponenty, instalację oraz uruchamianie i wdrażanie programów. Następnie pokazuje programowanie w PySpark i trenowanie modeli na bardzo dużych zbiorach danych.

W praktyce zobaczysz, jak przygotować dane o kliknięciach reklam, jak kodować cechy kategorialne w schemacie „1 z n”, jak mieszać cechy, a także jak wykorzystywać interakcje między zmiennymi. To ważne, bo modele często wymagają przemyślanych transformacji, zanim w ogóle zaczną sensownie się uczyć.

Kolejny obszar to przetwarzanie języka naturalnego. Autor omawia instalację kluczowych bibliotek, tokenizację, oznaczanie części mowy, rozpoznawanie jednostek nazwanych, stemming i lematyzację. Pojawia się też modelowanie semantyczne i tematyczne oraz praca z danymi z grup dyskusyjnych: od zliczania tokenów, przez czyszczenie tekstu (np. usuwanie stop-słów) i upraszczanie odmian, aż po wizualizacje z użyciem t-SNE oraz redukcję wymiarowości.

Klastrowanie tematów, sieci neuronowe i uczenie przez wzmacnianie

W książce znajdziesz też naukę bez wskazówek: klastrowanie i modelowanie tematyczne. Autor prowadzi przez klastrowanie metodą k-średnich — od intuicji i doboru wartości k, po implementacje od podstaw i z użyciem scikit-learn. Następnie przechodzi do odkrywania ukrytych tematów grup dyskusyjnych z wykorzystaniem nieujemnej faktoryzacji macierzy oraz ukrytej alokacji Dirichleta.

W części dotyczącej głębokich modeli pojawiają się sieci neuronowe zarówno w klasycznych zadaniach predykcyjnych, jak i w obrazach, sekwencjach oraz decyzjach. Jest mowa o konwolucyjnych sieciach neuronowych do klasyfikacji zdjęć odzieży (z omówieniem warstw konwolucyjnych, nieliniowych i redukujących oraz augmentacji danych: odwracanie, obracanie i przesuwanie obrazów). Potem przychodzi uczenie sekwencyjne: rekurencyjne sieci neuronowe, a także długoterminowe zależności z LSTM, w tym analiza recenzji filmowych i budowa generatora tekstu.

Na końcu książka wchodzi w temat podejmowania decyzji w trudnych warunkach dzięki uczeniu przez wzmacnianie. Opisano przygotowanie środowiska, instalację biblioteki PyTorch oraz narzędzi OpenAI Gym. Zobaczysz m.in. problem FrozenLake (iteracja wartości i iteracja polityki), metodę Monte Carlo, środowisko Blackjack oraz problem taksówkarza z Q-uczeniem.

Cecha Wartość
Nazwa Python. Uczenie maszynowe w przykładach. TensorFlow 2, PyTorch i scikit-learn
SKU 5d73dff94d4e
Cena 58.47 zł
Zakres tematyczny Podstawy uczenia maszynowego i nauki o danych; eksploracja danych i inżynieria cech; klasyfikacja, regresja, klastrowanie; NLP; rekomendacje, rozpoznawanie twarzy, prognozowanie cen akcji, klasyfikacja zdjęć, prognozowanie sekwencji oraz uczenie przez wzmacnianie
Technologie i biblioteki Python; TensorFlow 2; PyTorch; scikit-learn; Apache Spark (PySpark); OpenAI Gym

Dla kogo jest ta książka i jak pomaga w nauce

To propozycja dla osób, które chcą przejść z poziomu „rozumiem pojęcia” do „umiem zbudować działający model”. Jeśli interesuje Cię wdrażanie i praktyka, książka prowadzi przez kompletne ścieżki: przygotowanie danych, trenowanie, ocenę jakości, strojenie oraz wprowadzanie rozwiązań na coraz trudniejszych problemach.

W dodatku autor konsekwentnie pokazuje, że nowoczesne uczenie maszynowe to także dobór narzędzi i decyzje inżynierskie. Z jednej strony dostajesz konkretne implementacje w Pythonie, z drugiej — solidne podstawy: od nadmiernego dopasowania, przez regularyzację i selekcję cech, aż po dobre praktyki wdrażania i monitorowania modelu.

Książka jest też aktualna w perspektywie zastosowań ważnych dla biznesu: rekomendacje, rozpoznawanie twarzy, prognozowanie cen akcji, klasyfikowanie zdjęć, prognozowanie sekwencji danych oraz uczenie przez wzmacnianie w podejmowaniu decyzji. To wszystko składa się na spójny materiał: Python. Uczenie maszynowe w przykładach. TensorFlow 2, PyTorch i scikit-learn.

Rozdziały, które prowadzą przez pełne spektrum zadań

Wśród tematów znajdziesz m.in.: pierwsze kroki z uczeniem maszynowym w Pythonie, system rekomendacyjny filmów w oparciu o naiwny klasyfikator Bayesa, rozpoznawanie twarzy z SVM, prognozowanie kliknięć reklam (drzewa decyzyjne, las losowy, drzewa ze wzmocnieniem gradientowym), regresję logistyczną, skalowanie do terabajtowych dzienników kliknięć w Spark, prognozowanie cen akcji (regresja liniowa, drzewa regresyjne, las regresyjny, regresja wektorów nośnych), sieci neuronowe i ich praktyczne elementy (funkcje aktywacji, propagacja wstecz, dropout, wczesne zakończenie treningu).

Nie zabraknie też NLP (analiza grup dyskusyjnych, tokenizacja, redukcja wymiarowości), klastrowania i modelowania tematycznego (k-średnie, NMF, LDA), dobrych praktyk uczenia maszynowego oraz zaawansowanych modeli: CNN do zdjęć, rekurencyjnych sieci neuronowych i LSTM do sekwencji oraz uczenia przez wzmacnianie (FrozenLake, Blackjack, Taxi, Q-uczenie).

Autor: praktyk, który łączy badania z edukacją

Yuxi (Hayden) Liu rozwija modele uczenia maszynowego w Google. Wcześniej prowadził prace naukowe nad zastosowaniami uczenia maszynowego w obszarach takich jak reklama internetowa i cyberbezpieczeństwo. Jest również entuzjastą edukacji i autorem wielu książek o uczeniu maszynowym.

Pierwsze wydanie podręcznika osiągnęło wiodącą pozycję w rankingu Amazona w latach 2017 i 2018, co dobrze oddaje jego charakter: dużo praktyki, jasne prowadzenie i nacisk na zrozumienie przez działanie.

Dzięki temu otrzymujesz nie tylko zbiór algorytmów, ale uporządkowaną naukę — od fundamentów aż po nowoczesne zastosowania z TensorFlow 2, PyTorch i scikit-learn, tak abyś naprawdę potrafił budować systemy uczące się.

+0