Python. Uczenie maszynowe w przykładach. TensorFlow 2, PyTorch i scikit-learn
Python jako silnik nowoczesnego uczenia maszynowego
Uczenie maszynowe przestało być domeną laboratoriów — dziś napędza rekomendacje, analizę obrazów, prognozy i inteligentne decyzje w aplikacjach biznesowych. W praktyce jednak największe wyzwanie nie polega na „wiedzy”, tylko na umiejętności wdrożenia algorytmu tak, aby działał na danych, a nie tylko na slajdzie. Dlatego tak ważne jest uczenie się przez działanie: krok po kroku, na realnych problemach i z kodem.
Python. Uczenie maszynowe w przykładach. TensorFlow 2, PyTorch i scikit-learn to trzecie wydanie popularnego podręcznika, które prowadzi czytelnika przez kluczowe techniki uczenia maszynowego w języku Python. Autor pokazuje, jak przejść od podstaw do bardziej zaawansowanych zastosowań — od eksploracji danych i inżynierii cech, po modele klasyfikacyjne, regresyjne, klastrowanie oraz przetwarzanie języka naturalnego.
Jeśli chcesz tworzyć systemy uczące się sprawnie i bez zgadywania, ta książka jest zaplanowana pod praktykę. Naturalnie pojawia się też wątek współczesnych narzędzi, w tym TensorFlow 2, PyTorch oraz scikit-learn.
Od danych do modeli: eksploracja, inżynieria cech i dobre praktyki
Zanim model zacznie „myśleć”, trzeba przygotować dane. Właśnie od tego zaczyna się praca z uczeniem maszynowym: od zrozumienia celu projektu, zebrania istotnych pól i ujednolicenia danych. Książka kładzie nacisk na to, że skuteczność systemu zależy od jakości przygotowania wejścia — a nie tylko od wyboru algorytmu.
W trakcie nauki poznasz typowe pułapki, takie jak nadmierne i niedostateczne dopasowanie modelu oraz kompromis między obciążeniem a wariancją. Autor pokazuje też, jak temu przeciwdziałać: poprzez weryfikację krzyżową, regularyzację, selekcję cech i redukcję wymiarowości. To podejście jest szczególnie ważne, gdy pracujesz z danymi, które nie zachowują się idealnie — szum, braki, różne skale i nieoczywiste zależności są normą.
W praktycznych rozdziałach zobaczysz, jak łączyć modele (m.in. głosowanie i uśrednianie), jak korzystać z metod zespołowych oraz jak budować solidny pipeline treningu i oceny. Całość jest spójna z hasłem: Python. Uczenie maszynowe w przykładach. TensorFlow 2, PyTorch i scikit-learn — czyli nauka przez kod, ale z myśleniem inżynierskim.
Rekomendacje, obrazy i prognozy: modele, które realnie rozwiązują problemy
Jednym z największych atutów podręcznika jest różnorodność zastosowań. Zamiast ograniczać się do jednego typu zadania, książka prowadzi przez wiele scenariuszy, w których liczą się inne własności danych. Dzięki temu łatwiej zrozumieć, dlaczego czasem lepiej sprawdza się klasyfikacja, a czasem regresja, a innym razem klastrowanie lub uczenie sekwencyjne.
W części poświęconej systemom rekomendacji poznasz podejście oparte o naiwnego klasyfikatora Bayesa, w tym mechanizm Bayesa w przykładach oraz implementacje: od podstaw i z użyciem scikit-learn. Dalej pojawia się rozpoznawanie twarzy z wykorzystaniem maszyny wektorów nośnych — w różnych scenariuszach, także wtedy, gdy problem jest nierozdzielny liniowo i trzeba sięgnąć po jądro (w tym wybór między jądrem liniowym a radialną funkcją bazową).
W kolejnych rozdziałach książka przechodzi do prognozowania kliknięć reklam internetowych przy użyciu algorytmów drzewiastych oraz regresji logistycznej. Autor pokazuje, jak budować drzewa decyzyjne, jak działa las losowy i drzewa ze wzmocnieniem gradientowym, a także jak trenować regresję logistyczną z gradientem prostym i stochastycznym gradientem prostym — z regularyzacją i selekcją cech. To podejście przekłada się na praktykę: nauczysz się nie tylko „jak uruchomić model”, ale jak go stroić.
Skalowanie do dużych zbiorów i uczenie na tekstach
Gdy dane rosną do rozmiarów, które trudno obsłużyć w typowym środowisku, potrzebujesz narzędzi do przetwarzania rozproszonego. W rozdziale o Apache Spark książka przeprowadza przez podstawy, komponenty, instalację oraz uruchamianie i wdrażanie programów. Następnie pokazuje programowanie w PySpark i trenowanie modeli na bardzo dużych zbiorach danych.
W praktyce zobaczysz, jak przygotować dane o kliknięciach reklam, jak kodować cechy kategorialne w schemacie „1 z n”, jak mieszać cechy, a także jak wykorzystywać interakcje między zmiennymi. To ważne, bo modele często wymagają przemyślanych transformacji, zanim w ogóle zaczną sensownie się uczyć.
Kolejny obszar to przetwarzanie języka naturalnego. Autor omawia instalację kluczowych bibliotek, tokenizację, oznaczanie części mowy, rozpoznawanie jednostek nazwanych, stemming i lematyzację. Pojawia się też modelowanie semantyczne i tematyczne oraz praca z danymi z grup dyskusyjnych: od zliczania tokenów, przez czyszczenie tekstu (np. usuwanie stop-słów) i upraszczanie odmian, aż po wizualizacje z użyciem t-SNE oraz redukcję wymiarowości.
Klastrowanie tematów, sieci neuronowe i uczenie przez wzmacnianie
W książce znajdziesz też naukę bez wskazówek: klastrowanie i modelowanie tematyczne. Autor prowadzi przez klastrowanie metodą k-średnich — od intuicji i doboru wartości k, po implementacje od podstaw i z użyciem scikit-learn. Następnie przechodzi do odkrywania ukrytych tematów grup dyskusyjnych z wykorzystaniem nieujemnej faktoryzacji macierzy oraz ukrytej alokacji Dirichleta.
W części dotyczącej głębokich modeli pojawiają się sieci neuronowe zarówno w klasycznych zadaniach predykcyjnych, jak i w obrazach, sekwencjach oraz decyzjach. Jest mowa o konwolucyjnych sieciach neuronowych do klasyfikacji zdjęć odzieży (z omówieniem warstw konwolucyjnych, nieliniowych i redukujących oraz augmentacji danych: odwracanie, obracanie i przesuwanie obrazów). Potem przychodzi uczenie sekwencyjne: rekurencyjne sieci neuronowe, a także długoterminowe zależności z LSTM, w tym analiza recenzji filmowych i budowa generatora tekstu.
Na końcu książka wchodzi w temat podejmowania decyzji w trudnych warunkach dzięki uczeniu przez wzmacnianie. Opisano przygotowanie środowiska, instalację biblioteki PyTorch oraz narzędzi OpenAI Gym. Zobaczysz m.in. problem FrozenLake (iteracja wartości i iteracja polityki), metodę Monte Carlo, środowisko Blackjack oraz problem taksówkarza z Q-uczeniem.
| Cecha | Wartość |
|---|---|
| Nazwa | Python. Uczenie maszynowe w przykładach. TensorFlow 2, PyTorch i scikit-learn |
| SKU | 5d73dff94d4e |
| Cena | 58.47 zł |
| Zakres tematyczny | Podstawy uczenia maszynowego i nauki o danych; eksploracja danych i inżynieria cech; klasyfikacja, regresja, klastrowanie; NLP; rekomendacje, rozpoznawanie twarzy, prognozowanie cen akcji, klasyfikacja zdjęć, prognozowanie sekwencji oraz uczenie przez wzmacnianie |
| Technologie i biblioteki | Python; TensorFlow 2; PyTorch; scikit-learn; Apache Spark (PySpark); OpenAI Gym |
Dla kogo jest ta książka i jak pomaga w nauce
To propozycja dla osób, które chcą przejść z poziomu „rozumiem pojęcia” do „umiem zbudować działający model”. Jeśli interesuje Cię wdrażanie i praktyka, książka prowadzi przez kompletne ścieżki: przygotowanie danych, trenowanie, ocenę jakości, strojenie oraz wprowadzanie rozwiązań na coraz trudniejszych problemach.
W dodatku autor konsekwentnie pokazuje, że nowoczesne uczenie maszynowe to także dobór narzędzi i decyzje inżynierskie. Z jednej strony dostajesz konkretne implementacje w Pythonie, z drugiej — solidne podstawy: od nadmiernego dopasowania, przez regularyzację i selekcję cech, aż po dobre praktyki wdrażania i monitorowania modelu.
Książka jest też aktualna w perspektywie zastosowań ważnych dla biznesu: rekomendacje, rozpoznawanie twarzy, prognozowanie cen akcji, klasyfikowanie zdjęć, prognozowanie sekwencji danych oraz uczenie przez wzmacnianie w podejmowaniu decyzji. To wszystko składa się na spójny materiał: Python. Uczenie maszynowe w przykładach. TensorFlow 2, PyTorch i scikit-learn.
Rozdziały, które prowadzą przez pełne spektrum zadań
Wśród tematów znajdziesz m.in.: pierwsze kroki z uczeniem maszynowym w Pythonie, system rekomendacyjny filmów w oparciu o naiwny klasyfikator Bayesa, rozpoznawanie twarzy z SVM, prognozowanie kliknięć reklam (drzewa decyzyjne, las losowy, drzewa ze wzmocnieniem gradientowym), regresję logistyczną, skalowanie do terabajtowych dzienników kliknięć w Spark, prognozowanie cen akcji (regresja liniowa, drzewa regresyjne, las regresyjny, regresja wektorów nośnych), sieci neuronowe i ich praktyczne elementy (funkcje aktywacji, propagacja wstecz, dropout, wczesne zakończenie treningu).
Nie zabraknie też NLP (analiza grup dyskusyjnych, tokenizacja, redukcja wymiarowości), klastrowania i modelowania tematycznego (k-średnie, NMF, LDA), dobrych praktyk uczenia maszynowego oraz zaawansowanych modeli: CNN do zdjęć, rekurencyjnych sieci neuronowych i LSTM do sekwencji oraz uczenia przez wzmacnianie (FrozenLake, Blackjack, Taxi, Q-uczenie).
Autor: praktyk, który łączy badania z edukacją
Yuxi (Hayden) Liu rozwija modele uczenia maszynowego w Google. Wcześniej prowadził prace naukowe nad zastosowaniami uczenia maszynowego w obszarach takich jak reklama internetowa i cyberbezpieczeństwo. Jest również entuzjastą edukacji i autorem wielu książek o uczeniu maszynowym.
Pierwsze wydanie podręcznika osiągnęło wiodącą pozycję w rankingu Amazona w latach 2017 i 2018, co dobrze oddaje jego charakter: dużo praktyki, jasne prowadzenie i nacisk na zrozumienie przez działanie.
Dzięki temu otrzymujesz nie tylko zbiór algorytmów, ale uporządkowaną naukę — od fundamentów aż po nowoczesne zastosowania z TensorFlow 2, PyTorch i scikit-learn, tak abyś naprawdę potrafił budować systemy uczące się.