Powiedzmy wprost: 58% pracowników w Polsce nie zna pojęcia deepfake. Co czwarty Polak przyznał, że zdarzyło mu się uznać za wiarygodne nagranie audio stworzone przez algorytm (raport Cyberportret polskiego biznesu 2025, ESET i DAGMA). To nie są abstrakcyjne statystyki — to portret realnej luki w przygotowaniu polskich firm na jeden z najszybciej rosnących wektorów ataków.
W lutym 2024 roku pracownik firmy finansowej w Hongkongu przelał 25 milionów dolarów po wideokonferencji z dyrektorem finansowym i kilkoma współpracownikami. Wszyscy uczestnicy spotkania — poza ofiarą — byli deepfake'ami generowanymi w czasie rzeczywistym. Żadna zabezpieczenie techniczne nie zatrzymało tego ataku. Zatrzymało go, jak we wszystkich takich przypadkach, brakujące łącze: procedura weryfikacji poza kanałem komunikacji.
W Polsce polszczyzna przez lata stanowiła naturalną barierę dla narzędzi głosowych AI. W 2026 roku ta bariera zanika — modele językowe radzą sobie już z ś, ć, sz i całą fonetyczną złożonością polskiego języka. Czas na poważne potraktowanie zagrożenia.
Deepfake to syntetyczne nagranie wideo, audio lub obraz generowane przez sieci neuronowe wytrenowane na prawdziwych materiałach danej osoby. Technologia analizuje tysiące próbek — sposób mówienia, intonację, mimikę, gesty — i uczy się je odwzorowywać w nowych, fałszywych kontekstach. Efekt to materiał, w którym dana osoba mówi lub robi coś, czego nigdy nie powiedziała ani nie zrobiła.
Kluczowa zmiana w 2026 roku: tworzenie przekonujących deepfake'ów przestało być domeną wyspecjalizowanych hakerów. Narzędzia są tanie, łatwe w obsłudze i nie wymagają zaawansowanej wiedzy technicznej. Do sklonowania głosu wystarczy kilka sekund nagrania — tyle ile znajdziesz w każdym filmiku na LinkedIn, nagraniu z webinaru lub wywiadzie. Generatywna AI zrobiła z deepfake'a narzędzie dostępne masowo.
Tradycyjny CEO fraud polegał na wysłaniu fałszywego e-maila rzekomo od prezesa z prośbą o pilny przelew. Dziś ten schemat ewoluował — atakujący nie wysyłają maili, oni dosłownie rozmawiają z ofiarą głosem jej przełożonego.
Etap 1 — Wybór celu i rekonesans: Atakujący wybiera firmę i identyfikuje dwie osoby: kogoś o autorytecie (CEO, CFO, prezes zarządu) oraz pracownika z dostępem do finansów lub systemów IT. Przeszukuje LinkedIn, stronę firmową, nagrania z konferencji — wszystko, co da próbkę głosu.
Etap 2 — Przygotowanie materiału: Kilka sekund nagrania trafia do narzędzia do klonowania głosu. Kilkanaście minut później atakujący dysponuje syntetyczną kopią głosu prezesa, która odwzorowuje barwę, rytm mowy, intonację, a nawet charakterystyczne wyrażenia.
Etap 3 — Socjotechnika i presja czasu: Atak poprzedza często e-mail lub SMS: "Za chwilę zadzwonię w pilnej sprawie, proszę odbierz". Następuje telefon — głos prezesa prosi o natychmiastowy przelew na "nowy rachunek zaufanego dostawcy", reset hasła do systemu lub inne działanie wymagające szybkiej decyzji. Presja czasu jest kluczowym elementem — atakujący nie dają ofierze czasu na refleksję ani weryfikację.
Etap 4 — Wariacja: wideokonferencja deepfake: W bardziej zaawansowanych atakach ofiara uczestniczy w całym spotkaniu wideo, gdzie wszyscy uczestnicy oprócz niej to deepfake'i — jak w przypadku ataku z Hongkongu. Ta technika wymagała kiedyś znacznych zasobów. W 2026 roku staje się coraz bardziej dostępna.
Nie istnieje niezawodna metoda rozpoznania deepfake'a wyłącznie na podstawie jakości audio lub wideo — technologia zbyt szybko się poprawia. Jednak pewne sygnały wciąż bywają wykrywalne:
Sygnały w nagraniach audio: Metaliczny lub nienaturalnie gładki dźwięk głosu. Brak charakterystycznych dźwięków oddychania, przerw w mowie, "hm" i "yyy". Rytm mowy zbyt jednostajny, intonacja zbyt przewidywalna. Pogorszenie jakości w momentach emocjonalnych — deepfake radzi sobie gorzej z emocjami.
Sygnały w nagraniach wideo: Nienaturalne zachowanie oczu (zbyt rzadkie mruganie lub brak naturalnych mikroruchów). Rozmyta lub niespójna linia włosów i krawędzie twarzy. Oświetlenie twarzy niezgodne z oświetleniem tła. Problemy z naturalnymi gestami — poproś rozmówcę o machnięcie ręką lub odwrócenie głowy.
Sygnały kontekstowe (najważniejsze): Pilność i presja: "To musi być zrobione teraz, bez czekania na procedury". Prośba o działanie poza standardowym kanałem komunikacji. Inna niż zwykle treść rozmowy — zlecenia finansowe, prośby o resetowanie haseł, zmiany danych kont dostawców. Kontakt z osoby, z którą normalnie nie rozmawiasz bezpośrednio w takich sprawach.
Pamiętaj: nie ufaj nagraniu, ufaj procedurze. Nawet jeśli głos brzmi absolutnie autentycznie — procedura weryfikacji jest obowiązkowa.
Weryfikacja "out-of-band" — kluczowy element obrony: Jeśli otrzymujesz telefoniczne polecenie od przełożonego lub osoby z zarządu — oddzwoń na numer, który masz zapisany w systemie firmy (nie na numer, z którego dzwoniono). Zadzwoń alternatywnym kanałem (SMS, Teams, e-mail na służbowy adres) i potwierdź polecenie. Ta jedna zasada neutralizuje zdecydowaną większość ataków deepfake audio.
Zasada czterech oczu przy operacjach finansowych: Żaden przelew powyżej ustalonego progu kwotowego nie może być autoryzowany przez jedną osobę. Każda zmiana danych konta bankowego dostawcy wymaga weryfikacji przez inny kanał (np. telefon na numer ze starej faktury, nie z nowej prośby). Ta procedura jest prosta, zero-kosztowa i eliminuje scenariusz "przelew na polecenie fałszywego prezesa".
Słowo kodowe dla zarządu: Prosty i skuteczny mechanizm — ustal z kluczowymi pracownikami działu finansowego i IT tajne słowo lub frazę, której żaden deepfake nie będzie znał. Prośba o podanie słowa kodowego to natychmiastowy test autentyczności.
Kontrola ekspozycji głosu i wizerunku w sieci: Ogranicz publicznie dostępne nagrania kadry zarządzającej do niezbędnego minimum. Nagrania webinarów, wywiady podcastowe, filmy z konferencji — wszystkie dostarczają materiału treningowego dla narzędzi klonowania głosu. Nie chodzi o całkowitą rezygnację z obecności online, ale o świadomą decyzję o ekspozycji.
Szkolenia z rozpoznawania deepfake'ów: Pracownicy muszą wiedzieć, że zagrożenie istnieje — i jak reagować. Regularne symulowane ataki (podobne do symulacji phishingu) są najskuteczniejszą formą treningu. Platformy szkoleniowe z cyberbezpieczeństwa takie jak KnowBe4 oferują moduły dedykowane inżynierii społecznej i deepfake'om.
Technologiczne wykrywanie deepfake'ów: Tradycyjny antywirus nie wykrywa deepfake'ów — do tego potrzebne są specjalistyczne narzędzia analizy audio-wideo. Rozwiązania klasy EDR/XDR z modułami analizy behawioralnej mogą wykrywać anomalie w zachowaniu związane z atakami socjotechnicznymi. Ochrona endpoint klasy EDR to fundament, na którym buduje się kolejne warstwy ochrony.
Jeśli podejrzewasz, że właśnie rozmawiałeś z deepfake'iem: Nie wykonuj żadnych działań, o które byłeś proszony. Niezwłocznie skontaktuj się z osobą, pod którą podszywał się atakujący — przez inny, znany Ci kanał. Poinformuj dział IT lub przełożonego. Zachowaj wszelkie ślady kontaktu (numery telefonów, nagrania jeśli je masz, treść SMS-ów).
Jeśli przelew już został wykonany lub dane zostały ujawnione: Natychmiast skontaktuj się z bankiem — im szybciej, tym większa szansa na wstrzymanie transakcji. Zgłoś incydent na Policję i do CERT Polska. Przeprowadź analizę powłamaniową — czy atakujący nie uzyskał dostępu do innych systemów. Wsparcie w analizie incydentu i odtworzeniu bezpieczeństwa to usługa, która pomaga określić pełen zakres kompromitacji.
Deepfake przestał być technologiczną ciekawostką — to dziś realne narzędzie w arsenale cyberprzestępców, dostępne masowo i coraz trudniejsze do wykrycia. Obrona nie polega na nadążaniu za technologią wykrywania (to wyścig, który zawsze będzie za atakującymi), ale na budowaniu procedur i kultury weryfikacji. Firma, w której nikt nie przeleje pieniędzy bez potwierdzenia przez drugi kanał, jest odporna na CEO fraud 2.0 — niezależnie od tego, jak dobry jest deepfake.
Zacznij od najważniejszego: zbuduj procedurę weryfikacji out-of-band dla operacji finansowych, ustal słowo kodowe z kluczowymi pracownikami i przeprowadź pierwsze szkolenie z zakresu deepfake i inżynierii społecznej. Skontaktuj się z nami — pomożemy przygotować Twoich pracowników zanim atakujący to zrobi za Ciebie.