← Home Hołd / Logopedia na autotunie. Jak nowa fala rapu…
7 min
Hołd

Logopedia na autotunie. Jak nowa fala rapu uczyniła z wady wymowy cnotę narodową

podrap.pl
Editor · Promptowy
14.04.2026 Date
7 min Reading time
Ilustracja: PROMPTOWY promptowy.com

Gdyby Mikołaj Rej żył dzisiaj i włączył Spotify Top 50 Polska, prawdopodobnie uznałby, że Polacy nie tyle nie są gęsiami i swój język mają, co raczej stali się stadem cyfrowych gęsi, które dławią się gorącymi kartoflami, próbując jednocześnie rapować pod bit z darmowej paczki sampli. Witajcie w świecie, gdzie dykcja jest obciachem, a Auto-Tune to nie efekt, lecz system podtrzymywania życia dla karier.

Język polski jest trudny. Szeleszczący, pełen zbitek spółgłoskowych, na których łamią sobie języki obcokrajowcy. „W Szczebrzeszynie chrząszcz brzmi w trzcinie” – to zdanie było kiedyś testem na trzeźwość i sprawność aparatu mowy. Dziś, w dobie tzw. new schoolu, brzmiałoby to raczej jak: „W szszszyniee chszsz brmiii w trrr… yuh, yuh, srrrt”. I miałoby milion odtworzeń w dobę.

Jesteśmy świadkami fascynującego zjawiska antropologicznego: regresu ewolucyjnego w czasie rzeczywistym. Homo sapiens potrzebował tysięcy lat, by wykształcić aparat mowy zdolny do precyzyjnej komunikacji. Polski raper potrzebował zaledwie kilku lat, by udowodnić, że do zrobienia kariery wystarczy umiejętność wydawania z siebie dźwięków przypominających jęk godowy cyborga z awarią procesora.

Proteza zamiast talentu

Zacznijmy od technologii. Auto-Tune, wynalazek firmy Antares Audio Technologies, miał pierwotnie służyć do subtelnej korekty fałszu. Miał ratować dobrego wokalistę, który miał gorszy dzień. Cher w „Believe” czy T-Pain użyli go jako efektu stylistycznego – świadomie, celowo, przerysowując go do granic możliwości. To był zabieg artystyczny.

W Polsce Auto-Tune stał się czymś innym. Stał się audialnym makijażem dla beztalenci. Stał się parawanem, za którym można ukryć fakt, że raper nie tylko nie umie śpiewać (co w rapie jest wybaczalne), ale że nie potrafi nawet rytmicznie mówić.

Spójrzmy na postać Young Multiego. To sympatyczny chłopak, król YouTube’a, który postanowił zostać raperem. I chwała mu za przedsiębiorczość. Ale włączając jego wczesne numery (a i wiele obecnych), ma się nieodparte wrażenie, że słuchamy kogoś, kto rapuje przez rurę od odkurzacza podłączoną do syntezatora mowy Ivona. Głos jest tak przetworzony, tak nienaturalnie wygładzony i metaliczny, że przestaje być głosem ludzkim. Staje się instrumentem. I nie byłoby w tym nic złego, gdyby ten instrument miał cokolwiek ciekawego do zagrania. Ale zazwyczaj nie ma.

To jest „trap” – zakrzykną obrońcy. Tak, to jest trap. Gatunek, w którym klimat („vibe”) jest ważniejszy niż liryka. Ale czy „klimat” musi oznaczać, że słuchacz potrzebuje wizyty u laryngologa, by zrozumieć tekst?

Żabson i szkoła „mam kluski w buzi, ale mam też Gucci”

Weźmy na warsztat Żabsona. To artysta, który z „niechlujstwa” uczynił swój znak rozpoznawczy. Jego flow często przypomina serię czkawek przerywanych losowymi okrzykami. Żabson jest mistrzem formy nad treścią. Jego teledyski są kolorowe, ciuchy drogie, produkcja światowa, ale kiedy przychodzi do warstwy werbalnej, dostajemy coś, co brzmi jak bełkot lunatyka.

W numerze „DMT” słyszymy: „Wylewam lean na chodnik / Moje ziomy to są koty / Twoje ziomy to są boty”. Rymy częstochowskie to przy tym poezja szekspirowska. Ale problemem nie jest nawet prostota rymów (o tym w innym artykule), ale sposób ich podania. Słowa są rozciągane, połykane, mielone w ustach jak guma balonowa, która straciła smak godzinę temu.

To celowy zabieg – powiecie. To stylistyka mumble rapu, która przyszła z USA (Lil Pump, Future). Zgoda. Ale w USA mumble rap wyrósł na specyficznym slangowym podłożu języka angielskiego, który naturalnie „płynie”. Przeszczepienie tego na grunt twardego, spółgłoskowego języka polskiego daje efekt karykaturalny. Brzmi to tak, jakby ktoś próbował rapować z paraliżem twarzy po znieczuleniu dentystycznym.

Kizo – sukces mierzony w decybelach i kilogramach

Nie można pominąć fenomenu Kizo. Człowiek-orkiestra, król kabanosów, pizzy i wszystkiego, co da się sprzedać w Żabce. Muzycznie? To jest triumf prostoty posuniętej do granic absurdu. Kizo nie rapuje. Kizo oświadcza. Kizo mruczy. Jego głos, niski i dudniący, zazwyczaj jest tak zmiksowany, że zlewa się z basem w jedną, pulsującą masę dźwiękową.

Gdy Kizo nawija w „Disneyu”: „To nie jest Disneyland / To nie jest Disneyland / Suko to nie jest Disneyland”, robi to z taką emfazą i z tak silnym przetworzeniem wokalnym, że treść (o ile w ogóle tam była) ulatuje. Zostaje tylko dudnienie. To muzyka tła. Muzyka do pjanego bujania się w Uberze. Wymaganie od tego dykcji byłoby jak wymaganie od młota pneumatycznego, by grał Chopina. Ale problem polega na tym, że ten młot pneumatyczny jest teraz głównym solistą w filharmonii polskiego show-biznesu.

Bedoes i emocjonalny wrzask

Z innej strony barykady atakuje nas Bedoes 2115. Tutaj problemem nie jest „mruczenie”, ale emocjonalny rollercoaster, który często kończy się krzykiem, w którym artykulacja umiera na ołtarzu „autentyczności”. Bedoes potrafi rapować technicznie – pokazał to nie raz. Ale w swoich największych hitach (zwłaszcza tych z okresu „Opowieści z Doliny Smoków”) często wchodzi w rejestry płaczliwo-wrzaskliwe.

Auto-Tune w jego przypadku (i całego gangu 2115) jest podkręcony do oporu, tworząc efekt „robota z depresją”. Słowa zlewają się w jeden długi, autotunowy szloch. „Jestem taki sam jak ty / Mam te same sny” – wyje Bedi, a ty zastanawiasz się, czy on śpiewa, czy właśnie ktoś przytrzasnął mu palec drzwiami od studia. To działa na nastolatki – to emocje w czystej formie. Ale z perspektywy warsztatu wokalnego, to jest fonetyczna rzeźnia.

Śmierć spółgłoski, narodziny ad-liba

Co łączy White’a 2115, Oki’ego (w pewnych momentach, choć on akurat potrafi składać), Malika Montanę i setki ich naśladowców? Redukcja roli słowa. Słowo przestało być nośnikiem znaczenia, stało się tylko kolejnym elementem perkusyjnym.

Ważniejsze od wersów stały się tzw. ad-liby. Te wszystkie „skrt skrt”, „yuh”, „ey”, „brrr”, wtrącane między wersami. Często są one głośniejsze i wyraźniejsze niż właściwy tekst. Słuchasz utworu i po trzech minutach w głowie zostaje ci tylko „grrt paw!” Malika Montany, a nie masz pojęcia, o czym była zwrotka. Może o kobietach, może o narkotykach, a może o kursie euro. To bez znaczenia.

Młodzi fani bronią tego zjawiska jak niepodległości. „Liczy się vibe, stary dziadzie” – piszą w komentarzach. „Tekst sobie sprawdzisz na Geniusie”. I to jest klucz do zagadki. Doszliśmy do momentu, w którym muzyka z tekstem stała się zagadką logiczną, którą trzeba rozwiązywać z zewnętrznym źródłem (stroną z tekstami), bo z samego odsłuchu nie da się wywnioskować, co autor miał na myśli.

Koncertowa weryfikacja, czyli „półplayback” to za mało

Ostateczna kompromitacja tej „logopedii na autotunie” następuje na koncertach. Wystarczy pójść na dowolny festiwal hip-hopowy (np. Clout Festival czy Polish Hip-Hop Festival w Płocku), by zobaczyć ten smutny spektakl.

Raper wychodzi na scenę. DJ puszcza utwór. Z wokalem. Czasami nawet z głównym wokalem puszczonym na 100% głośności. Co robi „artysta”? Biega. Skacze. Krzyczy „Zróbcie hałas!”. Czasami doryczy końcówkę wersu. Czasami mruknie coś do mikrofonu, co brzmi diametralnie inaczej niż na płycie, bo na żywo nie ma studyjnego łańcucha efektów, który robi z niego bóstwo.

Widzimy wtedy nagą prawdę: ci ludzie nie potrafią rapować swoich własnych tekstów. Dykcja, która w studiu została sklejona z setek podejść („punch-in”), na żywo nie istnieje. Zostaje zadyszka, bełkot i DJ ratujący sytuację puszczaniem refrenu z taśmy. A tłum? Tłum skacze. Bo przecież nie przyszedł słuchać. Przyszedł po „vibe”.

Epitafium dla polszczyzny

Stara gwardia – Łona, Bisz, Ten Typ Mes czy nawet Sokół – traktowała rap jako zabawę słowem. Dykcja była narzędziem precyzyjnym jak skalpel. Łona potrafi rapować szybko, gęsto, a każde słowo jest słyszalne jak dzwon. Dzisiejsza nowa fala traktuje słowo jak zbędny balast.

To smutne, bo polski rap, który wyrósł z buntu i potrzeby opowiedzenia historii („Jestem Bogiem”, „Ukryty w mieście krzyk”), zamienia się w papkę. W dźwiękową magmę, w której wszystko brzmi tak samo: metalicznie, płasko i niewyraźnie.

Może to znak czasów. Może w świecie TikToka, gdzie uwaga trwa 15 sekund, nie ma czasu na spółgłoski. Spółgłoski to opór. A dzisiaj wszystko ma płynąć gładko („smooth”), bez tarcia. Nawet jeśli oznacza to, że za 10 lat będziemy porozumiewać się już tylko serią melodyjnych stęknięć na Auto-Tunie, a słownik języka polskiego trafi do muzeum obok maszyny do pisania.

Skrt, skrt, amen.


Chcesz następny artykuł? „Gangsterka z Wilanowa” czeka w kolejce, żeby rozjechać bananowych chłopców w kominiarkach.

podrap.pl
Founder · Editor · Promptowy

Piszę o AI i automatyzacji od 3 lat. Prowadzę promptowy.com.

More →