Słowniczek terminów: AI piosenki, muzyka generatywna, suno — kompletny glossary
AI piosenka, suno, BPM, mastering, vocal layer, generative AI, prompt engineering... Świat AI music ma swoją terminologię. Ten słowniczek wyjaśnia 50 najważniejszych terminów po polsku.
Format: każdy termin → krótka definicja + practical context (jak używamy w piosenka.ai).
Podstawy AI music
AI piosenka
Utwór muzyczny stworzony przez modele sztucznej inteligencji. W kontekście piosenka.ai: spersonalizowana piosenka z imieniem konkretnej osoby + jej historią, generowana w 15-30 minut.
Generative AI
Sztuczna inteligencja która tworzy nowy content (tekst, obraz, muzyka, wideo) — w odróżnieniu od AI klasyfikującej (rozpoznawania obrazów, klasyfikacji emaili). Nasz model = generative AI dla muzyki.
Suno
Najpopularniejszy model generative AI dla muzyki w 2024-2026. Polska wersja (Suno v4 + custom training) jest podstawą piosenka.ai.
Udio, MusicGen, Stable Audio, Riffusion
Inne modele generative music. Udio — alternatywa dla Suno. MusicGen (Meta) — text-to-music. Stable Audio (Stability AI) — open-source. Riffusion — diffusion-based, eksperymentalny.
Prompt engineering
Sztuka pisania promptów (instrukcji) dla AI tak, by output był optymalny. W piosenka.ai twoja „historia" jest właśnie prompt. Im lepiej napisana, tym lepsza piosenka.
Lyrics generation
Część AI która generuje tekst piosenki. Bierze twoją historię + styl + strukturę i tworzy zwrotki + refren. Polski lyrics generation jest wymagający (rymy, idiomy, kontekst).
Vocal synthesis
Część AI która „śpiewa" tekst. Model trenowany na wokalu polskich artystów + corrupted voice samples. Output = naturalny polski wokal z poprawnym akcentem.
Music composition
AI która komponuje muzykę (melodia, akordy, rytm) zgodnie z gatunkiem. Pop ballad ma inny BPM niż disco polo, jazz ma inne harmonie niż rock.
Mastering (automatyczny)
Finalna optymalizacja brzmienia: equalizer, compression, balance. AI robi to automatycznie, ale jakość matchuje studio profesjonalne.
Format pliku audio
MP3
Najpopularniejszy format audio. Compressed lossy. piosenka.ai dostarcza MP3 320 kbps (najwyższa jakość MP3).
WAV
Format uncompressed lossless. Większy plik (~10x MP3) ale brak kompresji. piosenka.ai NIE oferuje WAV (większość użytkowników nie potrzebuje, MP3 320 kbps wystarczy do studia).
WebM (VP9)
Modern format video container. Nowsze browsers wspierają, lepsza compression niż MP4. piosenka.ai używa WebM dla teledysków (smaller file size).
MP4
Najpopularniejszy format video. piosenka.ai dostarcza MP4 dla teledysków + karaoke wersji.
Audio codec
Algorytm kompresji audio. MP3 = MPEG-1 Audio Layer III. AAC = Advanced Audio Codec. Opus = modern open-source.
Bitrate
Ilość bitów/sekundę. Mówi o jakości. 128 kbps = średnia jakość. 192 kbps = dobra. 320 kbps = najwyższa MP3 (piosenka.ai standard).
Parametry muzyczne
BPM (Beats Per Minute)
Tempo piosenki. 60-80 = ballad slow. 90-110 = mid-tempo pop. 120-130 = dance/disco polo. 140+ = electronic high-energy.
Tonacja (key)
Tonika (centrum harmoniczne) piosenki. C-dur, A-moll, D-dur etc. AI wybiera automatycznie pod styl.
Aranżacja
Sposób organizacji elementów piosenki — które instrumenty grają w której części. piosenka.ai daje 2 wersje aranżacji: subtle (minimalistyczna) + rich (pełna).
Refren (chorus)
Powtarzający się fragment piosenki — najbardziej zapamiętywalny. W piosenka.ai imię odbiorcy jest zwykle w refrenie 4-6 razy.
Zwrotka (verse)
Fragment opowiadający historię (przed refrenem). W piosenka.ai zwrotki zawierają konkretne wspomnienia, miejsca, daty.
Bridge
Sekcja środkowa piosenki, kontrastująca z refrenem i zwrotką. Często emotional climax. AI generuje bridge automatycznie dla utworów >3 minut.
Hook
Catchy element piosenki — melodyjna linia, którą zapamiętujesz. Może być w refrenie (najczęściej) lub w bridge.
Wokal i instrumenty
Vocal layer
Warstwa wokalna w produkcji. Może być solo (1 głos) lub multilayered (chórek + lead). piosenka.ai używa lead + opcjonalnie chórek.
Polish vocal model
Model AI specyficznie wytrenowany na polskim wokalu. Poprawnie wymawia ą, ć, ę, ł, ń, ó, ś, ź, ż + polski akcent.
Range vocal
Zakres skali wokalu (od najniższej do najwyższej nuty). AI dostosowuje do gatunku i typu głosu (męski/żeński).
Instrumenty (samples)
AI używa próbek prawdziwych instrumentów (gitara akustyczna, fortepian, perkusja, syntezator). NIE generuje brzmień od zera — używa biblioteki samples.
Mixing
Łączenie wszystkich warstw audio (wokal + instrumenty + efekty) w jeden balansowany utwór. AI mix jest automatyczny.
Gatunki muzyczne (genre)
Pop ballad
Slow tempo (70-90 BPM), emocjonalny refren, fortepian + smyczki. Najpopularniejszy gatunek na piosenka.ai (~40% zamówień).
Disco polo
Polski gatunek z lat 90/2000. Syntezatory, prosty rytm, melodyjny refren z imieniem powtórzonym 4-6x. Dla pokolenia 50-80.
Akustyczna ballada
Gitara akustyczna + delikatny wokal, minimum innych instrumentów. Klimat „intymny", świece, kawa, jesień.
Jazz klasyczny
Saksofon, fortepian, kontrabas, swingowy rytm. Klimat lat 50-60. Dla babć/dziadków pamiętających Annę German, Mieczysława Fogga.
Rock
Gitary elektryczne, bębny, mocny wokal. Polski rock 80/90 (Lady Pank, Maanam, Republika) lub współczesny.
Country
Akustyczne instrumenty + banjo + ciepły wokal. Brzmienie amerykańskie. Dla fanów dalekich podróży, motoryzacji.
Indie pop
Alternative pop, mniej radiowy, bardziej autorski. Sanah, Brodka, Daria Zawiałow style.
Folk
Akustyczne instrumenty + harmonijne wokale + klimat „pod jabłonią". Dla osób z mniejszych miejscowości.
Soul / R&B
Silny ekspresyjny wokal + gładkie aranżacje. Aretha Franklin (soul), Adele (R&B). Dla romantycznych okazji.
Lo-fi
Spokojne beaty + jazz/R&B sample. Chillout, do nauki, do pracy. Dla młodszych odbiorców, studenckiej grupy.
Pakowanie i dostarczanie
PDF Karta
Drukowalna karta z tekstem piosenki + okładką + dedykacją. Add-on +5 zł w piosenka.ai. Idealna dla osób które wolą fizyczny artefakt.
Karaoke MP4
Wersja video z napisami zsynchronizowanymi z melodią. Add-on +9 zł. Idealna na imprezy (wesele, urodziny).
Teledysk
Film wideo z waszymi zdjęciami zsynchronizowany z muzyką. Add-on +9 zł. AI Vision (Veo 3) animuje przejścia, dodaje efekty.
Ożywione zdjęcia (Veo 3)
AI animacja zdjęć — postaci ze zdjęć „poruszają się", uśmiechają, machają. Technologia Veo 3. Add-on +19 zł. Unikat na rynku PL.
Prawa autorskie i licencja
Copyright (prawa autorskie)
W Polsce: prawa autorskie do AI-generated piosenki należą do zamawiającego, nie do AI. piosenka.ai NIE zatrzymuje praw — możesz używać prywatnie i komercyjnie.
Royalties
Tantiemy z odtwarzania komercyjnego (Spotify, YouTube monetization). Twoja piosenka, twoje royalties.
AI-generated content disclosure
Niektóre platformy (YouTube od 2024) wymagają oznaczenia „AI generated content" przy publikacji. Standard, nie ograniczenie.
Moral rights (prawa osobiste)
W Polsce: artysta zachowuje prawa osobiste (atrybucja, integralność) nawet po sprzedaży copyright. AI NIE jest „artystą" w sensie prawnym.
Tech terms (dla zainteresowanych)
Latent space
Wewnętrzna przestrzeń modelu AI gdzie reprezentowane są utwory muzyczne. Generowanie = nawigacja w tej przestrzeni.
Diffusion model
Typ AI architecture używany w niektórych music generation models (np. Riffusion). Działa odwrotnie — od noise do clean audio.
Transformer
Architektura AI używana w lyrics generation (GPT-style). Sequence-to-sequence learning.
Fine-tuning
Dodatkowe trenowanie pre-trained modelu na specyficznych danych (np. polski wokal, polski lyrics). piosenka.ai używa fine-tuned models.
Inference time
Czas potrzebny AI na wygenerowanie outputu. piosenka.ai: ~5-10 minut inference + queue + delivery = total 15-30 min user-facing.
GPU compute
Resource potrzebny do AI generation. Każda piosenka „kosztuje" pewną ilość GPU compute. Stąd cena usługi.
Model size
Liczba parameters w modelu. Suno v4 ~5B parameters. Większy model = lepsza jakość ale wolniejszy + droższy.
Stwórz swoją piosenkę
Słownik to teoria. Praktyka? Stwórz spersonalizowaną piosenkę w 15 minut, od 59 zł.
Albo kontynuuj research:
Stwórz piosenkę pełną emocji
Od 59 zł · gotowa w 15 min. Bez wychodzenia z domu, od 59 zł.
Stwórz piosenkę 🎵