Czym właściwie jest LLM?

LLM (Large Language Model) to nie kolejny nudny skrót technologiczny - to prawdziwa rewolucja w świecie AI. Wyobraź sobie asystenta, który przeczytał praktycznie wszystko, co zostało opublikowane w internecie. Od Wikipedii, przez naukowe publikacje, po posty na forach internetowych. Teraz taki asystent stara się przewidzieć, co powinieneś napisać dalej, bazując na tym, co widział wcześniej. Weźmy na przykład GPT-4, który posiada ponad 1.76 biliona parametrów – to więcej niż liczba gwiazd w naszej galaktyce! Każdy kolejny model uczy się na jeszcze większych zbiorach danych, co pozwala mu generować coraz bardziej dopracowane odpowiedzi.

Sztuczna inteligencja to… statystyka na sterydach

Choć fraza „sztuczna inteligencja” brzmi jak coś z filmów science-fiction, w rzeczywistości jest to zaawansowana statystyka w akcji. Twój ulubiony ChatGPT stanowi skomplikowany kalkulator prawdopodobieństwa. Gdy napiszesz „Dzisiaj jest piękna…”, model analizuje miliardy podobnych zdań, które widział podczas treningu, i oczywiście dokończy słowem „pogoda” (nawet jeśli za oknem dzisiaj pada). To trochę jak gra w „dokończ zdanie” z zawodowym słowotwórcą.

Tokeny – waluta świata AI

Tokeny to podstawowa jednostka, którą operują modele językowe. Mogą one oznaczać pojedyncze litery, całe słowa, lub ich fragmenty. Na przykład:

hamburger może zostać rozbity na tokeny: ["ham", "bur", "ger"]
artificial dzieli się na: ["art", "ific", "ial"]
intelligence – na: ["intel", "lig", "ence"]

Dlaczego to takie istotne? Ponieważ właśnie tokenami płacimy za korzystanie z usług AI! Spójrzmy na konkretne liczby:

GPT-4o około $5 za milion tokenów
o1: około $40 za milion tokenów

Różne języki również wpływają na liczbę tokenów – język polski generuje więcej tokenów niż angielski dla tego samego tekstu, ponieważ nasze słowa bywają dłuższe i bardziej złożone. Na przykład słowo „konstantynopolitańczykowianeczka” to prawdziwe wyzwanie dla tokenizera!

Jak policzyć tokeny?

Oto prosty sposób na oszacowanie liczby tokenów:
• W języku angielskim zazwyczaj 1 token odpowiada około 4 znakom.
• W języku polskim 1 token to około 3-3.5 znaku.

Przykład:
Zdanie „AI zmienia świat biznesu” to około 6–7 tokenów, podczas gdy angielskie „AI is changing the business world” może składać się z 7–8 tokenów. Narzędzia takie jak tokenizer OpenAI umożliwiają sprawdzenie dokładnej liczby tokenów w każdym tekście.

Jak działa sieć neuronowa?

Wyobraźmy sobie najprostszą możliwą sieć neuronową jako sympatycznego zwierzaka, który uczy się reagować na dwa bodźce. Rozważmy poniższy przykład:

Input 1: “Kot” lub “Pies”
Input 2: “Je” lub “Robi”

Nasz zwierzak musi wybrać odpowiednią reakcję:

Kot + Je = “Mleko”
Pies + Je = “Kości”
Kot + Robi = “Miau”
Pies + Robi = “Hau”

To oczywiście bardzo uproszczony przykład. W rzeczywistości nowoczesne sieci neuronowe mają miliardy parametrów, co pozwala im na znacznie bardziej skomplikowane operacje. Analogia do ludzkiego mózgu jest tu nieco myląca – nasz mózg składa się z miliardów neuronów, a tak zwanego „sztucznego mózgu” (jak GPT-4) używa liczby parametrów sięgającej setek miliardów, by “nauczyć się” języka na podstawie ogromnych zbiorów danych.

Dlaczego AI czasem się myli?

Wróćmy do naszego przykładu z liczeniem liter ‘R’ w słowie “STRAWBERRY”. AI nie postrzega tekstu jak my – nie widzi liter, tylko ciągi tokenów, które mogą dzielić słowo w nieoczywisty sposób, na przykład jako ["ST", "RAW", "BERRY"]. Gdy prosisz o policzenie liter, musi najpierw złożyć te tokeny razem, a dopiero potem przeprowadzić analizę. To trochę tak, jakby próbować policzyć ziarenka ryżu, patrząc przez szybkę – teoretycznie możliwe, ale łatwo o pomyłkę. Dodatkowo, AI może nie zawsze rozumieć kontekst kulturowy lub subtelności językowe, co prowadzi do błędów, które dla nas wydają się absurdalne.

Co dalej i jak możemy pomóc?

Świat AI rozwija się w zawrotnym tempie, a największe modele językowe stają się coraz potężniejsze. GPT-4 z ponad 1.76 biliona parametrów to dopiero początek - firmy takie jak Anthropic czy Google pracują nad modelami, które mają przekroczyć barierę 10 bilionów parametrów. Te gigantyczne sieci neuronowe wymagają ogromnej mocy obliczeniowej - pojedyncze zapytanie do GPT-4 może kosztować tyle energii, co przejechanie kilku kilometrów samochodem elektrycznym.

Jednak prawdziwa rewolucja nadchodzi ze strony “małych AI”. Naukowcy odkryli, że można stworzyć modele językowe, które mają zaledwie 1% parametrów swoich większych kuzynów, ale zachowują znaczną część ich możliwości. Takie “odchudzone” wersje AI, jak Llama 2 czy Mistral 7B, potrafią działać na zwykłym laptopie, a nawet… smartfonie.

W ciągu najbliższych 2-3 lat możemy spodziewać się przełomu - AI na miarę wczesnych wersji ChatGPT będzie dostępne lokalnie na naszych telefonach. Bez połączenia z internetem, bez wysyłania danych na zewnętrzne serwery. Wyobraź sobie osobistego asystenta, który działa błyskawicznie, dba o twoją prywatność i nie wymaga miesięcznego abonamentu. To nie science fiction - to najbliższa przyszłość.

Jeśli zastanawiasz się, jak wykorzystać potencjał AI w swojej firmie, mamy dla Ciebie konkretne rozwiązania. Oferujemy szkolenia z AI w praktyce dla firm, które pozwolą Twojemu zespołowi skutecznie wdrożyć nowoczesne narzędzia, a także doradztwo w zakresie wdrażania AI dla małych firm, które pomaga zoptymalizować procesy, zwiększyć efektywność i obniżyć koszty.

Czy ten artykuł został napisany przez AI? A może przez człowieka korzystającego z AI? Daj znać co myślisz!

Jeżeli interesuje Cię, jak AI rewolucjonizuje niemal każdą branżę – od medycyny, przez przemysł, finanse, kreatywność, aż po edukację – oraz jeśli jesteś ciekaw, jak nasze szkolenia i doradztwo mogą pomóc Twojej firmie wykorzystać pełen potencjał nowoczesnych technologii, skontaktuj się z nami. Pomożemy Ci wprowadzić innowacyjne rozwiązania, które przeniosą Twoją działalność na zupełnie nowy poziom!