Poznámka: Následující článek vám pomůže: Leaked LLaMA odhaluje sílu open source pro AI
Výzkumný tým společnosti Meta v oblasti umělé inteligence si vybudoval pozitivní reputaci pro své modely s otevřeným zdrojem – nejnovější je LLaMA, s modelovými váhami dostupnými pro akademiky a výzkumníky případ od případu. Jedna z těchto stran však kód unikla na GitHub, což vývojářům po celém světě poskytlo otevřený přístup k jejich prvnímu LLM na úrovni GPT.
Vývojářská komunita má od té doby s tímto modelem poledne, optimalizovala jej pro provoz na zařízeních s nejnižší spotřebou, přidala do modelu funkce a dokonce jej použila k vytvoření některých nových případů použití pro LLM. Open source komunita je největším multiplikátorem pro výzkum AI a vývojáři jsou toho důvodem.
Optimalizace modelu
Když byla spuštěna LLaMA, budoucí nadšenci LLM zjistili, že pro provoz 7 verzí modelu s miliardami parametrů je zapotřebí více než 16 GB paměti VRAM. Rychle však našli způsoby, jak snížit množství paměti potřebné pro model. Prvním krokem k optimalizaci modelu byl komunitní projekt známý jako LLaMA.cpp, který přepsal model do C++.
To spolu s úsilím komunity o kvantování hmotností umožnilo modelu běžet na široké škále hardwaru. Vývojáři se dokonce podařilo spustit model 7B na Google Pixel 5 generujícím 1 token za sekundu. llama.cpp byl poté portován na Rust, což umožnilo rychlejší odvození CPU, ale komunita teprve začínala
Výzkumníci ze Stanfordské univerzity vytvořili další model – vyladěný na základě LLaMA 7B. Pomocí více než 50 000 ukázek GPT podle instrukcí 3.5 byli vědci schopni trénovat LLaMA, aby produkovala podobné výsledky jako model OpenAI. A co víc, model s názvem Alpaca měl náklady na školení a odvození pouhých 600 dolarů – mnohem méně než miliony dolarů potřebné k výcviku těchto modelů.
Alpaka znamenala demokratizaci LLM a přinesla LLaMA masám. Snížením nákladů na jemné doladění na několik stovek dolarů a vytvořením modelu s otevřeným zdrojem svěřila Alpaca moc LLM do rukou vývojářů z celého světa a přiměla je, aby do tohoto LLM přidali některé funkce.
Jedinečné případy použití
Jakmile byl model otevřen a výzkumníci začali využívat sílu Alpaca, vývojáři a programátoři začali vidět případy použití tohoto LLM. Ačkoli to začalo pomalu, když vývojář použil Alpaca k vytvoření bota Homera Simpsona, model brzy začal vidět mnoho užitečných aplikací.
Uživatel ‘LXE’ na GitHubu vytvořil jednoduché webové rozhraní, které umožnilo komukoli v komunitě doladit model pomocí vlastního textu. Podobně uživatel ‘Sahil280114’ také vytvořil vyladěný model generování kódu z Alpaca, nazvaný CodeAlpaca. Llama Index, projekt pro připojení LLM k externím datům, také přešel z používání GPT na používání LLaMA kvůli své povaze open source.
Dalai byl spuštěn jako snadný způsob, jak spustit jak Alpaca, tak LLaMA na jakékoli platformě pouhým příkazem, což dále snižuje bariéru vstupu pro LLM. Další model s názvem GPT4All je postaven na dědictví Alpaky. To bylo trénováno na přibližně 800 000 GPT generace 3.5, což dále zvýšilo sílu LLaMA. Případy použití stále přicházely.
Colossal-AI vytvořila alternativu ChatGPT tréninkem LLaMA pomocí posilovacího učení s lidskou zpětnou vazbou a komunita vytvořila Llamahub, aby sledovala všechny způsoby, jak se připojit k modelu. Nejlepší na tom je, že se to všechno stalo do 1 měsíce od vydání modelu, což ukazuje skutečnou sílu komunity open source.
Open source dělá práci
Nejen, že komunita stavěla a vylepšovala model publikovaný Meta, ale také vytvořila spoustu případů použití – to vše z jediného LLM. I když mohou být LLM právě teď šílené, jsou jen jedním typem modelu v rozsáhlém prostředí umělé inteligence. Podobně jako u LLaMA byl dalším modelem, který si získal uživatele, komunitu a různé pobočky, Stable Diffusion.
Zatímco vzestup open source Stable Diffusion vyžaduje vlastní esej, stačí říci, že tento model je pro vývojáře primární možností generování obrazu. Stačí se podívat na počet rozvětvení stránky Stable Diffusion GitHub – více než 7 600 v době psaní tohoto článku – a uvidíte, jaký dopad má tento model šíření na komunitu open source.
Jak se modely zvětšují, stávají se dražšími a hůře se trénují, což centralizuje sílu LLM do velkých technologických společností, jako jsou OpenAI, Microsoft, Google a Meta. Vzhledem k tomu, že modely jsou open source, více energie jde do komunit, které vytvářejí produkty na těchto výkonných modelech, což v konečném důsledku pokládá základy pro svobodný svět umělé inteligence.
