Kiedy pojawił się model ChatGPT 4o zacząłem robić testy tworzenia mniej lub bardziej rozbudowanych aplikacji. Początkowo opartych o Bootstrap, SQL i PHP, ale ostatecznie dzięki zwycięzcy mojego prywatnego plebiscytu Bootstrap zamieniłem na TailwindCSS. W międzyczasie pojawili się Agenci AI i wersja 4.5 więc postanowiłem porównać dostępne narzędzia, które są na każdą kieszeń.
Z pomocą różnych AI stworzyłem sobie kilka aplikacji – największy projekt do zarządzania czasem pracy i grafikami z około 40 niezależnymi modułami crosującymi się między sobą, po mniejsze np. generator rachunku do umowy o dzieło, czy aplikację wysyłającą filmy na mój VideoCDN z generowaniem linków do plików (Ract).

Więc kodowałem zarówno rzeczy oparte tylko o swoje rozwiązania, powiązane z moimi już istniejącymi aplikacjami jak i takie, które wykorzystywały Make do relizowania zadań po przejściu odpowiednich kroków w aplikacji.
Kodowanie i tworzenie aplikacji w ChatGPT (4.5)
To był w zasadzie pierwszy i oczywisty wybór. Wersja bezpłatna oczywiście szybko wyczerpała limity, a więc zacząłem tworzyć w wersji Plus (20usd). I do prostych, niezbyt złożonych aplikacji pisanych od zera nie mam się do czego przyczepić, problemy zaczynają się później, ale największą zaletą narzędzia od OpenAI jest możkliwość generowania gotowego pliku ZIP — choć im bardziej złożona aplikacja tym gorzej sobie z tym radzi.
Niestety — ChatGPT bardzo szybko gubi wątek i przy bardziej złożonych projektach gubił ustalone zasady pisania kodu, dostarczał tylko fragmenty do podmiany, albo zmieniał dowolnie nazwy funkcji lub tabel w bazie danych.
Szybko odpuściłem, bo w pewnym momencie chciałem na niego wrzeszczeć i miałem ochotę wyrzucić komputer przez okno.
Z prostymi aplikacjami, które mają wykonać konkretne zadanie sobie radzi bez problemu. Tak powstał np. system do porównywania danych z systemu A (CSV) do paragonów fiskalnych, aby sprawdzać, czy na pewno jest wszystko wystawione.

Ostatecznie na dłuższą metę w podstawowym planie niezbyt się nadaje do większych projektów.
Na plus jest, że potrafi całkiem dobrze zorganizować kod (np. custom wtyczek WordPress), zrobić do niego opisy, komentarze oraz instrukcje, ale tutaj akurat z tym radzi sobie na tym samym poziomie co pozostali rywale.
Kodowanie i tworzenie aplikacji w Perplexity
Początkowo myślałem, że to będzie zwycięzca. Otrzymałem roczny dostęp do wersji PRO, a więc ją testowałem bardzo intensywnie i to tutaj zacząłem tworzyć moją aplikację wielomodułową — bez problemu stworzyłem tutaj w pełni działający MVP choć nie wyglądał on jakość pięknie.

Choć też bywa, że gubi wątki, pomyli jakieś nazwy funkcji czy chce pobierać dane z nieistniejących tabel w bazie to jednak stworzył działający mechanizm grafikowy, system uprawnień (docelowo dla wielu lokalizacji oraz przydzielonych do niej pracowników), ogłoszeń, urlopów, generowanie plików (csv, excel, ewidencji do podpisu, plik kalendarza).
Dużym plusem jest to, że pomimo naprawdę intensywnych prac nigdy nie powiedziało mi „mam na dziś dość, wróć jutro”… lub za tydzień jak w ChatGPT 4.5 (nawet w wersji Plus te limity tam są tragiczne).
Z minusów na pewno trzeba wskazać konieczność kopiowania plik po pliku z tekstu. Nie wygeneruje końcowego zipa – trzeba ręcznie przeklejać, aby dodać na serwer, czy coś zmienić. Drugi to na pewno korzystanie ze „skrótów” — mimo instrukcji do przestrzeni, że ma generować całe pliki zawsze to co jakiś czas zdarza mu się wysłać „Podmień to na to” lub wysłać cały plik, ale z komentarzem „tu logika dla…”
I tu porada – aplikacje tworzysz w przestrzeniach, jak wątek stanie się za długi to masz opcje dodania rozmowy jako plik do niej i z każdym pytaniem będzie analizować załączniki w tym poprzednie rozmowy.

Gemini PRO — król może być tylko jeden
Okazało się, że jeżeli posiadam stary plan Google Workspace to Gemini w wersji PRO mam w cenie swojej licencji (podniesione limity w usługach Gemini oraz szybciej dostępne nowe funkcje, niż na darmowym koncie osobistym lub Google One), no więc postanowiłem przetestować. I moje zaskoczenie było ogromne. Od tworzenia makiet dla aplikacji (działających mockupów w react), po aplikacje (w tym przebudowana napisanej w Perplexity wcześniej) i redesign – zobacz np. jak wygląda jeden z modułów grafikowych po zmianie przez Gemini… dużo ładniej i przejżyściej (dzięki TailwindCSS).

W Gemini stworzyłem też np. generator rachunków do umowy o dzieło — tutaj przykładowy rachunek wygenerowany z pomocą aplikacji do wystawiania rachunków do umowy o dzieło stworzonej w około 2h i integracją z moim systemem zleceń oraz hurtownią danych biznes.gov.pl (pobieranie danych zleceniodawcy po NIP).
Limity w Gemini 2.5 Pro są na tyle nieuciążliwe, że spokojnie można pracować kilka godzin, a potem poczekać kilka godzin i znów można pracować.
Niestety dalej trzeba pliki kodować krok po kroku, ale tutaj możemy sobie na spokojnie zrobić najpierw canvas w HTML z makietą, a potem opisać jak te makietę użyć w projekcie.
Cena Gemini dla kont osobistych to niecałe 100zł za miesiąc, ale dla Google Workspace wersja z podniesionymi limitami jest w cenie co oznacza, że stare konta płacą około 10 Euro za użytkownika domeny firmowej, lub w nowszych cennikach około 60zł za użytkownika – Gemini w pełnej wersji jest dostępny w cenie. Dodatkowo zyskujemy dostęp do NotebookLM przez co możemy tam tworzyć sobie całą dokumentację projektu. Minus Gemini (i NotebookLM) w wersji Workspace to zablokowanie szybkiego udostępniania poza domenę co może być problematyczne dla niektórych.
Z minusów w zasadzie mogą tylko powiedzieć o tym, że nie możemy pobrać pliku ZIP (czyli znów plik po pliku trzeba kopiować) lub wgrać aplikacji z dysku Google, a jedynie z repozytorium Github (wymaga to udostępnienia jej publicznie).
Mimo wszystko dla mnie Gemini 2.5 PRO w porównaniu do ChatGPT 4o i 4.5 lub Perplexity jest najlepszym rozwiązaniem, Można też użyć Perplexity do stworzenia makiety, a potem do jej głębszej przebudowy zaciągnąć do pracy Gemini.
Różnice Gemini na koncie osobistym vs koncie Google Workspace:
Wspominałem o ograniczeniach w Workspace i poniżej opiszę to nieco szerzej.
Na koncie osobistym Canvas można udostępniać linkiem, jeżeli stworzymy np. sobie makietę aplikacji mobilnej (w React) to wystarczy wysłać klientowi link do podglądu. Jeżeli stworzymy ją na koncie organizacji to możemy tylko skopiować kod i możemy go udostępnić sami przez swój serwer lub AppScript (script.google.com).
Ale najważniejsza różnica — to o czym piszecie z Gemini na koncie organizacji nie jest wykorzystywane do trenowania modeli!
Oto stopki dla konta organizacji i konta osobistego:


Dla mnie zdecydowanym zwycięzcą jest Gemini. Ma swoje limity, ale nie tak irytujące jak ChatGPT, ale jego Pełna płatna wersja w ramach Google Workspace (Licencja typu Ultra — praktycznie znosząca limity) jest zdecydowania droższa, niż inne modele – ponad 200 Euro za użytkownika miesięcznie.
Mimo wszystko wersja zawarta w planach dla kont osobistych i wbudowana w Workspace wystarczy i tylko nieliczni (a raczej wielkie korporacje i firmy) będą zainteresowane płaceniem za wersję Ultra.
Czy teraz każdy może stworzyć aplikację bez uczenia się programowania?
I tak i nie. W zasadzie, aby dobrze pisać prompty dla sztucznej inteligencji, mimo wszystko trzeba znać choćby podstawy języków i podstawowe ich frameworki, aby było to efektywne. W końcu musimy umieć w miarę technicznie opisać w pierwszej wiadomości czego oczekujemy od Aplikacji, jakie są podstawowe założenia, funkcje, zależności i wyjątki.
Oczywiście dla osób, które uczą się programować to też dobra droga do podnoszenia swoich umiejętności, a niektóre zawierają nawet tryby wspomagające naukę (w Gemini jest np. Gem „Pomocnik w programowaniu”):

Im więcej umiejętności w klasycznym programowaniu posiadasz, tym lepsze wyniki będziesz w stanie uzyskać kodując z pomocą dowolnego narzędzia sztucznej inteligencji.
Jednym zdaniem: Dowolny Agent czy algorytm AI programujący i piszący kod jest jak Junior Developer w dowolnej agencji. Bez nadzoru i kontroli oraz doświcaczenia Seniora dostaniemy w najlepszym razie „poprawny” kod spełniający minimalne wymagania.