Full-stack NLP / 2024
CrimsonGPT
Full-stackowy eksperyment z małym modelem językowym przed fazą fine-tuningu.
Case study
Od problemu do działającego systemu.
Problem do rozwiązania
Chciałem zrozumieć, jak wygląda zbudowanie produktu wokół małego modelu językowego, zamiast tylko używać gotowego API.
Co zbudowałem
Zbudowałem aplikację full-stack z interfejsem czatu i fundamentem pod dalszy eksperyment z modelem.
Architektura
Projekt traktuje model jako część produktu: użytkownik widzi prosty interfejs, a pod spodem projekt może ewoluować wraz z treningiem i fine-tuningiem.
Moja rola
Samodzielne połączenie części produktowej, UI i eksperymentalnego zaplecza NLP.
To są miejsca, gdzie projekt naprawdę testował myślenie.
- 01
Połączenie eksperymentu ML z produktem webowym.
- 02
Projektowanie UI dla rozmowy z modelem.
- 03
Praca z niepełnym, eksperymentalnym zakresem projektu.
Potrafię budować produkt wokół technologii, której dopiero się uczę.
Umiem łączyć research, UI i wdrażalny kod.
Projekt zbudowany ręcznie przed erą powszechnego AI-assisted codingu. Pokazuje samodzielne rozumienie problemu, debugowanie i dowożenie bez gotowych odpowiedzi z narzędzi AI.
Następny krok
Masz podobny problem do dowiezienia?
Napisz krótko, co chcesz zbudować. Najpierw uporządkuję problem, potem zaproponuję sensowną architekturę i pierwszy działający zakres.