W 2014 roku David Wilson, Ross Douglas i Alex Leibhammer założyli startup Cape Networks, który opracował rozwiązanie do monitorowania i optymalizacji sieci Wi‑Fi. Cztery lata później firma została przejęta przez HPE, a jej produkt zintegrowano z platformą Aruba NetInsight.

Założyciele nie związali jednak swojej przyszłości z HPE. Zamiast tego rozpoczęli prace nad nowym projektem — Hunch, narzędziem do automatyzacji pracy z wykorzystaniem sztucznej inteligencji. Jak przekonują, ich rozwiązanie jest wyjątkowe.

— Dopiero niedawno nowej generacji modele językowe zaczęły zauważalnie wspierać pracę umysłową. Nie chodzi jednak o pełne zastąpienie człowieka, bo technologia nie jest jeszcze na tym etapie, ale o eliminację tzw. busy work, pracy dla samej pracy, która odciąga nas od naprawdę istotnych zadań — wyjaśnia David Wilson, CEO Hunch.

Automatyzacja sama w sobie nie jest nowym zjawiskiem, jednak dotychczas stosowane narzędzia często zawodzą. Adam Wilson zwraca uwagę na popularne dziś rozwiązania, takie jak platformy low-code oraz ChatGPT. Jak zauważa, choć narzędzia low-code umożliwiają budowanie przepływów pracy, to są one złożone, trudne do utrzymania i mają stromą krzywą uczenia się.

— Każda taka automatyzacja to jednorazowa „śnieżynka”, stworzona pod konkretny przypadek. Trudno ją przenieść lub udostępnić innym osobom w organizacji — podkreśla Adam Wilson.

W praktyce wielu pracowników próbuje automatyzować zadania, korzystając z tzw. GPT Hack, czyli kreatywnego lub nietypowego wykorzystania modeli językowych, takich jak ChatGPT, Claude czy Gemini, do usprawniania codziennych obowiązków. Jednak tego typu podejście sprowadza się zwykle do ręcznego „kopiuj-wklej”, ale nie jako w pełni zautomatyzowany proces działający 24 godziny na dobę.

— Celem automatyzacji nie jest wykonanie zadania jednorazowo, lecz jego opisanie, uruchomienie i powtarzanie, bez konieczności angażowania człowieka. Problem żmudnych, powtarzalnych zadań polega na tym, że mimo ich „delegowania”, wciąż musimy się nimi zajmować — tłumaczy Adam Wilson.

Założyciele Hunch są zdania, że skuteczny system automatyzacji w firmie powinien spełniać trzy kluczowe warunki. Po pierwsze, zamiast budowania złożonych schematów czy pisania kodu, zadanie powinno dać się opisać w prostym, naturalnym języku, np.: „Codziennie o 8:00 wejdź na strony konkurentów A, B, C, sprawdź ceny produktów X, Y, Z i porównaj je z poprzednim dniem”.

Po drugie, zamiast sztywnych reguł, lepiej wykorzystać agenta AI, który radzi sobie z błędami (np. jeśli strona jest niedostępna) i potrafi elastycznie zmieniać taktykę, gdy coś pójdzie nie tak — zachowuje się jak człowiek, który szuka rozwiązania, a nie poddaje się przy pierwszym problemie.

Po trzecie, agent AI musi się nieustannie uczyć, zapamiętywać zmiany i odkrywać nowe obszary. W przytoczonym wcześniej przykładzie oznacza to m.in. rozpoznanie nowego konkurenta i automatyczną aktualizację wiedzy w tzw. playbookach, czyli zestawach gotowych schematów działania i procedur wspierających realizację zadań.

Hunch to narzędzie umożliwiające pracę z różnymi modelami AI, działa jak „płótno”, na którym można łączyć modele językowe, generatywne, obrazowe czy API w ramach jednego przepływu pracy. Produkt skierowany jest do zaawansowanych użytkowników, w tym prompt inżynierów. Przykładowe zastosowania to m.in. generowanie treści marketingowych na podstawie danych z LinkedIna, automatyczne tworzenie pluginów do aplikacji (na podstawie zgłoszeń z Discorda) czy codzienne generowanie pomysłów na posty w mediach społecznościowych.

Podczas spotkania z dziennikarzami w San Francisco firma zaprezentowała Overclock — bardziej przystępną wersję swojego rozwiązania z uproszczonym interfejsem. Użytkownik formułuje jedynie intencję, a Overclock automatycznie generuje sekwencję kroków wykonywanych przez agenta AI. W tle system wykorzystuje różne modele AI i dobiera najlepszy z nich do konkretnego zadania. Jeśli wybrany model nie radzi sobie z problemem, system może przekierować zadanie do innego narzędzia lub modelu.Jak podkreślają przedstawiciele Hunch, obecne benchmarki modeli językowych są w dużej mierze mylące i mało przydatne. Większość testów nie mówi niczego istotnego o faktycznej użyteczności modelu — skupiają się raczej na tworzeniu „sympatycznego rozmówcy” niż na rzeczywistej skuteczności.

— Hunch pozwala testować wiele modeli na realnych zadaniach. To trochę jak praca w zespole, po kilku kontaktach wiesz, kto w czym jest dobry – podsumowuje Adam Wilson.