W 2009 r. ukazała się książka Dana Senora oraz Saula Singera o gospodarce Izraela zatytułowana „Start-up nation”. Sukces tej publikacji sprawił, że termin stał się „znakiem firmowym” tego państwa na arenie międzynarodowej. Jednak ostatnimi czasy tempo innowacji w „startupowym, narodzie” wyhamowało. Jak podaje Centrum Badawcze IVC w pierwszym kwartale 2023 r. izraelskie firmy technologiczne zebrały 1,7 mld dol., co oznacza 70 proc. w stosunku do analogicznego okresu ubiegłego roku. Analitycy taki stan rzeczy tłumaczą spowolnieniem gospodarczym, a także sytuacją polityczną. W marcu kraj zalała fala protestów przeciwko kontrowersyjnej ustawie sądowniczej forsowanej przez rząd Benjamina Netanjahu (w Tel Awiwie demonstracje zgromadziły 100 tys. osób). Część inwestorów nie ukrywa, że wstrząsy polityczne przyczyniły się do wstrzymania lub zmniejszenia wielkości inwestycji. 

Przedstawiciele startupów, których spotkałem w Izraelu, są dalecy od euforii, ale absolutnie nie popadają w czarnowidztwo. Chociażby w Hajfie niezmiennie cieszą się z inwestycji wielkich amerykańskich koncernów: w tym trzecim pod względem powierzchni i ludności mieście Izraela, swoje biura badawczo-rozwojowe posiadają Dell oraz Intel. Przy czym, o ile w Tel Awiwie powstaje mnóstwo nowych projektów związanych z oprogramowaniem, o tyle Hajfa stała się ośrodkiem, w którym rodzą się interesujące rozwiązania sprzętowe. Jednym z przykładów jest moduł inteligentnej pamięci UnifabriX. Jego autorem jest startup o tej samej nazwie założony w 2020 r. Założyciele UnifabriX wychodzą z założenia, że największą przeszkodą przy wykonywaniu zaawansowanych obliczeń jest pamięć DRAM. Rozwiązaniem tego problemu ma być CXL (Compute Express Link) – otwarty standard pozwalający procesorom oraz innym układom  (GPU, FPGA, SOC) komunikować się bezpośrednio ze sobą i koordynować proces współdzielenia pamięci.

– Pamięć DRAM jest adresowana wyłącznie do serwera, który ją zawiera. W przeciwieństwie do pamięci masowej nie można jej dzielić pomiędzy kilka serwerów, aby zaspokoić jednorazowe potrzeby w zakresie obliczeń.  Wprawdzie można zastosować rozszerzenia w każdym z  serwerów, ale to się nie opłaca. Natomiast CLX sprawia, że można dzielić DRAM pomiędzy serwerami i jako pierwsi udostępniamy takie komercyjne rozwiązanie – tłumaczy Ronen Hyatt, dyrektor generalny UnifabriX.

Moduł inteligentnej pamięci UnifabriX mieści się w obudowie 2U lub 4U, a jego maksymalna konfiguracja pozwala na wykorzystanie zasobów (DDR5/DDR4, SSD NVMe) o łącznej pojemności 128 TB (przy czym obsługuje  CXL 1.1 oraz CXL 2.0 i jest gotowy na 3.0 plus PCIe Gen 5).

Ciekawe dane na temat wykorzystania pamięci płynną z raportów opracowanych przez tzw. hiperskalerów. I tak według Microsoftu aż jedna czwarta pamięci jest blokowana, zaś w serwerowniach należących do Google’a klastry składające się z serwerów produkcyjnych używają około 40 proc. pamięci DRAM. Przyszłość CLX rysuje się w jasnych barwach, Micron Technologies szacuje, że w 2030 r. ten rynek osiągnie wartość 20 mld dol., w tym 14-17 mld w segmencie pamięci przeznaczonej dla serwerów.

Procesory dla danych

Kolejny godny uwagi startup, o nieco dziwacznie brzmiącej nazwie Pliops, opracowuje procesory zwiększające wydajność bazy danych oraz aplikacji obsługiwanych przez dyski SSD. Przedsięwzięcie to zaczęło się pięć lat temu w miejscowości Ramat Gan, a jego założycielami są Moshe Twitto oraz Aryeh Mergi, od lat związani z segmentem pamięci flash. W ubiegłym roku firma trafiła do zestawienia „The 10 Hottest Data Storage Startups”, opracowywanego corocznie przez amerykańską redakcję CRN-a. Jak do tej pory Pliops zebrał od funduszy venture capital 205 mln dol.

– Dostrzegamy rosnącą lukę pomiędzy możliwościami procesorów a jednostkami pamięci masowych. Reguły gry zmieniły się wraz z debiutem NVMe. Architektura procesorów była opracowywana przed nadejściem tych nośników, w związku z czym nie uwzględnia ich możliwości, a tym samym ogranicza wydajność. To wymaga nowego podejścia, w tym wzięcia pod uwagę aspektów ekologicznych, kosztów, a także gęstości powierzchniowej – tłumaczy Tony Afshary, Global Vice President w Pliops.

Izraelski startup opracował Extreme Data Procesor (XDP), który usprawnia przetwarzanie danych i zarządzanie pamięcią SSD. XPD odpowiada za przepływ danych z aplikacji do pamięci masowej, eliminując tzw. wąskie gardła oraz opóźnienia. Układ Pliops umieszcza się pomiędzy procesorem a warstwą pamięci masowej i współpracuje z dyskami SSD i NVMe podłączonymi bezpośrednio do serwera  lub za pośrednictwem protokołu  NVMe-oF. W ramach XDP oferuje dwa akceleratory: AccelKV, AccelDB. Pierwszy z wymienionych wspomaga silniki pamięci masowej, takie jak RocksDB, WiredTiger, zaś drugi przyspiesza pracę aplikacji MySQL, MariaDB i PostgreSQL. Z kolei RAIDplus pokonuje ograniczenia konwencjonalnych kontrolerów RAID, przyspiesza działanie aplikacji i zapewnia większą wytrzymałość i żywotność dysków SSD. XDP wspiera nośniki NVMe SSD do 128 TB, a w przyszłym roku dostępna będzie wersja 256 TB.

Warto zaznaczyć, że Pliops nie jest pierwszą firmą, która wprowadza na rynek procesor do analizy danych. Również Nvidia sprzedaje jednostkę przetwarzania danych BlueField-3, zaś Marvell opracował  technologię Octeon.

Rurociągi z danymi

Analiza danych w czasie rzeczywistym wzbudza duże zainteresowanie wśród menedżerów czy marketerów, a największą zaletą jest szybkość działania. To oczywiste, bo im krócej firma czeka na dostęp do danych, tym szybciej zrobi nich użytek. Rozwiązania, które pozwalają pracować firmom na najświeższych danych, dostarcza Equalum, założony w 2015 r. startup  z Tel Awiwu, który zebrał od funduszy venture capital 39 mln dol. Opracowana przez Equalum platforma, oprócz integracji danych, realizuje takie zadania jak strumieniowe przesyłanie danych czy zmiana przechwytywania danych (CDC). Ta ostania funkcja polega na rejestrowaniu, śledzeniu i aktualizowaniu zmiany danych w czasie rzeczywistym.

Platforma Equalum łączy dane pochodzące ze środowiska chmurowego i lokalnego, różne interfejsy API, jeziora i hurtownie danych. Ich integracja jest złożonym procesem, tym bardziej, że odbywa się w czasie rzeczywistym. Na liście klientów Equalum znajdują się między innymi Siemens, Warner Bros czy Walmart.

– Nasze rozwiązania najczęściej służą do śledzenia poczynań klientów w czasie rzeczywistym. Dzięki temu sprzedawca wie, co internauta kupuje w sklepie online i może mu natychmiast polecić kolejny produkt – tłumaczy Eyal Perlson, wiceprezes Equalum ds. marketingu.

I znowu, izraelski startup nie jest jedynym, który podjął się tego karkołomnego wyzwania. W ostatnich latach powstało kilka firm (Fivetran, Hevo, Striim) budujących „rurociągi danych”.

Podróże w czasie z LakeFS

Treeverse rozpoczął swoją działalność w styczniu 2020 r. Założycielami firmy są Einat Orr (CEO) oraz Oz Katz (CTO), którzy poznali się w SimilarWeb, znanej firmie zajmującej się analizą ruchu internetowego. Tam też po raz pierwszy spotkali się z problemami, jakie niesie ze sobą praca z dużymi  zbiorami danych i obiektowymi pamięciami masowymi. Czasami nawet niewielki błąd prowadzi do ogromnego zamieszania, a jego odnalezienie, a następnie korekta, może zająć nawet kilkanaście dni. Einat Orr i Oz Katz stworzyli LakeFS, narzędzie open source przekształcające obiektową pamięć masową w repozytorium podobne do Git (rozproszony system kontroli wersji opracowany przez Linusa Torvaldsa). Opracowane przez nich środowisko programistyczne działa w izolacji, ale zespoły IT mogą śledzić ewolucję różnych wersji swoich danych. Programiści potrzebują do działania danych produkcyjnych i często tworzą kompletne kopie różnych migawek lub backupu wykonywanego w różnym czasie. Śledzenie różnic jest trudne, a rozprzestrzenianie się kopii powoduje chaos i wzrost potrzeb w zakresie przechowywania danych.

W rezultacie LakeFS pozwala na zarządzanie danymi w taki sposób, jak zarządza się kodem. Dane źródłowe są przechowywane w zasobnikach obiektów – S3 w AWS, Azure Blob, GCP i MinIO. Przy czym LakeFS tworzy zdeduplikowane metadane, wskaźniki do danych źródłowych oraz zarządza nimi i na nich działa.

LakeFS pozwala podróżować w czasie między poszczególnymi wersjami i cofać się do wersji danych sprzed wyświetlania błędu. Można powiedzieć, że to wehikuł czasu – tłumaczy Einat Orr.

LakeFS może być  przydatny w różnych sytuacjach. Na przykład handlowiec uzmysłowił sobie, że dzień wcześniej popełnił błąd, podając niewłaściwą wartość transakcji. W związku z tym wchodzi do systemu i nanosi poprawkę. Inna sytuacja wiąże się z koniecznością wykonania ponownych obliczeń na rzecz modelu uczenia maszynowego, do czego nieodzowna jest starsza wersja danych.  Użytkownikami LakeFS są Shell, Lockheed Martin, Walmart, Volvo, NASA, Netflix i SimilarWeb. W tym segmencie rynku Treeverse musi konkurować z AWS-em, które dostarcza na rynek Lake Formation Service.