Self-Hosted AI Email: RODO, zgodność, kalkulacje kosztów
Dlaczego self-hosted AI dla email bije OpenAI dla zespołów z UE — architektura RODO, skróty DPIA, wybór modelu i całkowity koszt posiadania.
Połowa kategorii AI dla email w 2026 kieruje twoje emaile klientów przez OpenAI lub Anthropic. Druga połowa nie — uruchamia modele open-weight (Llama 3.3, Mistral, Qwen) na dedykowanej infrastrukturze pod własną kontrolą. Pierwsza grupa nazywa siebie „AI dla email”. Druga grupa nazywa siebie „self-hosted AI dla email” i dla zespołów z UE w szczególności to rozróżnienie staje się coraz bardziej linią między zgodnym a niezgodnym.
Ten przewodnik wyjaśnia, co self-hosted AI dla email faktycznie oznacza na poziomie architektury (bo dostawcy mają na myśli różne rzeczy pod tym terminem), konkretne korzyści RODO, krajobraz wyboru modelu, kalkulacje kosztów i uczciwe kompromisy, które akceptujesz w zamian.
1. Co właściwie oznacza „self-hosted AI dla email”
Trzy wzorce są reklamowane jako „self-hosted”, z czego tylko dwa kwalifikują się pod ścisłą definicję:
Wzorzec A: Klient hostuje samodzielnie (rzadkie)
Uruchamiasz cały stos na własnym sprzęcie. Maksymalna kontrola, maksymalne obciążenie operacyjne. Nadaje się dla ~50-osobowych zespołów IT enterprise; niepraktyczne dla 10-osobowej agencji.
Wzorzec B: Dostawca hostuje samodzielnie (powszechny)
Dostawca uruchamia LLM na dedykowanej infrastrukturze, którą kontroluje. Nie na OpenAI, nie na Anthropic, nie na współdzielonym wielomandantowym API inferencji. PrometheusMail jest w tej kategorii — Llama 3.3 działa na dedykowanych serwerach pod naszą kontrolą. Dane klienta płyną: twoja skrzynka → serwery dostawcy → LLM dostawcy → odpowiedź → twoja skrzynka. Brak podprzetwarzającego AI od osoby trzeciej.
Wzorzec C: Marketingowe „self-hosted” dla LLM-a hostowanego z zerową retencją
Niektórzy dostawcy opisują swoje rozwiązanie jako self-hosted, bo mają umowę „zerowej retencji” z OpenAI. To nie jest self-hosted w żadnym technicznym sensie — twoje dane wciąż opuszczają dostawcę i docierają do OpenAI w celu inferencji. Może to wciąż być zgodne z RODO, jeśli jest aparat prawny, ale to fundamentalnie inna architektura i powinieneś odpowiednio wycenić ryzyko.
2. Dlaczego self-hosted, w skrócie
- RODO — brak podprzetwarzającego LLM od osoby trzeciej oznacza brak gimnastyki kontraktowej z Artykułem 28 z OpenAI, brak bólów głowy z transferem Schrems II, prostsze DPIA.
- Regulacje branżowe — sektory jak ochrona zdrowia (odpowiednik HIPAA), prawo (tajemnica zawodowa), finanse (tajemnica bankowa) często kategorycznie zabraniają wysyłania treści do konsumenckich API AI.
- Ochrona własności intelektualnej — agencje obsługujące własnościowe dane klientów (projekty, kod, prezentacje strategii) chcą silnego kontraktowego wykluczenia „treningu modelu” na każdej warstwie. Self-hosted daje to domyślnie.
- Zależność od dostawcy — modele open-weight są wymienne. Hipotetycznie możesz wziąć dane i przełączyć dostawców modelu. Z narzędziami sprzężonymi z OpenAI jesteś związany decyzjami cenowymi OpenAI.
- Przewidywalność kosztów — płaski cennik infrastruktury, nie rozliczanie API per token. Przy skali, znacznie tańsze.
3. Przewaga architektury RODO
Self-hosted AI dla email upraszcza zgodność z RODO na trzy konkretne sposoby:
Artykuł 28 (Przetwarzający): jedno DPA, nie dwa
Z narzędziami kierowanymi przez OpenAI masz dostawcę AI dla email jako przetwarzającego i OpenAI jako podprzetwarzającego. Potrzebujesz DPA z obydwoma, ze spójnymi zobowiązaniami obsługi danych. Z self-hosted, tylko z dostawcą — jedno DPA, jeden łańcuch odpowiedzialności.
Rozdział V (Transfery międzynarodowe): często wyeliminowany
Jeśli LLM dostawcy działa w UE (PrometheusMail tak), nie ma transferu danych osobowych poza EOG w ogóle. SCC stają się niepotrzebne; obawy Schrems II znikają. To najczystsza możliwa pozycja.
Artykuł 35 (DPIA): krótszy, prostszy
DPIA są wymagane dla „systematycznego przetwarzania na dużą skalę” (czym AI dla email jest). DPIA pokrywa ryzyka wprowadzone przez przetwarzanie — a jednym z największych standardowych ryzyk jest przetwarzanie danych przez usługę AI od osoby trzeciej. Wyeliminuj to, a DPIA staje się znacznie krótszy i łatwiejszy do obrony.
4. Wybór modelu: Llama 3.3 kontra alternatywy
Dostawcy self-hosted AI wybierają z kilku rodzin modeli open-weight. Każda ma kompromisy:
Llama 3.3 (Meta, 70B)
Wybór PrometheusMail. Mocne strony: najlepsze w klasie podążanie za instrukcjami przy rozmiarze 70B, wielojęzyczność (17+ języków), permisywna licencja, duża aktywna społeczność. Słabe strony: ciężki ślad GPU; nie absolutny SOTA na niektórych zadaniach z długim kontekstem.
Mistral / Mixtral (Mistral AI)
Zbudowany w Europie. Mixtral 8x22B jest konkurencyjny z Llamą 70B. Mocne strony: mocniejsze odpowiedzi w języku francuskim, firma zorientowana na UE. Słabe strony: licencjonowanie było historycznie bardziej złożone; Mistral przesunął niektóre produkty do zamkniętych wag.
Qwen (Alibaba)
Seria Qwen 2.5 jest konkurencyjna na benchmarkach. Mocne strony: silna wielojęzyczność włącznie z chińskim. Słabe strony: pochodzenie dostawcy (chińskie) to ryzyko zakupowe dla niektórych nabywców z UE; przejrzyj swoją pozycję rezydencji danych.
Claude / GPT-4 hostowane w regionach UE
Claude od Anthropic i GPT-4 od OpenAI są dostępne przez Azure / Bedrock z inferencją w regionie UE. Nie ściśle self-hosted (wciąż SaaS), ale rezydencja danych jest kontraktowo w UE. Najlepsza surowa jakość modelu. Kompromisy: droższe, zależność od dostawcy, wciąż wymaga Artykułu 28 z dostawcą chmury.
Dla większości zastosowań agencyjnych Llama 3.3 to obronny default — silne odpowiedzi, dobra obsługa wielu języków, permisywna licencja, dojrzałe narzędzia inferencyjne. Kilka punktów procentowych jakości, których możesz oddać kontra GPT-4, jest pomijalne wobec korzyści zgodności i kosztów.
5. Kalkulacje całkowitego kosztu posiadania
Cennik API per token (OpenAI, Anthropic) wygląda tanio przy małej skali i szybko staje się drogi. Self-hosted infrastruktura ma wyższy koszt stały, ale płaski koszt krańcowy. Punkt przecięcia ma miejsce wokół 1-3 mln emaili miesięcznie dla typowych odpowiedzi agencyjnych.
Z twojej perspektywy jako agencji, nie widzisz tego bezpośrednio — twój dostawca tak. Ale to pojawia się w modelach cennika. Dostawcy per stanowisko z routingiem OpenAI przekazują koszty per token (lub jedzą je na płaskich planach, dlatego ich plany mają limit wolumenu emaili). Dostawcy per firma z infrastrukturą self-hosted mogą oferować płaski cennik z wysokimi limitami wolumenu, bo ich koszty są płaskie.
PrometheusMail Business za 249 USD/mies. zawiera 60 000 emaili. Koszt krańcowy emaila 60 001 dla nas to ~0 USD; po prostu nie chcemy zdejmować limitu, bo są przypadki złych aktorów, gdzie ktoś wypala inferencję. Dla 30-osobowej agencji 60 tys. emaili pokrywa normalne użycie z marżą.
6. Jak zweryfikować deklarację self-hosted dostawcy
Dostawcy kłamią o tym mniej, niż byś się spodziewał, ale dużo asekurują. Pięć sposobów weryfikacji:
- Uzyskaj diagram architektury na piśmie. Gdzie działa model? Który dostawca hostuje GPU? Jaka jest ścieżka danych od skrzynki do LLM i z powrotem?
- Zapytaj, który model i wersja. „Llama 3.3 70B” to konkretna odpowiedź. „Różne duże modele językowe” to asekuracja.
- Zweryfikuj podprzetwarzających. DPA ich nazywa. Jeśli pojawiają się OpenAI / Anthropic / Cohere, to nie czysty self-hosted.
- Uruchom test awarii OpenAI. „Co dzieje się z twoją usługą, jeśli OpenAI jest niedostępne?” Self-hosted: „nic”. Routowane: niezręczna pauza.
- Sprawdź gwarancje logowania inferencji. Dostawcy self-hosted typowo logują tylko to, co możesz zobaczyć; routujący dostawcy powinni ujawniać polityki retencji na poziomie dostawcy LLM.
7. Uczciwe kompromisy
Self-hosted nie jest wolny od wad. Uczciwa lista:
Wolniejsza iteracja modelu
Gdy OpenAI wypuszcza GPT-5, hostowani dostawcy dostają upgrade automatycznie. Dostawcy self-hosted muszą sami zakwalifikować i wdrożyć nowy model, co może opóźnić się o 1-3 miesiące. Uważamy to za akceptowalne; gonienie SOTA rzadko ma znaczenie dla jakości odpowiedzi email. Warto wiedzieć.
Wyższy minimalny koszt infrastruktury
Llama 3.3 70B przy używalnej prędkości inferencji wymaga poważnego GPU. Dostawca to płaci; nie widzisz bezpośrednio, ale pojawia się w cenniku podstawowym. Poniżej ~30 stanowisk, narzędzia z hostowanym LLM mogą mieć niższe wystawione ceny (per stanowisko); powyżej, self-hosted typowo wygrywa na TCO.
Kompromisy latencji geograficznej
Dostawca hostuje w jednym regionie. Dostawcy z UE mają <100ms latencji dla użytkowników z UE; użytkownicy z USA widzą 100-200ms więcej. Dla większości odpowiedzi email to niewidoczne (redagujesz, nie grasz), ale warto wiedzieć dla zespołów globalnych.
Netto: self-hosted to właściwa odpowiedź dla większości zespołów agencyjnych z UE. Przypadki krańcowe (praca w języku chińskim, operacje ultra wrażliwe na latencję, gotowość do papierkowej roboty z transferem RODO) mogą wskazywać gdzie indziej. Dla większości czytelników tego przewodnika domyślną opcją powinien być self-hosted.
Najczęściej zadawane pytania
Czy PrometheusMail jest naprawdę self-hosted?
Tak — Llama 3.3 70B działa na dedykowanych serwerach pod naszą bezpośrednią kontrolą, nie na OpenAI, Anthropic ani żadnym dostawcy AI od osoby trzeciej. Podprzetwarzający są tylko operacyjni (Stripe do rozliczeń, Cloudflare do CDN), z DPA na miejscu.
Co self-hosted oznacza dla RODO?
Dwa praktyczne zwycięstwa: (1) brak relacji podprzetwarzającego z Artykułu 28 z firmą LLM ze Stanów Zjednoczonych, upraszczając kontrakty; (2) brak transferu z Rozdziału V, jeśli serwery dostawcy są w UE, eliminując SCC i obawy Schrems II.
Czy Llama 3.3 jest tak dobra jak GPT-4 dla email?
Dla jakości odpowiedzi email klienta luka jest na tyle mała, że jest niewidoczna. GPT-4 ma lekkie przewagi na pewnych benchmarkach rozumowania; Llama 3.3 jest konkurencyjna lub lepsza w podążaniu za instrukcjami i odpowiedziach wielojęzycznych.
Jak przełączyć się z narzędzia AI dla email z hostowanym LLM na self-hosted?
Eksportuj swoje dane (większość dostawców daje JSON lub CSV), wybierz dostawcę self-hosted (np. PrometheusMail), zaimportuj kontakty/tagi/szablony, uruchom równolegle przez 1-2 tygodnie, przełącz.
Co jeśli dostawca self-hosted upadnie?
Takie samo ryzyko jak każdy SaaS, ale historia przenośności danych jest lepsza: modele open-weight oznaczają, że następca może podchwycić. Wymagaj API eksportu danych w kontrakcie; wymagaj escrow kodu źródłowego, jeśli jesteś enterprise; w przeciwnym razie akceptuj ryzyko SaaS, które akceptujesz wszędzie.
Gotowy by spróbować PrometheusMail?
14 dni darmowego okresu próbnego, bez karty kredytowej. Pierwsze 100 zespołów z listy dostaje 50% zniżki na zawsze.
Dołącz do listy →