[AI] DeepSeek budzi obawy Zachodu, Qwen2.5 idzie w ślady Operatora

Witaj Reader!

Świat AI nadal żyje przełomem dokonanym przez DeepSeek, którego model R1 nie tylko dorównuje GPT-4 przy wielokrotnie niższych kosztach, ale również budzi niezrozumiałe obawy o bezpieczeństwo danych. Jednocześnie na rynku pojawiają się kolejne ciekawe rozwiązania - od ChatGPT dla agencji rządowych po nowe modele ze świata open source. Warto zwrócić uwagę, że również konkurenci nie śpią - Qwen2.5 właśnie wprowadził możliwość sterowania urządzeniami, odpowiadając tym samym na premierę OpenAI Operator. Wszystko to dzieje się w atmosferze rosnącego napięcia między USA a Chinami w wyścigu o dominację w dziedzinie sztucznej inteligencji.

🐋 DeepSeek R1: analiza sukcesu najtańszego treningu AI

W zeszłym tygodniu informowaliśmy o premierze modelu DeepSeek R1, który dorównuje OpenAI przy znacznie niższych kosztach użytkowania. Dziś, po szczegółowej analizie ich publikacji naukowej i dokumentacji technicznej, wiemy jak udało im się to osiągnąć. Trening modelu kosztował zaledwie 5.6 miliona dolarów i wykorzystał tylko 2,048 kart NVIDIA H800 - dla porównania Llama 3 od Meta potrzebowała ponad 10 razy więcej mocy obliczeniowej. DeepSeek osiągnął to dzięki szeregowi innowacji technicznych, w tym wykorzystaniu 8-bitowej precyzji obliczeń i zaawansowanej tokenizacji. Co więcej, model można hostować lokalnie, a koszt użytkowania w chmurze to zaledwie 0.14 dolara za milion tokenów (vs 15 dolarów u OpenAI).

Przeczytaj naszą analizę

🏛️ OpenAI wprowadza ChatGPT Gov dla agencji rządowych

OpenAI uruchomiło specjalną wersję ChatGPT przeznaczoną dla amerykańskich agencji rządowych. ChatGPT Gov działa w bezpiecznym środowisku Microsoft Azure, umożliwiając przetwarzanie wrażliwych danych zgodnie z protokołami bezpieczeństwa. Użytkownicy mają dostęp do modelu GPT-4o oraz funkcji Enterprise, w tym możliwości tworzenia własnych GPT i narzędzi administracyjnych. Już teraz ponad 90 000 pracowników z 3500 agencji wygenerowało ponad 18 milionów wiadomości od 2024 roku.

Czytaj więcej

🤖 Qwen2.5-VL kontroluje komputery i smartfony

Alibaba zaprezentowała Qwen2.5-VL, rodzinę modeli AI zdolnych do analizy tekstu, obrazów i filmów, a także sterowania komputerami i urządzeniami mobilnymi. Model przewyższa konkurentów takich jak GPT-4o i Google Gemini 2.0 w kluczowych testach porównawczych. Dostępny jest w trzech wariantach (3B, 7B i 72B), z których mniejsze wersje oferowane są na liberalnych licencjach, podczas gdy flagowy model 72B wymaga zgody Alibaby dla firm z ponad 100 milionami użytkowników.

Czytaj więcej

🎵 YuE - darmowa alternatywa dla Suno w generowaniu muzyki

Zespół badaczy wprowadził YuE, otwarty system AI do generowania muzyki, który może tworzyć pełne utwory trwające do 5 minut. System wykorzystuje dwa specjalistyczne modele - jeden do wokalu i muzyki, drugi do elementów produkcyjnych. YuE obsługuje wiele języków i potrafi odtworzyć złożone techniki wokalne. Użytkownicy mogą dostosowywać gatunek, instrumenty, nastrój i charakterystykę wokalną, zachowując spójną strukturę muzyczną.

Czytaj więcej

🦢 Block uruchamia platformę dla agentów AI o nazwie Goose

Firma Block, kierowana przez Jacka Dorseya, zaprezentowała Goose - framework open source do tworzenia i wdrażania asystentów AI na różnych platformach. System wspiera dowolne modele językowe, w tym od OpenAI, DeepSeek i Anthropic, przy zachowaniu prywatności danych. Goose integruje się z różnymi narzędziami poprzez API Anthropica i może dynamicznie dodawać nowe integracje w trakcie sesji.

Czytaj więcej

🚨 Microsoft bada podejrzenia o wycieku danych do DeepSeek

Microsoft i OpenAI prowadzą dochodzenie w sprawie potencjalnego nieuprawnionego wykorzystania API OpenAI przez osoby powiązane z DeepSeek. Zespół bezpieczeństwa Microsoftu zaobserwował jesienią 2024 roku ekstrakcję dużych ilości danych, co mogło naruszać warunki korzystania z usług OpenAI. Oskarżenia dotyczą między innymi wykorzystania technik "destylacji" na wyjściach OpenAI.

Czytaj więcej

Co jeszcze w świecie AI?

Alibaba twierdzi, że jej nowy model Qwen2.5-Max przewyższa możliwości DeepSeek V3. Czytaj więcej
UBTech Robotics planuje masową produkcję humanoidalnych robotów przemysłowych do końca 2025 roku. Czytaj więcej
Były pracownik OpenAI ds. bezpieczeństwa rezygnuje, wyrażając obawy o zbyt szybki rozwój AI. Czytaj więcej
Meta AI otrzymuje aktualizację umożliwiającą zapamiętywanie rozmów i personalizację odpowiedzi. Czytaj więcej
Pika Labs wprowadza wersję 2.1 swojego modelu do generowania wideo w jakości 1080p. Czytaj więcej

Rozwój sztucznej inteligencji nabiera coraz większego tempa, a konkurencja między firmami i krajami staje się coraz bardziej zacięta. Szczególnie interesujące jest to, jak chińskie firmy, takie jak DeepSeek i Alibaba, wprowadzają innowacje, które mogą zmienić ekonomikę rozwoju AI. Jeśli uważasz, że te informacje są wartościowe, podziel się tym newsletterem ze znajomymi zainteresowanymi rozwojem AI - razem możemy śledzić i lepiej rozumieć te fascynujące zmiany.

Pozdrawiam,
Andy

PS. Wiem, że niektórzy z Was z różnych przyczyn nie dali rady zapisać się na mój warsztat na temat używania Claude, dlatego robimy "dogrywkę" - specjalnie dla Was - 6 lutego 2025 godzina 10:00 (czyli za dnia!). Acha, no i na MS Teams żeby było łatwiej ze służbowych kompów. Zapisy tutaj - jak zwykle najpierw wrzucam to tutaj, na sociale dopiero później żebyście mieli szansę zapisać się jako pierwsi.

AI Sprinters

[AI] DeepSeek budzi obawy Zachodu, Qwen2.5 idzie w ślady Operatora

🐋 DeepSeek R1: analiza sukcesu najtańszego treningu AI

🏛️ OpenAI wprowadza ChatGPT Gov dla agencji rządowych

🤖 Qwen2.5-VL kontroluje komputery i smartfony

🎵 YuE - darmowa alternatywa dla Suno w generowaniu muzyki

🦢 Block uruchamia platformę dla agentów AI o nazwie Goose

🚨 Microsoft bada podejrzenia o wycieku danych do DeepSeek

Co jeszcze w świecie AI?

[AI] Roadmap OpenAI, obowiązkowe szkolenia z AI w firmach i inne wieści

[AI] Gemini 2.0 Pro debiutuje wraz z nową gamą modeli od Google

[AI] OpenAI wprowadza agenta o3 do złożonych analiz, udostępnia o3-mini dla wszystkich