Witaj Reader! Świat AI nadal żyje przełomem dokonanym przez DeepSeek, którego model R1 nie tylko dorównuje GPT-4 przy wielokrotnie niższych kosztach, ale również budzi niezrozumiałe obawy o bezpieczeństwo danych. Jednocześnie na rynku pojawiają się kolejne ciekawe rozwiązania - od ChatGPT dla agencji rządowych po nowe modele ze świata open source. Warto zwrócić uwagę, że również konkurenci nie śpią - Qwen2.5 właśnie wprowadził możliwość sterowania urządzeniami, odpowiadając tym samym na premierę OpenAI Operator. Wszystko to dzieje się w atmosferze rosnącego napięcia między USA a Chinami w wyścigu o dominację w dziedzinie sztucznej inteligencji. 🐋 DeepSeek R1: analiza sukcesu najtańszego treningu AIW zeszłym tygodniu informowaliśmy o premierze modelu DeepSeek R1, który dorównuje OpenAI przy znacznie niższych kosztach użytkowania. Dziś, po szczegółowej analizie ich publikacji naukowej i dokumentacji technicznej, wiemy jak udało im się to osiągnąć. Trening modelu kosztował zaledwie 5.6 miliona dolarów i wykorzystał tylko 2,048 kart NVIDIA H800 - dla porównania Llama 3 od Meta potrzebowała ponad 10 razy więcej mocy obliczeniowej. DeepSeek osiągnął to dzięki szeregowi innowacji technicznych, w tym wykorzystaniu 8-bitowej precyzji obliczeń i zaawansowanej tokenizacji. Co więcej, model można hostować lokalnie, a koszt użytkowania w chmurze to zaledwie 0.14 dolara za milion tokenów (vs 15 dolarów u OpenAI). 🏛️ OpenAI wprowadza ChatGPT Gov dla agencji rządowychOpenAI uruchomiło specjalną wersję ChatGPT przeznaczoną dla amerykańskich agencji rządowych. ChatGPT Gov działa w bezpiecznym środowisku Microsoft Azure, umożliwiając przetwarzanie wrażliwych danych zgodnie z protokołami bezpieczeństwa. Użytkownicy mają dostęp do modelu GPT-4o oraz funkcji Enterprise, w tym możliwości tworzenia własnych GPT i narzędzi administracyjnych. Już teraz ponad 90 000 pracowników z 3500 agencji wygenerowało ponad 18 milionów wiadomości od 2024 roku. 🤖 Qwen2.5-VL kontroluje komputery i smartfonyAlibaba zaprezentowała Qwen2.5-VL, rodzinę modeli AI zdolnych do analizy tekstu, obrazów i filmów, a także sterowania komputerami i urządzeniami mobilnymi. Model przewyższa konkurentów takich jak GPT-4o i Google Gemini 2.0 w kluczowych testach porównawczych. Dostępny jest w trzech wariantach (3B, 7B i 72B), z których mniejsze wersje oferowane są na liberalnych licencjach, podczas gdy flagowy model 72B wymaga zgody Alibaby dla firm z ponad 100 milionami użytkowników. 🎵 YuE - darmowa alternatywa dla Suno w generowaniu muzykiZespół badaczy wprowadził YuE, otwarty system AI do generowania muzyki, który może tworzyć pełne utwory trwające do 5 minut. System wykorzystuje dwa specjalistyczne modele - jeden do wokalu i muzyki, drugi do elementów produkcyjnych. YuE obsługuje wiele języków i potrafi odtworzyć złożone techniki wokalne. Użytkownicy mogą dostosowywać gatunek, instrumenty, nastrój i charakterystykę wokalną, zachowując spójną strukturę muzyczną. 🦢 Block uruchamia platformę dla agentów AI o nazwie GooseFirma Block, kierowana przez Jacka Dorseya, zaprezentowała Goose - framework open source do tworzenia i wdrażania asystentów AI na różnych platformach. System wspiera dowolne modele językowe, w tym od OpenAI, DeepSeek i Anthropic, przy zachowaniu prywatności danych. Goose integruje się z różnymi narzędziami poprzez API Anthropica i może dynamicznie dodawać nowe integracje w trakcie sesji. 🚨 Microsoft bada podejrzenia o wycieku danych do DeepSeekMicrosoft i OpenAI prowadzą dochodzenie w sprawie potencjalnego nieuprawnionego wykorzystania API OpenAI przez osoby powiązane z DeepSeek. Zespół bezpieczeństwa Microsoftu zaobserwował jesienią 2024 roku ekstrakcję dużych ilości danych, co mogło naruszać warunki korzystania z usług OpenAI. Oskarżenia dotyczą między innymi wykorzystania technik "destylacji" na wyjściach OpenAI. Co jeszcze w świecie AI?
Rozwój sztucznej inteligencji nabiera coraz większego tempa, a konkurencja między firmami i krajami staje się coraz bardziej zacięta. Szczególnie interesujące jest to, jak chińskie firmy, takie jak DeepSeek i Alibaba, wprowadzają innowacje, które mogą zmienić ekonomikę rozwoju AI. Jeśli uważasz, że te informacje są wartościowe, podziel się tym newsletterem ze znajomymi zainteresowanymi rozwojem AI - razem możemy śledzić i lepiej rozumieć te fascynujące zmiany. Pozdrawiam, PS. Wiem, że niektórzy z Was z różnych przyczyn nie dali rady zapisać się na mój warsztat na temat używania Claude, dlatego robimy "dogrywkę" - specjalnie dla Was - 6 lutego 2025 godzina 10:00 (czyli za dnia!). Acha, no i na MS Teams żeby było łatwiej ze służbowych kompów. Zapisy tutaj - jak zwykle najpierw wrzucam to tutaj, na sociale dopiero później żebyście mieli szansę zapisać się jako pierwsi. |
Dwa razy w tygodniu na Twojej skrzynce!
Witaj Reader! Kolejny tydzień przyniósł kolejne ważne newsy w świecie AI. OpenAI przedstawił swoją wizję przyszłości - GPT-4.5 ma być ostatnim "zwykłym" modelem językowym, a GPT-5 ma zintegrować wszystkie narzędzia w jeden inteligentny system. Tymczasem Anthropic zapowiada nowy model z unikalnymi możliwościami rozumowania, a w Polsce ludzie kupują startery T-Mobile aby odebrać darmowy rok Preplexity. W dziale "refleksyjnym" polecam dziś wpis, w którym na swoim blogu CEO OpenAI Sam Altman...
Witaj Reader! Witaj w poniedziałkowy poranek! W tym tygodniu Google zaskoczyło społeczność AI wypuszczając całą rodzinę nowych modeli Gemini 2.0, w tym flagowy model Pro z imponującym oknem kontekstowym 2 milionów tokenów (to o rząd wielkości więcej niż modele OpenAI i Anthropic). Kiedy będziecie go próbować zwróćcie uwagę na "Deep Research" do Google - choć oparty na starszym modelu 1.5 Pro jest jednak bardzo pożyteczny i może osłodzić oczekiwanie na włączenie o3 Deep Research na Waszych...
Witaj Reader! W ostatnich dniach OpenAI dodało nowe możliwości do swoich systemów wprowadzając model o3-mini dla wszystkich użytkowników oraz nową usługę "Deep Research", która potrafi przeprowadzać złożone analizy na podstawie wielu źródeł. Nie mniej ciekawe są doniesienia o problemie "niedostatecznego myślenia" w modelach AI oraz nowy system Google'a do automatyzacji rozmów telefonicznych. Coraz więcej uwagi poświęca się też kwestiom efektywności obliczeniowej - zarówno w kontekście dużych...