[AI] Gemini 2.0 Pro debiutuje wraz z nową gamą modeli od Google


Witaj Reader!

Witaj w poniedziałkowy poranek!

W tym tygodniu Google zaskoczyło społeczność AI wypuszczając całą rodzinę nowych modeli Gemini 2.0, w tym flagowy model Pro z imponującym oknem kontekstowym 2 milionów tokenów (to o rząd wielkości więcej niż modele OpenAI i Anthropic). Kiedy będziecie go próbować zwróćcie uwagę na "Deep Research" do Google - choć oparty na starszym modelu 1.5 Pro jest jednak bardzo pożyteczny i może osłodzić oczekiwanie na włączenie o3 Deep Research na Waszych kontach.

Tymczasem GitHub dodał do Copilota tryb agentowy, który pozwala mu samodzielnie analizować i poprawiać kod. Nie można też przeoczyć interesującego ruchu Mistrala, który wypuścił mobilną wersję swojego asystenta "le Chat" z bardzo szybkim czasem odpowiedzi. Widać wyraźnie, że trwa wyścig o to, kto stworzy najbardziej użytecznego i efektywnego asystenta AI, a firmy eksperymentują z różnymi podejściami - od surowej mocy obliczeniowej po zwinność i szybkość działania.

Zanim jednak przejdę do newsów dwie rzeczy:

  • po pierwsze, to już naprawdę ostatni moment żeby dołączyć do warsztatu AI Toolbox - Intro, który odbędzie się już w czwartek!
  • po drugie, znajoma pani psycholog prowadzi badanie dotyczące postrzegania porad psychologicznych od AI, jeśli masz ochotę pomóc wypełnij krótką ankietę - zobaczysz kilka problemów i dla każdego poradę psychologa oraz AI po czym ocenisz która jest lepsza.

A teraz wiadomości.

🚀 Google wprowadza rodzinę modeli Gemini 2.0

Google zaprezentowało nową linię modeli Gemini 2.0, w tym flagowy Gemini 2.0 Pro z imponującym oknem kontekstowym 2 milionów tokenów. Model ten został wyposażony w zaawansowane możliwości przetwarzania kodu, rozumowania i obsługi wielu narzędzi. Dodatkowo firma wprowadziła bardziej przystępny cenowo model Flash oraz bardzo efektywny kosztowo Flash-Lite.

Gemini 2.0 Flash jest już dostępny w wersji API z atrakcyjnym cennikiem $0.10/$0.40 za milion tokenów wejściowych/wyjściowych. Google zintegrowało też model Gemini 2.0 Flash Thinking z YouTube, mapami i wyszukiwarką, co pozwala na zaawansowane rozumowanie w połączeniu z tymi usługami.

Czytaj więcej

🤖 GitHub Copilot zyskuje funkcje autonomicznego agenta

GitHub wprowadził do Copilota tryb agenta, który pozwala asystentowi samodzielnie analizować i poprawiać kod. Nowy tryb umożliwia Copilotowi iteracyjne ulepszanie kodu, naprawianie błędów wykonania i sugerowanie poleceń terminala bez potrzeby ciągłej interwencji programisty.

Dodatkowo wprowadzono funkcję Vision do generowania kodu na podstawie obrazów i makiet, a także zapowiedziano Project Padawan - autonomicznego agenta, który będzie w stanie samodzielnie obsługiwać zgłoszenia na GitHubie i generować w pełni przetestowane pull requesty.

Czytaj więcej

W wyścigu z Cursor GitHub nadrabia stracony dystans.

💨 Mistral prezentuje szybkiego asystenta le Chat

Francuski startup Mistral AI wypuścił aplikacje mobilne swojego asystenta le Chat na iOS i Android, wprowadzając jednocześnie znaczące usprawnienia platformy. Kluczową nowością jest funkcja Flash Answers, która według firmy przetwarza odpowiedzi ponad 10 razy szybciej niż konkurencyjne rozwiązania jak ChatGPT czy Claude.

Mistral wprowadził też elastyczny model cenowy z planem darmowym, Pro za $14.99 miesięcznie i wersją Team za $24.99 od użytkownika. Szczególnie interesująca jest opcja Enterprise, która pozwala na instalację on-premise i wykorzystanie własnych modeli.

Czytaj więcej

Dodajmy, że nazwa to też gra słów bo po francusku "le chat" to... kot. Mam jednak wątpliwości czy tym, na co przede wszystkim patrzymy pracując z AI jest akurat szybkość. Dla mnie znacznie bardziej liczy się jakość generacji.

🔄 OpenAI zwiększa transparentność procesu rozumowania

OpenAI zaktualizowało sposób wyświetlania toku rozumowania w modelach o3-mini, udostępniając użytkownikom bardziej szczegółowe podsumowania procesu decyzyjnego. Zmiana dotyczy zarówno użytkowników darmowych jak i płatnych, choć ci drudzy otrzymują dostęp do bardziej zaawansowanych funkcji w trybie "wysokiego rozumowania".

To kolejny krok w kierunku większej przejrzystości działania AI, choć OpenAI wciąż nie ujawnia pełnego łańcucha rozumowania, równoważąc transparentność z ochroną własności intelektualnej.

Czytaj więcej

Naprawdę fajne te jego kroki... no trochę mi to przypomina eksperymenty z agentami sprzed pół roku.

🤖 Nowy model Pi0 ułatwia programowanie robotów

Hugging Face i Physical Intelligence zaprezentowały model Pi0, który pozwala na programowanie robotów przy użyciu języka naturalnego. Model został przeszkolony na siedmiu platformach robotycznych i 68 domenach zadań, umożliwiając wykonywanie złożonych czynności jak składanie prania czy sprzątanie.

System wykorzystuje dopasowywanie przepływu do generowania trajektorii akcji w czasie rzeczywistym z częstotliwością 50Hz, co zapewnia płynność i adaptowalność ruchów. Szybsza wersja, Pi0-FAST, przyspiesza trening pięciokrotnie dzięki tokenizacji sekwencji akcji w przestrzeni częstotliwości.

Czytaj więcej

🎯 Nowy benchmark MultiChallenge: trudności dla LLM

Scale AI stworzyło MultiChallenge, nowy benchmark dla modeli językowych, który sprawdza ich zdolność do rozwiązywania wieloturnowych konwersacji. Nawet najsilniejsze modele, takie jak Claude 3.5 Sonnet, osiągnęły jedynie 41.4% punktów. To dowodzi, że modele językowe wciąż mają przed sobą wiele wyzwań w bardziej skomplikowanych scenariuszach rozmów.

Zobacz wyniki

Co jeszcze w świecie AI?

  • Sam Altman twierdzi, że w OpenAI mają wewnętrzny model, który zajmuje 50-e miejsce w rankingu konkursów programowania ("competitive programming") a do końca roku spodziewają się dojść do miejsa 1-szego Obejrzyj wypowiedź
  • OpenAI rozpoczyna ogólnokrajowe poszukiwania lokalizacji dla centrów danych w ramach projektu Stargate w 16 stanach USA. Czytaj więcej
  • Google aktualizuje Imagen 3 w API Gemini, wprowadzając nowe możliwości generowania obrazów. Czytaj więcej
  • Amazon zapowiada prezentację nowej wersji Alexy z ulepszonym rdzeniem AI na wydarzeniu 26 lutego. Czytaj więcej
  • John Schulman, współzałożyciel OpenAI, opuszcza Anthropic po zaledwie pięciu miesiącach. Czytaj więcej
  • Topaz Labs przedstawia Project Starlight - pierwszy model AI do restauracji wideo. Czytaj więcej
  • Meta uruchamia nowy program mający na celu poprawę AI do rozpoznawania mowy i tłumaczeń. Czytaj więcej
  • Lyft wdraża Claude AI od Anthropic w obsłudze klienta i testach produktów. Czytaj więcej Mam nadzieję, że to nie będzie oznaczało przeciążenia i trudności dla innych z nas korzystających z Claude.

Tyle na dobry początek tygodnia. A jeśli uważasz te informacje za wartościowe, podziel się tym newsletterem ze znajomymi zainteresowanymi AI (a takich jest coraz więcej, prawda?).

Pozdrawiam,
Andy

AI Sprinters

Dwa razy w tygodniu na Twojej skrzynce!

Read more from AI Sprinters

Witaj Reader! Kolejny tydzień przyniósł kolejne ważne newsy w świecie AI. OpenAI przedstawił swoją wizję przyszłości - GPT-4.5 ma być ostatnim "zwykłym" modelem językowym, a GPT-5 ma zintegrować wszystkie narzędzia w jeden inteligentny system. Tymczasem Anthropic zapowiada nowy model z unikalnymi możliwościami rozumowania, a w Polsce ludzie kupują startery T-Mobile aby odebrać darmowy rok Preplexity. W dziale "refleksyjnym" polecam dziś wpis, w którym na swoim blogu CEO OpenAI Sam Altman...

Witaj Reader! W ostatnich dniach OpenAI dodało nowe możliwości do swoich systemów wprowadzając model o3-mini dla wszystkich użytkowników oraz nową usługę "Deep Research", która potrafi przeprowadzać złożone analizy na podstawie wielu źródeł. Nie mniej ciekawe są doniesienia o problemie "niedostatecznego myślenia" w modelach AI oraz nowy system Google'a do automatyzacji rozmów telefonicznych. Coraz więcej uwagi poświęca się też kwestiom efektywności obliczeniowej - zarówno w kontekście dużych...

Witaj Reader! Świat AI nadal żyje przełomem dokonanym przez DeepSeek, którego model R1 nie tylko dorównuje GPT-4 przy wielokrotnie niższych kosztach, ale również budzi niezrozumiałe obawy o bezpieczeństwo danych. Jednocześnie na rynku pojawiają się kolejne ciekawe rozwiązania - od ChatGPT dla agencji rządowych po nowe modele ze świata open source. Warto zwrócić uwagę, że również konkurenci nie śpią - Qwen2.5 właśnie wprowadził możliwość sterowania urządzeniami, odpowiadając tym samym na...