[AI] Gemini 2.0 Pro debiutuje wraz z nową gamą modeli od Google

Witaj Reader!

Witaj w poniedziałkowy poranek!

W tym tygodniu Google zaskoczyło społeczność AI wypuszczając całą rodzinę nowych modeli Gemini 2.0, w tym flagowy model Pro z imponującym oknem kontekstowym 2 milionów tokenów (to o rząd wielkości więcej niż modele OpenAI i Anthropic). Kiedy będziecie go próbować zwróćcie uwagę na "Deep Research" do Google - choć oparty na starszym modelu 1.5 Pro jest jednak bardzo pożyteczny i może osłodzić oczekiwanie na włączenie o3 Deep Research na Waszych kontach.

Tymczasem GitHub dodał do Copilota tryb agentowy, który pozwala mu samodzielnie analizować i poprawiać kod. Nie można też przeoczyć interesującego ruchu Mistrala, który wypuścił mobilną wersję swojego asystenta "le Chat" z bardzo szybkim czasem odpowiedzi. Widać wyraźnie, że trwa wyścig o to, kto stworzy najbardziej użytecznego i efektywnego asystenta AI, a firmy eksperymentują z różnymi podejściami - od surowej mocy obliczeniowej po zwinność i szybkość działania.

Zanim jednak przejdę do newsów dwie rzeczy:

po pierwsze, to już naprawdę ostatni moment żeby dołączyć do warsztatu AI Toolbox - Intro, który odbędzie się już w czwartek!
po drugie, znajoma pani psycholog prowadzi badanie dotyczące postrzegania porad psychologicznych od AI, jeśli masz ochotę pomóc wypełnij krótką ankietę - zobaczysz kilka problemów i dla każdego poradę psychologa oraz AI po czym ocenisz która jest lepsza.

A teraz wiadomości.

🚀 Google wprowadza rodzinę modeli Gemini 2.0

Google zaprezentowało nową linię modeli Gemini 2.0, w tym flagowy Gemini 2.0 Pro z imponującym oknem kontekstowym 2 milionów tokenów. Model ten został wyposażony w zaawansowane możliwości przetwarzania kodu, rozumowania i obsługi wielu narzędzi. Dodatkowo firma wprowadziła bardziej przystępny cenowo model Flash oraz bardzo efektywny kosztowo Flash-Lite.

Gemini 2.0 Flash jest już dostępny w wersji API z atrakcyjnym cennikiem $0.10/$0.40 za milion tokenów wejściowych/wyjściowych. Google zintegrowało też model Gemini 2.0 Flash Thinking z YouTube, mapami i wyszukiwarką, co pozwala na zaawansowane rozumowanie w połączeniu z tymi usługami.

Czytaj więcej

🤖 GitHub Copilot zyskuje funkcje autonomicznego agenta

GitHub wprowadził do Copilota tryb agenta, który pozwala asystentowi samodzielnie analizować i poprawiać kod. Nowy tryb umożliwia Copilotowi iteracyjne ulepszanie kodu, naprawianie błędów wykonania i sugerowanie poleceń terminala bez potrzeby ciągłej interwencji programisty.

Dodatkowo wprowadzono funkcję Vision do generowania kodu na podstawie obrazów i makiet, a także zapowiedziano Project Padawan - autonomicznego agenta, który będzie w stanie samodzielnie obsługiwać zgłoszenia na GitHubie i generować w pełni przetestowane pull requesty.

Czytaj więcej

W wyścigu z Cursor GitHub nadrabia stracony dystans.

💨 Mistral prezentuje szybkiego asystenta le Chat

Francuski startup Mistral AI wypuścił aplikacje mobilne swojego asystenta le Chat na iOS i Android, wprowadzając jednocześnie znaczące usprawnienia platformy. Kluczową nowością jest funkcja Flash Answers, która według firmy przetwarza odpowiedzi ponad 10 razy szybciej niż konkurencyjne rozwiązania jak ChatGPT czy Claude.

Mistral wprowadził też elastyczny model cenowy z planem darmowym, Pro za $14.99 miesięcznie i wersją Team za $24.99 od użytkownika. Szczególnie interesująca jest opcja Enterprise, która pozwala na instalację on-premise i wykorzystanie własnych modeli.

Czytaj więcej

Dodajmy, że nazwa to też gra słów bo po francusku "le chat" to... kot. Mam jednak wątpliwości czy tym, na co przede wszystkim patrzymy pracując z AI jest akurat szybkość. Dla mnie znacznie bardziej liczy się jakość generacji.

🔄 OpenAI zwiększa transparentność procesu rozumowania

OpenAI zaktualizowało sposób wyświetlania toku rozumowania w modelach o3-mini, udostępniając użytkownikom bardziej szczegółowe podsumowania procesu decyzyjnego. Zmiana dotyczy zarówno użytkowników darmowych jak i płatnych, choć ci drudzy otrzymują dostęp do bardziej zaawansowanych funkcji w trybie "wysokiego rozumowania".

To kolejny krok w kierunku większej przejrzystości działania AI, choć OpenAI wciąż nie ujawnia pełnego łańcucha rozumowania, równoważąc transparentność z ochroną własności intelektualnej.

Czytaj więcej

Naprawdę fajne te jego kroki... no trochę mi to przypomina eksperymenty z agentami sprzed pół roku.

🤖 Nowy model Pi0 ułatwia programowanie robotów

Hugging Face i Physical Intelligence zaprezentowały model Pi0, który pozwala na programowanie robotów przy użyciu języka naturalnego. Model został przeszkolony na siedmiu platformach robotycznych i 68 domenach zadań, umożliwiając wykonywanie złożonych czynności jak składanie prania czy sprzątanie.

System wykorzystuje dopasowywanie przepływu do generowania trajektorii akcji w czasie rzeczywistym z częstotliwością 50Hz, co zapewnia płynność i adaptowalność ruchów. Szybsza wersja, Pi0-FAST, przyspiesza trening pięciokrotnie dzięki tokenizacji sekwencji akcji w przestrzeni częstotliwości.

Czytaj więcej

🎯 Nowy benchmark MultiChallenge: trudności dla LLM

Scale AI stworzyło MultiChallenge, nowy benchmark dla modeli językowych, który sprawdza ich zdolność do rozwiązywania wieloturnowych konwersacji. Nawet najsilniejsze modele, takie jak Claude 3.5 Sonnet, osiągnęły jedynie 41.4% punktów. To dowodzi, że modele językowe wciąż mają przed sobą wiele wyzwań w bardziej skomplikowanych scenariuszach rozmów.

Zobacz wyniki

Co jeszcze w świecie AI?

Sam Altman twierdzi, że w OpenAI mają wewnętrzny model, który zajmuje 50-e miejsce w rankingu konkursów programowania ("competitive programming") a do końca roku spodziewają się dojść do miejsa 1-szego Obejrzyj wypowiedź
OpenAI rozpoczyna ogólnokrajowe poszukiwania lokalizacji dla centrów danych w ramach projektu Stargate w 16 stanach USA. Czytaj więcej
Google aktualizuje Imagen 3 w API Gemini, wprowadzając nowe możliwości generowania obrazów. Czytaj więcej
Amazon zapowiada prezentację nowej wersji Alexy z ulepszonym rdzeniem AI na wydarzeniu 26 lutego. Czytaj więcej
John Schulman, współzałożyciel OpenAI, opuszcza Anthropic po zaledwie pięciu miesiącach. Czytaj więcej
Topaz Labs przedstawia Project Starlight - pierwszy model AI do restauracji wideo. Czytaj więcej
Meta uruchamia nowy program mający na celu poprawę AI do rozpoznawania mowy i tłumaczeń. Czytaj więcej
Lyft wdraża Claude AI od Anthropic w obsłudze klienta i testach produktów. Czytaj więcej Mam nadzieję, że to nie będzie oznaczało przeciążenia i trudności dla innych z nas korzystających z Claude.

Tyle na dobry początek tygodnia. A jeśli uważasz te informacje za wartościowe, podziel się tym newsletterem ze znajomymi zainteresowanymi AI (a takich jest coraz więcej, prawda?).

Pozdrawiam,
Andy

AI Sprinters

[AI] Gemini 2.0 Pro debiutuje wraz z nową gamą modeli od Google

🚀 Google wprowadza rodzinę modeli Gemini 2.0

🤖 GitHub Copilot zyskuje funkcje autonomicznego agenta

💨 Mistral prezentuje szybkiego asystenta le Chat

🔄 OpenAI zwiększa transparentność procesu rozumowania

🤖 Nowy model Pi0 ułatwia programowanie robotów

🎯 Nowy benchmark MultiChallenge: trudności dla LLM

Co jeszcze w świecie AI?

[AI] Roadmap OpenAI, obowiązkowe szkolenia z AI w firmach i inne wieści

[AI] OpenAI wprowadza agenta o3 do złożonych analiz, udostępnia o3-mini dla wszystkich

[AI] DeepSeek budzi obawy Zachodu, Qwen2.5 idzie w ślady Operatora