Witaj Reader! Witaj w poniedziałkowy poranek! W tym tygodniu Google zaskoczyło społeczność AI wypuszczając całą rodzinę nowych modeli Gemini 2.0, w tym flagowy model Pro z imponującym oknem kontekstowym 2 milionów tokenów (to o rząd wielkości więcej niż modele OpenAI i Anthropic). Kiedy będziecie go próbować zwróćcie uwagę na "Deep Research" do Google - choć oparty na starszym modelu 1.5 Pro jest jednak bardzo pożyteczny i może osłodzić oczekiwanie na włączenie o3 Deep Research na Waszych kontach. Tymczasem GitHub dodał do Copilota tryb agentowy, który pozwala mu samodzielnie analizować i poprawiać kod. Nie można też przeoczyć interesującego ruchu Mistrala, który wypuścił mobilną wersję swojego asystenta "le Chat" z bardzo szybkim czasem odpowiedzi. Widać wyraźnie, że trwa wyścig o to, kto stworzy najbardziej użytecznego i efektywnego asystenta AI, a firmy eksperymentują z różnymi podejściami - od surowej mocy obliczeniowej po zwinność i szybkość działania. Zanim jednak przejdę do newsów dwie rzeczy:
A teraz wiadomości. 🚀 Google wprowadza rodzinę modeli Gemini 2.0Google zaprezentowało nową linię modeli Gemini 2.0, w tym flagowy Gemini 2.0 Pro z imponującym oknem kontekstowym 2 milionów tokenów. Model ten został wyposażony w zaawansowane możliwości przetwarzania kodu, rozumowania i obsługi wielu narzędzi. Dodatkowo firma wprowadziła bardziej przystępny cenowo model Flash oraz bardzo efektywny kosztowo Flash-Lite. Gemini 2.0 Flash jest już dostępny w wersji API z atrakcyjnym cennikiem $0.10/$0.40 za milion tokenów wejściowych/wyjściowych. Google zintegrowało też model Gemini 2.0 Flash Thinking z YouTube, mapami i wyszukiwarką, co pozwala na zaawansowane rozumowanie w połączeniu z tymi usługami. 🤖 GitHub Copilot zyskuje funkcje autonomicznego agentaGitHub wprowadził do Copilota tryb agenta, który pozwala asystentowi samodzielnie analizować i poprawiać kod. Nowy tryb umożliwia Copilotowi iteracyjne ulepszanie kodu, naprawianie błędów wykonania i sugerowanie poleceń terminala bez potrzeby ciągłej interwencji programisty. Dodatkowo wprowadzono funkcję Vision do generowania kodu na podstawie obrazów i makiet, a także zapowiedziano Project Padawan - autonomicznego agenta, który będzie w stanie samodzielnie obsługiwać zgłoszenia na GitHubie i generować w pełni przetestowane pull requesty. W wyścigu z Cursor GitHub nadrabia stracony dystans. 💨 Mistral prezentuje szybkiego asystenta le ChatFrancuski startup Mistral AI wypuścił aplikacje mobilne swojego asystenta le Chat na iOS i Android, wprowadzając jednocześnie znaczące usprawnienia platformy. Kluczową nowością jest funkcja Flash Answers, która według firmy przetwarza odpowiedzi ponad 10 razy szybciej niż konkurencyjne rozwiązania jak ChatGPT czy Claude. Mistral wprowadził też elastyczny model cenowy z planem darmowym, Pro za $14.99 miesięcznie i wersją Team za $24.99 od użytkownika. Szczególnie interesująca jest opcja Enterprise, która pozwala na instalację on-premise i wykorzystanie własnych modeli. Dodajmy, że nazwa to też gra słów bo po francusku "le chat" to... kot. Mam jednak wątpliwości czy tym, na co przede wszystkim patrzymy pracując z AI jest akurat szybkość. Dla mnie znacznie bardziej liczy się jakość generacji. 🔄 OpenAI zwiększa transparentność procesu rozumowaniaOpenAI zaktualizowało sposób wyświetlania toku rozumowania w modelach o3-mini, udostępniając użytkownikom bardziej szczegółowe podsumowania procesu decyzyjnego. Zmiana dotyczy zarówno użytkowników darmowych jak i płatnych, choć ci drudzy otrzymują dostęp do bardziej zaawansowanych funkcji w trybie "wysokiego rozumowania". To kolejny krok w kierunku większej przejrzystości działania AI, choć OpenAI wciąż nie ujawnia pełnego łańcucha rozumowania, równoważąc transparentność z ochroną własności intelektualnej. Naprawdę fajne te jego kroki... no trochę mi to przypomina eksperymenty z agentami sprzed pół roku. 🤖 Nowy model Pi0 ułatwia programowanie robotówHugging Face i Physical Intelligence zaprezentowały model Pi0, który pozwala na programowanie robotów przy użyciu języka naturalnego. Model został przeszkolony na siedmiu platformach robotycznych i 68 domenach zadań, umożliwiając wykonywanie złożonych czynności jak składanie prania czy sprzątanie. System wykorzystuje dopasowywanie przepływu do generowania trajektorii akcji w czasie rzeczywistym z częstotliwością 50Hz, co zapewnia płynność i adaptowalność ruchów. Szybsza wersja, Pi0-FAST, przyspiesza trening pięciokrotnie dzięki tokenizacji sekwencji akcji w przestrzeni częstotliwości. 🎯 Nowy benchmark MultiChallenge: trudności dla LLMScale AI stworzyło MultiChallenge, nowy benchmark dla modeli językowych, który sprawdza ich zdolność do rozwiązywania wieloturnowych konwersacji. Nawet najsilniejsze modele, takie jak Claude 3.5 Sonnet, osiągnęły jedynie 41.4% punktów. To dowodzi, że modele językowe wciąż mają przed sobą wiele wyzwań w bardziej skomplikowanych scenariuszach rozmów. Co jeszcze w świecie AI?
Tyle na dobry początek tygodnia. A jeśli uważasz te informacje za wartościowe, podziel się tym newsletterem ze znajomymi zainteresowanymi AI (a takich jest coraz więcej, prawda?). Pozdrawiam, |
Dwa razy w tygodniu na Twojej skrzynce!
Witaj Reader! Kolejny tydzień przyniósł kolejne ważne newsy w świecie AI. OpenAI przedstawił swoją wizję przyszłości - GPT-4.5 ma być ostatnim "zwykłym" modelem językowym, a GPT-5 ma zintegrować wszystkie narzędzia w jeden inteligentny system. Tymczasem Anthropic zapowiada nowy model z unikalnymi możliwościami rozumowania, a w Polsce ludzie kupują startery T-Mobile aby odebrać darmowy rok Preplexity. W dziale "refleksyjnym" polecam dziś wpis, w którym na swoim blogu CEO OpenAI Sam Altman...
Witaj Reader! W ostatnich dniach OpenAI dodało nowe możliwości do swoich systemów wprowadzając model o3-mini dla wszystkich użytkowników oraz nową usługę "Deep Research", która potrafi przeprowadzać złożone analizy na podstawie wielu źródeł. Nie mniej ciekawe są doniesienia o problemie "niedostatecznego myślenia" w modelach AI oraz nowy system Google'a do automatyzacji rozmów telefonicznych. Coraz więcej uwagi poświęca się też kwestiom efektywności obliczeniowej - zarówno w kontekście dużych...
Witaj Reader! Świat AI nadal żyje przełomem dokonanym przez DeepSeek, którego model R1 nie tylko dorównuje GPT-4 przy wielokrotnie niższych kosztach, ale również budzi niezrozumiałe obawy o bezpieczeństwo danych. Jednocześnie na rynku pojawiają się kolejne ciekawe rozwiązania - od ChatGPT dla agencji rządowych po nowe modele ze świata open source. Warto zwrócić uwagę, że również konkurenci nie śpią - Qwen2.5 właśnie wprowadził możliwość sterowania urządzeniami, odpowiadając tym samym na...