Witaj Reader! W świecie AI wchodzimy w kolejną fazę automatyzacji złożonych zadań. OpenAI udostępnia Canvas dla modelu o1, Operatora (na razie tylko w USA) oraz pracuje nad systemami, które mają przejąć pracę doświadczonych programistów. Jest to moment, w którym możemy obserwować jak firmy technologiczne stawiają kolejne kroki na drodze do prawdziwej sztucznej inteligencji ogólnej (AGI). Jednocześnie jednak pojawiają się głosy ekspertów studzące nadmierny optymizm i wskazujące na wyzwania, które wciąż stoją przed branżą. Zanim przyjrzymy się tym wydarzeniom raz jeszcze dziękuję uczestnikom wczorajszego warsztatu poświęconemu Claude. Dzięki temu ułożyłem sobie pewien plan i niedługo pojawi się na jego bazie szkolenie. Mam nadzieję, że spotka się z równie dużym zainteresowaniem co i warsztat. Następny warsztat planujemy w lutym, wstępnie tematem będzie Copilot w Office 365. Oczywiście Wy dowiecie się o nim pierwsi! A teraz przejdźmy do newsów. 🎨 Canvas od OpenAI dostępny dla modelu o1OpenAI wprowadziło długo oczekiwane wsparcie Canvas dla swojego zaawansowanego modelu o1. Nowa funkcjonalność dostępna jest dla użytkowników planów Pro, Plus i Team. Rozszerzenie możliwości Canvas pozwala teraz na renderowanie kodu HTML i React, co znacząco zwiększa możliwości tworzenia interaktywnych projektów. Dodatkowo, Canvas został w pełni zintegrowany z aplikacją desktopową ChatGPT dla macOS. Nowe funkcje będą dostępne dla użytkowników Enterprise i Edu w ciągu najbliższych tygodni. 🚀 Operator – nowy agent od OpenAIOpenAI wprowadziło Operatora, agenta AI zaprojektowanego do automatyzacji zadań w przeglądarce internetowej, takich jak rezerwacje podróży czy zakupy online. Operator wykorzystuje model Computer-Using Agent (CUA), łączący zaawansowane możliwości widzenia komputerowego z dedukcją. Ze względów bezpieczeństwa wbudowano tryb przejęcia (ang. takeover mode), który pozwala użytkownikom przejąć działania przy wrażliwych danych, jak hasła czy płatności. Operator jest obecnie dostępny tylko dla użytkowników Pro w USA i planowana jest jego ekspansja na pozostałe plany oraz API dla programistów. 🔧 OpenAI rozwija agenta AI zastępującego senior developerówOpenAI pracuje nad zaawansowanym systemem AI, który ma automatyzować pracę doświadczonych inżynierów oprogramowania. Nowy agent ma być zdolny do wykonywania złożonych zadań programistycznych, takich jak refaktoryzacja kodu czy przeprojektowywanie aplikacji. To kluczowy krok w kierunku rozwoju AGI, choć firma przyznaje, że wciąż boryka się z wyzwaniem pozyskiwania odpowiednich danych treningowych pokazujących proces myślowy doświadczonych programistów. 💻 Automatyzacja pracy senior developerów trudniejsza niż zakładanoEksperci branżowi zwracają uwagę, że zastąpienie doświadczonych inżynierów oprogramowania przez AI może zająć więcej czasu niż pierwotnie zakładano. Głównym wyzwaniem jest brak odpowiednich danych treningowych pokazujących, jak seniorzy przekształcają ogólne koncepcje w gotowe projekty. Firmy próbują rozwiązać ten problem poprzez współpracę z doświadczonymi programistami i dokumentowanie ich procesów decyzyjnych. 🤖 ByteDance w gronie liderów – model Doubao-1.5-ProDoubao-1.5-Pro, nowy model od ByteDance, wykorzystuje architekturę Mixture of Experts (MoE), osiągając wydajność porównywalną z GPT-4o przy 50-krotnie niższym koszcie operacyjnym. Dzięki zaawansowanym technikom, jak FlashAttention i W4A8 quantization, model oferuje zwiększoną efektywność pamięci i obliczeń. Multimodalne możliwości Doubao obejmują m.in. obsługę wizji komputerowej i przetwarzanie mowy, co czyni go wyjątkowo wszechstronnym. 🔧 UI-TARS – przełom w automatyzacji GUIByteDance zaprezentowało UI-TARS, system AI, który autonomicznie obsługuje graficzne interfejsy użytkownika na komputerach i urządzeniach mobilnych. Model ten przewyższa GPT-4o i Claude pod względem zadań związanych z interfejsem, oferując transparentne procesy wykonawcze oraz adaptacyjną naukę. Jego zastosowania obejmują zarządzanie danymi, modyfikacje aplikacji oraz integrację nowych funkcji personalizacyjnych. W skrócie - Chińczycy trzymają się mocno. Nie tylko w AI zresztą. 🧩 Wyzwaniem dla AI jest „Humanity’s Last Exam”„Humanity's Last Exam” to nowy, zaawansowany benchmark testujący zdolności modeli AI w ponad 3 000 wielodyscyplinowych pytaniach, przygotowanych przez ekspertów z całego świata. Wyniki pierwszych testów pokazują, że wiodące modele, takie jak Gemini czy Claude, wciąż daleko odbiegają od osiągnięcia ludzkiej sprawności intelektualnej. Benchmark ma stać się narzędziem śledzącym postęp w zaawansowanych zastosowaniach AI. Co jeszcze w świecie AI?
Początek 2025 roku przynosi nam coraz więcej dowodów na to, jak sztuczna inteligencja zmienia sposób pracy programistów i naukowców. Szczególnie interesujące są próby automatyzacji złożonych zadań programistycznych, choć jak się okazuje, droga do pełnej automatyzacji może być dłuższa zakładają optymiści. Mimo to wszyscy są zgodni: sztuczni programiści, pracujący na poziomie seniora to tylko kwestia czasu z dyskusja dotyczy tego czy otrzymamy ich w tym roku czy za dwa lata. Osobiście myślę jednak, że programiści będą coraz bardziej tracić na znaczeniu jako grupa zawodowa - nie tyle będą eliminowani całkowicie czy też spadną drastycznie ich wynagrodzenia. Raczej zmieni się natura ich pracy (jak już dawno zmieniła się natura pracy projektantów procesorów i innych zaawansowanych układów scalonych) i znacznie spadnie globalnie ich liczba. Jakie to ma skutki dla branży sami możecie sobie dopowiedzieć - mówiąc krótko, kto będzie umiał dobrze żyć z AI i je wykorzystać ma szansę utrzymać się na fali. I jeszcze jedna myśl: AI jako bańka. Znowu ludzie mylą pojęcia... "Bańka" to nie oznacza, że AI zniknie i przestanie wpływać na społeczeństwa i gospodarki. "Bańka" oznacza, że upadnie trochę zanadto nadmuchanych startupów (w zeszłym roku wielu inwestorów ładowało dziesiątki milionów dolarów we wszystko co miało etykietkę "AI" nie z braku rozsądku ale dlatego, że nikt nie wiedział co jest możliwe a co nie). "Bańka" długofalowo oznacza, że nie będzie się na tym tak świetnie zarabiać. KAŻDA nowa technologia jest na początku świetnym, super lukratywnym ale ryzykownym biznesem ale z czasem marginesy topnieją. Kiedyś Microsoft świetnie zarabiał na Windows - teraz Windows to tylko gateway pozwalający Microsoftowi zarabiać na chmurze. Mógłbym tu przytoczyć kolejne przykłady, nawet sięgające dalej w przeszłość ale najważniejsza myśl jest taka: wraz z upowszechnieniem technologii staje się ona "jednostkowo" mniej lukratywna i zanika efekt "wow" (kto z Was doznaje radosnego podniecenia na widok pociągu?) - ale oddziaływanie tej technologii na ludzkość jest jeszcze potężniejsze niż było na początku. Tyle na ten wieczór. Zachęcam do śledzenia kolejnych wydań naszego newslettera i dzielenia się nim z osobami zainteresowanymi rozwojem AI. Pozdrawiam, |
Dwa razy w tygodniu na Twojej skrzynce!
Witaj Reader! Kolejny tydzień przyniósł kolejne ważne newsy w świecie AI. OpenAI przedstawił swoją wizję przyszłości - GPT-4.5 ma być ostatnim "zwykłym" modelem językowym, a GPT-5 ma zintegrować wszystkie narzędzia w jeden inteligentny system. Tymczasem Anthropic zapowiada nowy model z unikalnymi możliwościami rozumowania, a w Polsce ludzie kupują startery T-Mobile aby odebrać darmowy rok Preplexity. W dziale "refleksyjnym" polecam dziś wpis, w którym na swoim blogu CEO OpenAI Sam Altman...
Witaj Reader! Witaj w poniedziałkowy poranek! W tym tygodniu Google zaskoczyło społeczność AI wypuszczając całą rodzinę nowych modeli Gemini 2.0, w tym flagowy model Pro z imponującym oknem kontekstowym 2 milionów tokenów (to o rząd wielkości więcej niż modele OpenAI i Anthropic). Kiedy będziecie go próbować zwróćcie uwagę na "Deep Research" do Google - choć oparty na starszym modelu 1.5 Pro jest jednak bardzo pożyteczny i może osłodzić oczekiwanie na włączenie o3 Deep Research na Waszych...
Witaj Reader! W ostatnich dniach OpenAI dodało nowe możliwości do swoich systemów wprowadzając model o3-mini dla wszystkich użytkowników oraz nową usługę "Deep Research", która potrafi przeprowadzać złożone analizy na podstawie wielu źródeł. Nie mniej ciekawe są doniesienia o problemie "niedostatecznego myślenia" w modelach AI oraz nowy system Google'a do automatyzacji rozmów telefonicznych. Coraz więcej uwagi poświęca się też kwestiom efektywności obliczeniowej - zarówno w kontekście dużych...