[AI] OpenAI udostępnia Canvas dla o1 oraz rozwija sztucznych programistów

Witaj Reader!

W świecie AI wchodzimy w kolejną fazę automatyzacji złożonych zadań. OpenAI udostępnia Canvas dla modelu o1, Operatora (na razie tylko w USA) oraz pracuje nad systemami, które mają przejąć pracę doświadczonych programistów. Jest to moment, w którym możemy obserwować jak firmy technologiczne stawiają kolejne kroki na drodze do prawdziwej sztucznej inteligencji ogólnej (AGI). Jednocześnie jednak pojawiają się głosy ekspertów studzące nadmierny optymizm i wskazujące na wyzwania, które wciąż stoją przed branżą.

Zanim przyjrzymy się tym wydarzeniom raz jeszcze dziękuję uczestnikom wczorajszego warsztatu poświęconemu Claude. Dzięki temu ułożyłem sobie pewien plan i niedługo pojawi się na jego bazie szkolenie. Mam nadzieję, że spotka się z równie dużym zainteresowaniem co i warsztat. Następny warsztat planujemy w lutym, wstępnie tematem będzie Copilot w Office 365. Oczywiście Wy dowiecie się o nim pierwsi!

A teraz przejdźmy do newsów.

🎨 Canvas od OpenAI dostępny dla modelu o1

OpenAI wprowadziło długo oczekiwane wsparcie Canvas dla swojego zaawansowanego modelu o1. Nowa funkcjonalność dostępna jest dla użytkowników planów Pro, Plus i Team. Rozszerzenie możliwości Canvas pozwala teraz na renderowanie kodu HTML i React, co znacząco zwiększa możliwości tworzenia interaktywnych projektów. Dodatkowo, Canvas został w pełni zintegrowany z aplikacją desktopową ChatGPT dla macOS. Nowe funkcje będą dostępne dla użytkowników Enterprise i Edu w ciągu najbliższych tygodni.

Czytaj więcej

🚀 Operator – nowy agent od OpenAI

OpenAI wprowadziło Operatora, agenta AI zaprojektowanego do automatyzacji zadań w przeglądarce internetowej, takich jak rezerwacje podróży czy zakupy online. Operator wykorzystuje model Computer-Using Agent (CUA), łączący zaawansowane możliwości widzenia komputerowego z dedukcją. Ze względów bezpieczeństwa wbudowano tryb przejęcia (ang. takeover mode), który pozwala użytkownikom przejąć działania przy wrażliwych danych, jak hasła czy płatności. Operator jest obecnie dostępny tylko dla użytkowników Pro w USA i planowana jest jego ekspansja na pozostałe plany oraz API dla programistów.

Czytaj więcej

🔧 OpenAI rozwija agenta AI zastępującego senior developerów

OpenAI pracuje nad zaawansowanym systemem AI, który ma automatyzować pracę doświadczonych inżynierów oprogramowania. Nowy agent ma być zdolny do wykonywania złożonych zadań programistycznych, takich jak refaktoryzacja kodu czy przeprojektowywanie aplikacji. To kluczowy krok w kierunku rozwoju AGI, choć firma przyznaje, że wciąż boryka się z wyzwaniem pozyskiwania odpowiednich danych treningowych pokazujących proces myślowy doświadczonych programistów.

Czytaj więcej

💻 Automatyzacja pracy senior developerów trudniejsza niż zakładano

Eksperci branżowi zwracają uwagę, że zastąpienie doświadczonych inżynierów oprogramowania przez AI może zająć więcej czasu niż pierwotnie zakładano. Głównym wyzwaniem jest brak odpowiednich danych treningowych pokazujących, jak seniorzy przekształcają ogólne koncepcje w gotowe projekty. Firmy próbują rozwiązać ten problem poprzez współpracę z doświadczonymi programistami i dokumentowanie ich procesów decyzyjnych.

Czytaj więcej

🤖 ByteDance w gronie liderów – model Doubao-1.5-Pro

Doubao-1.5-Pro, nowy model od ByteDance, wykorzystuje architekturę Mixture of Experts (MoE), osiągając wydajność porównywalną z GPT-4o przy 50-krotnie niższym koszcie operacyjnym. Dzięki zaawansowanym technikom, jak FlashAttention i W4A8 quantization, model oferuje zwiększoną efektywność pamięci i obliczeń. Multimodalne możliwości Doubao obejmują m.in. obsługę wizji komputerowej i przetwarzanie mowy, co czyni go wyjątkowo wszechstronnym.

Czytaj więcej

🔧 UI-TARS – przełom w automatyzacji GUI

ByteDance zaprezentowało UI-TARS, system AI, który autonomicznie obsługuje graficzne interfejsy użytkownika na komputerach i urządzeniach mobilnych. Model ten przewyższa GPT-4o i Claude pod względem zadań związanych z interfejsem, oferując transparentne procesy wykonawcze oraz adaptacyjną naukę. Jego zastosowania obejmują zarządzanie danymi, modyfikacje aplikacji oraz integrację nowych funkcji personalizacyjnych.

Czytaj więcej

W skrócie - Chińczycy trzymają się mocno. Nie tylko w AI zresztą.

🧩 Wyzwaniem dla AI jest „Humanity’s Last Exam”

„Humanity's Last Exam” to nowy, zaawansowany benchmark testujący zdolności modeli AI w ponad 3 000 wielodyscyplinowych pytaniach, przygotowanych przez ekspertów z całego świata. Wyniki pierwszych testów pokazują, że wiodące modele, takie jak Gemini czy Claude, wciąż daleko odbiegają od osiągnięcia ludzkiej sprawności intelektualnej. Benchmark ma stać się narzędziem śledzącym postęp w zaawansowanych zastosowaniach AI.

Czytaj więcej Zobacz test

Co jeszcze w świecie AI?

ByteDance inwestuje 20 miliardów dolarów w rozwój infrastruktury AI na rok 2025. Czytaj więcej
Hugging Face udostępnia SmolVLM - najmniejszy na świecie model językowo-wizualny. Czytaj więcej
OpenAI szykuje się do wydania modelu o4, spodziewając się znaczącego skoku w możliwościach. Czytaj więcej Wszystko, by spróbować nadrobić stracony dystans do lidera... czy jednak nie jest za późno?
Google wprowadza darmowy model Gemini 2.0 Flash Thinking, stawiający wyzwanie strategii premium OpenAI. Czytaj więcej
Perplexity uruchamia nowy, wielofunkcyjny asystent na Androida. Czytaj więcej
OpenAI oraz SoftBank angażują po 19 miliardów dolarów w Stargate – projekt infrastruktury AI. Czytaj więcej
Meta zapowiada ogromny wzrost mocy obliczeniowej z budową centrum danych o wartości 65 miliardów dolarów. Czytaj więcej

Początek 2025 roku przynosi nam coraz więcej dowodów na to, jak sztuczna inteligencja zmienia sposób pracy programistów i naukowców. Szczególnie interesujące są próby automatyzacji złożonych zadań programistycznych, choć jak się okazuje, droga do pełnej automatyzacji może być dłuższa zakładają optymiści. Mimo to wszyscy są zgodni: sztuczni programiści, pracujący na poziomie seniora to tylko kwestia czasu z dyskusja dotyczy tego czy otrzymamy ich w tym roku czy za dwa lata.

Osobiście myślę jednak, że programiści będą coraz bardziej tracić na znaczeniu jako grupa zawodowa - nie tyle będą eliminowani całkowicie czy też spadną drastycznie ich wynagrodzenia. Raczej zmieni się natura ich pracy (jak już dawno zmieniła się natura pracy projektantów procesorów i innych zaawansowanych układów scalonych) i znacznie spadnie globalnie ich liczba. Jakie to ma skutki dla branży sami możecie sobie dopowiedzieć - mówiąc krótko, kto będzie umiał dobrze żyć z AI i je wykorzystać ma szansę utrzymać się na fali.

I jeszcze jedna myśl: AI jako bańka. Znowu ludzie mylą pojęcia... "Bańka" to nie oznacza, że AI zniknie i przestanie wpływać na społeczeństwa i gospodarki. "Bańka" oznacza, że upadnie trochę zanadto nadmuchanych startupów (w zeszłym roku wielu inwestorów ładowało dziesiątki milionów dolarów we wszystko co miało etykietkę "AI" nie z braku rozsądku ale dlatego, że nikt nie wiedział co jest możliwe a co nie). "Bańka" długofalowo oznacza, że nie będzie się na tym tak świetnie zarabiać. KAŻDA nowa technologia jest na początku świetnym, super lukratywnym ale ryzykownym biznesem ale z czasem marginesy topnieją. Kiedyś Microsoft świetnie zarabiał na Windows - teraz Windows to tylko gateway pozwalający Microsoftowi zarabiać na chmurze. Mógłbym tu przytoczyć kolejne przykłady, nawet sięgające dalej w przeszłość ale najważniejsza myśl jest taka: wraz z upowszechnieniem technologii staje się ona "jednostkowo" mniej lukratywna i zanika efekt "wow" (kto z Was doznaje radosnego podniecenia na widok pociągu?) - ale oddziaływanie tej technologii na ludzkość jest jeszcze potężniejsze niż było na początku.

Tyle na ten wieczór. Zachęcam do śledzenia kolejnych wydań naszego newslettera i dzielenia się nim z osobami zainteresowanymi rozwojem AI.

Pozdrawiam,
Andy

AI Sprinters

[AI] OpenAI udostępnia Canvas dla o1 oraz rozwija sztucznych programistów

🎨 Canvas od OpenAI dostępny dla modelu o1

🚀 Operator – nowy agent od OpenAI

🔧 OpenAI rozwija agenta AI zastępującego senior developerów

💻 Automatyzacja pracy senior developerów trudniejsza niż zakładano

🤖 ByteDance w gronie liderów – model Doubao-1.5-Pro

🔧 UI-TARS – przełom w automatyzacji GUI

🧩 Wyzwaniem dla AI jest „Humanity’s Last Exam”

Co jeszcze w świecie AI?

[AI] Roadmap OpenAI, obowiązkowe szkolenia z AI w firmach i inne wieści

[AI] Gemini 2.0 Pro debiutuje wraz z nową gamą modeli od Google

[AI] OpenAI wprowadza agenta o3 do złożonych analiz, udostępnia o3-mini dla wszystkich