Vojtěch Čermák
Senior Test Automation Engineer
Blog
Vojtěch Čermák
Senior Test Automation Engineer
Září potvrdilo, že umělá inteligence se méně předvádí a víc řeší praxi. Velcí hráči budují obří infrastrukturu, aby zvládli další generaci modelů, a samotné modely se posouvají k „agentům“, kteří umí dlouho a spolehlivě pracovat na konkrétních úkolech. K tomu přibyla i jasnější pravidla v EU pro hlášení vážných incidentů. Co to znamená pro firmy i běžné uživatele? Rychlejší a dostupnější služby, ale také větší nároky na bezpečnost a odpovědné nasazení.
OpenAI a NVIDIA oznámily záměr nasadit nejméně 10 GW nových systémů NVIDIA pro trénink a provoz budoucích modelů; NVIDIA současně uvádí plán investovat až 100 mld. USD podle tempa výstavby. Jde o „letter of intent“ (záměr), nikoli finální smlouvu, ale měřítko růstu je zřejmé [1][2]. Paralelně CoreWeave rozšířil kontrakt s OpenAI až o 6,5 mld. USD; celkově letos uzavřené dohody dosahují zhruba 22,4 mld. USD [3].
Anthropic uvedl Claude Sonnet 4.5. Firma zdůrazňuje lepší „computer use“ (práce v OS a aplikacích), kódování a delší autonomní běhy — tedy praktické scénáře, kde model plní vícekrokové úkoly bez stálého dohledu [4][5]. Google aktualizoval rychlé modely Gemini 2.5 Flash a Flash-Lite: lépe dodržují instrukce, zlepšily se v práci s nástroji (agentní úlohy) a zkrátily odezvy; Google uvádí i +5 p. b. na benchmarku SWE-Bench Verified oproti předchozí verzi [6].
DeepMind oznámil, že pokročilá verze Gemini 2.5 Deep Think dosáhla na světovém finále ICPC „gold-level“ výkonu (10/12 úloh v pětihodinovém limitu). Média zároveň informují, že systém OpenAI v odděleném testu vyřešil všech 12/12 úloh. Nejde o oficiální soutěžní účast mezi týmy, ale o testy v podmínkách srovnatelných s pravidly ICPC. Je to důkaz posunu ve vícekrokovém uvažování — v praxi to může znamenat stabilnější pomoc v analýze dat a při vývoji softwaru, byť to samo o sobě negarantuje „bezchybný kód“ [7][8].
Alibaba oznámila partnerství se společností NVIDIA a plánuje nová datová centra po celém světě. Zároveň také představila Qwen3-Max, svůj dosud největší model s více než bilionem parametrů, a hlásí důraz na kódování a agentní schopnosti. Model je dostupný přes Alibaba Cloud; reálný přínos mimo čínský ekosystém ukážou následující měsíce [9][10].
Evropská komise otevřela veřejnou konzultaci k pracovní verzi metodiky a šablony pro hlášení „vážných incidentů“ u vysoce rizikových AI systémů podle AI Act (26. 9.–7. 11. 2025). Jde o praktický krok k tomu, jak budou poskytovatelé AI incidenty reálně oznamovat [11].
Září ukázalo střízlivý trend: nejde jen o „chytřejší“ modely, ale hlavně o to, zda je lze spolehlivě provozovat ve velkém a zapojit do běžné práce. Pro firmy dává smysl začít tam, kde je rychlá návratnost: vyhledávání v dokumentech, reporting, testování a příprava kódu — právě tam agentní přístup přináší nejvíc užitku. Pro veřejnost to znamená více AI v každodenních službách, ale také větší význam transparentnosti, bezpečnosti a možnosti obrátit se na poskytovatele, když něco selže. V říjnu bude klíčové sledovat uzavírání konkrétních kontraktů na výpočet a první širší piloty agentních nástrojů v podnicích — tam se ukáže, co z papíru obstojí v praxi.
Zdroje:
[1] NVIDIA newsroom: LOI s OpenAI na ≥ 10 GW. NVIDIA Newsroom
[2] Reuters: NVIDIA plánuje investovat až 100 mld. USD; LOI s OpenAI. Reuters
[3] CoreWeave (investors): rozšíření dohody s OpenAI až o 6,5 mld. USD; celkem ~22,4 mld. USD. investors.coreweave.com
[4] Anthropic blog: Introducing Claude Sonnet 4.5. Anthropic
[5] Reuters/Axios k uvedení Sonnet 4.5 (výkon, delší autonomní běhy). Reuters+1
[6] Google Developers Blog: aktualizace Gemini 2.5 Flash/Flash-Lite (+5 p. b. na SWE-Bench Verified). developers.googleblog.com
[7] DeepMind blog: Gemini 2.5 Deep Think — gold-level výkon na ICPC. Google DeepMind
[8] Financial Times: kontext k ICPC (OpenAI 12/12; význam a limity). Financial Times
[9] Reuters: Alibaba spustila Qwen3-Max (> 1 bilion parametrů). Reuters
[10] Alibaba Cloud: přehled Qwen3-Max a schopností (Apsara). AlibabaCloud
[11] Evropská komise: konzultace — draft guidance & reporting template pro „serious AI incidents“ (26. 9.–7. 11. 2025). Digitální strategie EU
Don't miss out on the latest updates.
Fill in your email address to stay informed about upcoming training sessions, events, and testing know-how.
Need Advice?
Request our free, non-sales consultation. Fill out the form and we will get back to you.
Watchdog
Did not find a date that works for you? ....
Notice