Vojtěch Čermák
Senior Test Automation Engineer
Blog
Vojtěch Čermák
Senior Test Automation Engineer
Září potvrdilo, že umělá inteligence se méně předvádí a víc řeší praxi. Velcí hráči budují obří infrastrukturu, aby zvládli další generaci modelů, a samotné modely se posouvají k „agentům“, kteří umí dlouho a spolehlivě pracovat na konkrétních úkolech. K tomu přibyla i jasnější pravidla v EU pro hlášení vážných incidentů. Co to znamená pro firmy i běžné uživatele? Rychlejší a dostupnější služby, ale také větší nároky na bezpečnost a odpovědné nasazení.
OpenAI a NVIDIA oznámily záměr nasadit nejméně 10 GW nových systémů NVIDIA pro trénink a provoz budoucích modelů; NVIDIA současně uvádí plán investovat až 100 mld. USD podle tempa výstavby. Jde o „letter of intent“ (záměr), nikoli finální smlouvu, ale měřítko růstu je zřejmé [1][2]. Paralelně CoreWeave rozšířil kontrakt s OpenAI až o 6,5 mld. USD; celkově letos uzavřené dohody dosahují zhruba 22,4 mld. USD [3].
Anthropic uvedl Claude Sonnet 4.5. Firma zdůrazňuje lepší „computer use“ (práce v OS a aplikacích), kódování a delší autonomní běhy — tedy praktické scénáře, kde model plní vícekrokové úkoly bez stálého dohledu [4][5]. Google aktualizoval rychlé modely Gemini 2.5 Flash a Flash-Lite: lépe dodržují instrukce, zlepšily se v práci s nástroji (agentní úlohy) a zkrátily odezvy; Google uvádí i +5 p. b. na benchmarku SWE-Bench Verified oproti předchozí verzi [6].
DeepMind oznámil, že pokročilá verze Gemini 2.5 Deep Think dosáhla na světovém finále ICPC „gold-level“ výkonu (10/12 úloh v pětihodinovém limitu). Média zároveň informují, že systém OpenAI v odděleném testu vyřešil všech 12/12 úloh. Nejde o oficiální soutěžní účast mezi týmy, ale o testy v podmínkách srovnatelných s pravidly ICPC. Je to důkaz posunu ve vícekrokovém uvažování — v praxi to může znamenat stabilnější pomoc v analýze dat a při vývoji softwaru, byť to samo o sobě negarantuje „bezchybný kód“ [7][8].
Alibaba oznámila partnerství se společností NVIDIA a plánuje nová datová centra po celém světě. Zároveň také představila Qwen3-Max, svůj dosud největší model s více než bilionem parametrů, a hlásí důraz na kódování a agentní schopnosti. Model je dostupný přes Alibaba Cloud; reálný přínos mimo čínský ekosystém ukážou následující měsíce [9][10].
Evropská komise otevřela veřejnou konzultaci k pracovní verzi metodiky a šablony pro hlášení „vážných incidentů“ u vysoce rizikových AI systémů podle AI Act (26. 9.–7. 11. 2025). Jde o praktický krok k tomu, jak budou poskytovatelé AI incidenty reálně oznamovat [11].
Září ukázalo střízlivý trend: nejde jen o „chytřejší“ modely, ale hlavně o to, zda je lze spolehlivě provozovat ve velkém a zapojit do běžné práce. Pro firmy dává smysl začít tam, kde je rychlá návratnost: vyhledávání v dokumentech, reporting, testování a příprava kódu — právě tam agentní přístup přináší nejvíc užitku. Pro veřejnost to znamená více AI v každodenních službách, ale také větší význam transparentnosti, bezpečnosti a možnosti obrátit se na poskytovatele, když něco selže. V říjnu bude klíčové sledovat uzavírání konkrétních kontraktů na výpočet a první širší piloty agentních nástrojů v podnicích — tam se ukáže, co z papíru obstojí v praxi.
Zdroje:
[1] NVIDIA newsroom: LOI s OpenAI na ≥ 10 GW. NVIDIA Newsroom
[2] Reuters: NVIDIA plánuje investovat až 100 mld. USD; LOI s OpenAI. Reuters
[3] CoreWeave (investors): rozšíření dohody s OpenAI až o 6,5 mld. USD; celkem ~22,4 mld. USD. investors.coreweave.com
[4] Anthropic blog: Introducing Claude Sonnet 4.5. Anthropic
[5] Reuters/Axios k uvedení Sonnet 4.5 (výkon, delší autonomní běhy). Reuters+1
[6] Google Developers Blog: aktualizace Gemini 2.5 Flash/Flash-Lite (+5 p. b. na SWE-Bench Verified). developers.googleblog.com
[7] DeepMind blog: Gemini 2.5 Deep Think — gold-level výkon na ICPC. Google DeepMind
[8] Financial Times: kontext k ICPC (OpenAI 12/12; význam a limity). Financial Times
[9] Reuters: Alibaba spustila Qwen3-Max (> 1 bilion parametrů). Reuters
[10] Alibaba Cloud: přehled Qwen3-Max a schopností (Apsara). AlibabaCloud
[11] Evropská komise: konzultace — draft guidance & reporting template pro „serious AI incidents“ (26. 9.–7. 11. 2025). Digitální strategie EU
Nenechejte si ujít nejnovější informace.
Vyplňte nám vaši e-mailovou adresu a dostávejte pravidelnou nálož informací ohledně nadcházejících školení, akcí a testingového know-how.
Chcete poradit?
Napište si o naši bezplatnou, neprodejní konzultaci zdarma. Vyplňte formulář a my se vám ozveme zpět.
Hlídací pes
Nenašeli jste termín, který by vám vyhovoval? ....
Upozornění