Blog

Vojtěch Čermák

Vojtěch Čermák

Senior Test Automation Engineer

Nejvýznamnější AI novinky v září 2025: Méně show, více reálné práce

Umělá inteligence

Září potvrdilo, že umělá inteligence se méně předvádí a víc řeší praxi. Velcí hráči budují obří infrastrukturu, aby zvládli další generaci modelů, a samotné modely se posouvají k „agentům“, kteří umí dlouho a spolehlivě pracovat na konkrétních úkolech.  K tomu přibyla i jasnější pravidla v EU pro hlášení vážných incidentů. Co to znamená pro firmy i běžné uživatele? Rychlejší a dostupnější služby, ale také větší nároky na bezpečnost a odpovědné nasazení. 

Výpočetní kapacita roste do gigawattů 

OpenAI a NVIDIA oznámily záměr nasadit nejméně 10 GW nových systémů NVIDIA pro trénink a provoz budoucích modelů; NVIDIA současně uvádí plán investovat až 100 mld. USD podle tempa výstavby. Jde o „letter of intent“ (záměr), nikoli finální smlouvu, ale měřítko růstu je zřejmé [1][2]. Paralelně CoreWeave rozšířil kontrakt s OpenAI až o 6,5 mld. USD; celkově letos uzavřené dohody dosahují zhruba 22,4 mld. USD [3]. 

Modely míří k agentům — méně show, více práce 

Anthropic uvedl Claude Sonnet 4.5. Firma zdůrazňuje lepší „computer use“ (práce v OS a aplikacích), kódování a delší autonomní běhy — tedy praktické scénáře, kde model plní vícekrokové úkoly bez stálého dohledu [4][5]. Google aktualizoval rychlé modely Gemini 2.5 Flash a Flash-Lite: lépe dodržují instrukce, zlepšily se v práci s nástroji (agentní úlohy) a zkrátily odezvy; Google uvádí i +5 p. b. na benchmarku SWE-Bench Verified oproti předchozí verzi [6]. 

„Programátorské olympiády“: viditelný milník 

DeepMind oznámil, že pokročilá verze Gemini 2.5 Deep Think dosáhla na světovém finále ICPC „gold-level“ výkonu (10/12 úloh v pětihodinovém limitu). Média zároveň informují, že systém OpenAI v odděleném testu vyřešil všech 12/12 úloh. Nejde o oficiální soutěžní účast mezi týmy, ale o testy v podmínkách srovnatelných s pravidly ICPC. Je to důkaz posunu ve vícekrokovém uvažování — v praxi to může znamenat stabilnější pomoc v analýze dat a při vývoji softwaru, byť to samo o sobě negarantuje „bezchybný kód“ [7][8]. 

Čína přitlačila: Alibaba Qwen3-Max 

Alibaba oznámila partnerství se společností NVIDIA a plánuje nová datová centra po celém světě. Zároveň také představila Qwen3-Max, svůj dosud největší model s více než bilionem parametrů, a hlásí důraz na kódování a agentní schopnosti. Model je dostupný přes Alibaba Cloud; reálný přínos mimo čínský ekosystém ukážou následující měsíce [9][10]. 

EU zpřesňuje provozní povinnosti 

Evropská komise otevřela veřejnou konzultaci k pracovní verzi metodiky a šablony pro hlášení „vážných incidentů“ u vysoce rizikových AI systémů podle AI Act (26. 9.–7. 11. 2025). Jde o praktický krok k tomu, jak budou poskytovatelé AI incidenty reálně oznamovat [11]. 

Závěr

Září ukázalo střízlivý trend: nejde jen o „chytřejší“ modely, ale hlavně o to, zda je lze spolehlivě provozovat ve velkém a zapojit do běžné práce. Pro firmy dává smysl začít tam, kde je rychlá návratnost: vyhledávání v dokumentech, reporting, testování a příprava kódu — právě tam agentní přístup přináší nejvíc užitku. Pro veřejnost to znamená více AI v každodenních službách, ale také větší význam transparentnosti, bezpečnosti a možnosti obrátit se na poskytovatele, když něco selže. V říjnu bude klíčové sledovat uzavírání konkrétních kontraktů na výpočet a první širší piloty agentních nástrojů v podnicích — tam se ukáže, co z papíru obstojí v praxi. 

Zdroje:

[1] NVIDIA newsroom: LOI s OpenAI na ≥ 10 GW. NVIDIA Newsroom 
[2] Reuters: NVIDIA plánuje investovat až 100 mld. USD; LOI s OpenAI. Reuters 
[3] CoreWeave (investors): rozšíření dohody s OpenAI až o 6,5 mld. USD; celkem ~22,4 mld. USD. investors.coreweave.com 
[4] Anthropic blog: Introducing Claude Sonnet 4.5. Anthropic 
[5] Reuters/Axios k uvedení Sonnet 4.5 (výkon, delší autonomní běhy). Reuters+1 
[6] Google Developers Blog: aktualizace Gemini 2.5 Flash/Flash-Lite (+5 p. b. na SWE-Bench Verified). developers.googleblog.com 
[7] DeepMind blog: Gemini 2.5 Deep Think — gold-level výkon na ICPC. Google DeepMind 
[8] Financial Times: kontext k ICPC (OpenAI 12/12; význam a limity). Financial Times 
[9] Reuters: Alibaba spustila Qwen3-Max (> 1 bilion parametrů). Reuters 
[10] Alibaba Cloud: přehled Qwen3-Max a schopností (Apsara). AlibabaCloud 
[11] Evropská komise: konzultace — draft guidance & reporting template pro „serious AI incidents“ (26. 9.–7. 11. 2025). Digitální strategie EU 


Nenechejte si ujít nejnovější informace.

Vyplňte nám vaši e-mailovou adresu a dostávejte pravidelnou nálož informací ohledně nadcházejících školení, akcí a testingového know-how.

Odesláním tohoto formuláře souhlasíte se zpracováním osobních údajů dle GDPR a se zasíláním marketingových e-mailů.