Blog

Vojtěch Čermák

Senior Test Automation Engineer

Nejvýznamnější AI novinky v září 2025: Méně show, více reálné práce

Umělá inteligence

Září potvrdilo, že umělá inteligence se méně předvádí a víc řeší praxi. Velcí hráči budují obří infrastrukturu, aby zvládli další generaci modelů, a samotné modely se posouvají k „agentům“, kteří umí dlouho a spolehlivě pracovat na konkrétních úkolech. K tomu přibyla i jasnější pravidla v EU pro hlášení vážných incidentů. Co to znamená pro firmy i běžné uživatele? Rychlejší a dostupnější služby, ale také větší nároky na bezpečnost a odpovědné nasazení.

Výpočetní kapacita roste do gigawattů

OpenAI a NVIDIA oznámily záměr nasadit nejméně 10 GW nových systémů NVIDIA pro trénink a provoz budoucích modelů; NVIDIA současně uvádí plán investovat až 100 mld. USD podle tempa výstavby. Jde o „letter of intent“ (záměr), nikoli finální smlouvu, ale měřítko růstu je zřejmé [1][2]. Paralelně CoreWeave rozšířil kontrakt s OpenAI až o 6,5 mld. USD; celkově letos uzavřené dohody dosahují zhruba 22,4 mld. USD [3].

Modely míří k agentům — méně show, více práce

Anthropic uvedl Claude Sonnet 4.5. Firma zdůrazňuje lepší „computer use“ (práce v OS a aplikacích), kódování a delší autonomní běhy — tedy praktické scénáře, kde model plní vícekrokové úkoly bez stálého dohledu [4][5]. Google aktualizoval rychlé modely Gemini 2.5 Flash a Flash-Lite: lépe dodržují instrukce, zlepšily se v práci s nástroji (agentní úlohy) a zkrátily odezvy; Google uvádí i +5 p. b. na benchmarku SWE-Bench Verified oproti předchozí verzi [6].

„Programátorské olympiády“: viditelný milník

DeepMind oznámil, že pokročilá verze Gemini 2.5 Deep Think dosáhla na světovém finále ICPC „gold-level“ výkonu (10/12 úloh v pětihodinovém limitu). Média zároveň informují, že systém OpenAI v odděleném testu vyřešil všech 12/12 úloh. Nejde o oficiální soutěžní účast mezi týmy, ale o testy v podmínkách srovnatelných s pravidly ICPC. Je to důkaz posunu ve vícekrokovém uvažování — v praxi to může znamenat stabilnější pomoc v analýze dat a při vývoji softwaru, byť to samo o sobě negarantuje „bezchybný kód“ [7][8].

Čína přitlačila: Alibaba Qwen3-Max

Alibaba oznámila partnerství se společností NVIDIA a plánuje nová datová centra po celém světě. Zároveň také představila Qwen3-Max, svůj dosud největší model s více než bilionem parametrů, a hlásí důraz na kódování a agentní schopnosti. Model je dostupný přes Alibaba Cloud; reálný přínos mimo čínský ekosystém ukážou následující měsíce [9][10].

EU zpřesňuje provozní povinnosti

Evropská komise otevřela veřejnou konzultaci k pracovní verzi metodiky a šablony pro hlášení „vážných incidentů“ u vysoce rizikových AI systémů podle AI Act (26. 9.–7. 11. 2025). Jde o praktický krok k tomu, jak budou poskytovatelé AI incidenty reálně oznamovat [11].

Závěr

Září ukázalo střízlivý trend: nejde jen o „chytřejší“ modely, ale hlavně o to, zda je lze spolehlivě provozovat ve velkém a zapojit do běžné práce. Pro firmy dává smysl začít tam, kde je rychlá návratnost: vyhledávání v dokumentech, reporting, testování a příprava kódu — právě tam agentní přístup přináší nejvíc užitku. Pro veřejnost to znamená více AI v každodenních službách, ale také větší význam transparentnosti, bezpečnosti a možnosti obrátit se na poskytovatele, když něco selže. V říjnu bude klíčové sledovat uzavírání konkrétních kontraktů na výpočet a první širší piloty agentních nástrojů v podnicích — tam se ukáže, co z papíru obstojí v praxi.

Zdroje:

[1] NVIDIA newsroom: LOI s OpenAI na ≥ 10 GW. NVIDIA Newsroom
[2] Reuters: NVIDIA plánuje investovat až 100 mld. USD; LOI s OpenAI. Reuters
[3] CoreWeave (investors): rozšíření dohody s OpenAI až o 6,5 mld. USD; celkem ~22,4 mld. USD. investors.coreweave.com
[4] Anthropic blog: Introducing Claude Sonnet 4.5. Anthropic
[5] Reuters/Axios k uvedení Sonnet 4.5 (výkon, delší autonomní běhy). Reuters+1
[6] Google Developers Blog: aktualizace Gemini 2.5 Flash/Flash-Lite (+5 p. b. na SWE-Bench Verified). developers.googleblog.com
[7] DeepMind blog: Gemini 2.5 Deep Think — gold-level výkon na ICPC. Google DeepMind
[8] Financial Times: kontext k ICPC (OpenAI 12/12; význam a limity). Financial Times
[9] Reuters: Alibaba spustila Qwen3-Max (> 1 bilion parametrů). Reuters
[10] Alibaba Cloud: přehled Qwen3-Max a schopností (Apsara). AlibabaCloud
[11] Evropská komise: konzultace — draft guidance & reporting template pro „serious AI incidents“ (26. 9.–7. 11. 2025). Digitální strategie EU

Sdílejte:

Facebook LinkedIn Twitter

Nenechejte si ujít nejnovější informace.

Vyplňte nám vaši e-mailovou adresu a dostávejte pravidelnou nálož informací ohledně nadcházejících školení, akcí a testingového know-how.

Jméno a příjmení *
Firma *
E-mail *		Telefon *
Zpráva *

Proč Tesena

Technologie

Tesena Labs

Náš tým

Testování a Quality Engineering

Školení

Webináře

Klikaton

Volné pozice

Benefity

S kým budete spolupracovat

FAQ

Koho zbavujeme chyb

Jak to vidí Teseňáci