Blogs

Jakub Benešovský

Test Automation Engineer

Ohlédnutí za AI v roce 2024

27. 2. 2025

Ať už jste novinky z AI tolik nesledovali, chatboty využívali jen občas, nebo vás jen zajímá, co vám mohlo uniknout, přinášíme shrnutí roku 2024 z naší perspektivy – co nás nejvíce ovlivnilo a zaujalo.

Umělá inteligence a zejména chatboti se stávají stále častějšími společníky v naší práci. Používáme je k analýze a sumarizaci zdrojů, generování segmentů textací i kódu, zprostředkování přehledů a informací o specifických znalostních oblastech. Zvykli jsme si na ně natolik, že i výrazné pozitivní změny v jejich schopnostech je snadné rychle zapomenout a brát za samozřejmé. Jak rok 2024 tedy ve světě AI vypadal?

Rok plný novinek: Od textových modelů po komplexnější vnímání a odpovědi

Na začátku roku 2024 primárně pracujeme s modely Gemini (dříve Bard), Claude 3.0, GPT-3.5, GPT-4. Tyto modely jsou vesměs pouze textové, maximálně s omezenou podporou práce se soubory, často u nich narážíme na omezení délky zprávy a aktuálnosti jejich znalostí.

V únoru nabízí Gemini Advanced možnost upravovat a spouštět kód v Pythonu, míra adopce zpoplatněného Gemini Advanced je ale stále velmi nízká, proto doufáme, že se tato možnost objeví i u chatbotů, které používáme denně.

Od května běží Gemini Advanced na modelu Gemini 1.5 Pro a je schopen přímo pracovat se soubory PDF, Word a Google dokumenty. Open-AI představuje model GPT-4o-preview, který zvládá nyní zpracovávat i generovat zvuk a obraz v reálném čase. Je nyní schopen naslouchat konverzaci a reagovat na ni. Pro úspěch verze 4o-preview, dočasně zapomínáme na ostatní modely.

V červnu dostává Gemini mobilní aplikaci. Přichází nová verze Claude 3.5 Sonnet přístupná zdarma. Claude dále představuje funkci Artifacts, pro kolaboraci mezi uživatelem a chatbotem nad soubory, a funkci Projects, pro sdílení sady souborů s chatbotem, čímž pro některé z nás se dorovnává na úroveň ChatGPT.

Červenec přináší nové modely Gemini 1.5 Flash a GPT-4o mini, což je nemalá výhra pro ty z nás, kteří si stále chatbota neplatí. V srpnu pak Gemini představuje roboty Gem, jako možnost vytvoření vlastního přizpůsobeného chatbota.

V září Claude představuje předplatné pro firmy, kde zaručuje bezpečí dat. OpenAI přichází s modely o1-preview a o1-mini, čímž se naše nabyté znalosti prompt engineeringu zdají stále méně relevantní.

V říjnu Google představuje Imagen 3, zatím jejich nejlepší generátor obrázků z textu. Claude uvádí Analysis tool, pro psaní a spouštění kódu s možnostmi pokročilé datové analýzy, a možnost hlasového zadávání v mobilních aplikacích.

Od listopadu lze v Gemini uložit preference ohledně zájmů a komunikace. Podobně i Claude nabízí skrz Styles upravovat tón a styl výstupů. Claude již také nabízí možnost integrace s Google dokumenty. Vychází AI DeepSeek, jako konkurence modelů GPT co do výkonu, efektivity a zejména ceny.

V prosinci přichází Gemini 2.0 Flash Experimental, Geminy 2.0 Experimental Flash (Gemini-exp-1206) a také Deep Research pro Gemini 1.5 Pro. Claude poskytuje Custom Instructions, pro zadání trvalých preferencí a instrukcí, vylepšuje také práci s velkými soubory a schopnosti Analysis tool. OpenAI uvádí oficiální verzi o1, ta oproti 01-preview věnuje více zdrojů analýze dotazu a snaží se zpětně kontrolovat vracenou odpověď pro kontrolu zodpovězení původního dotazu. Také spouští službu ChatGPT Pro s neomezeným přístupem k verzi o1 a hlasovému zadávání.

Koncem roku již vnímáme možnost hlasového zadávání, práce se soubory, včetně snímků obrazovky, a preferencemi jako standard. Také jsme si zvykli, že pro generování obrázků, ilustrací a dohledávání odkazů není nutně potřeba chodit nijak daleko. Modely v oblastech logiky, řešení úloh a základních aritmetických operací již nevnímáme jako neschopné a nespolehlivé.

Co přinese rok 2025? Výzvy a očekávání

Nezbývá než zakončit tužbami na rok 2025, doufáme totiž, že se modely nadále budou zlepšovat zejména ve schopnostech držení kontextu a historie konverzace, které se zdánlivě zhoršují. Očekáváme další pokroky ke zlepšení přívětivosti spolupráce nad společnou obrazovkou a schopnostech našich asistentů provádět autonomní akce ve vybraných aplikacích. Také očekáváme, že AI agenti se budou zdokonalovat ve schopnostech řešení komplexních úkolů a proniknou hlouběji do našich každodenních životů.

Facebook LinkedIn Twitter

Don't miss out on the latest updates.

Fill in your email address to stay informed about upcoming training sessions, events, and testing know-how.

Don't miss the latest updates

Leave us your email address and receive a regular dose of information about upcoming courses, events, and testing know-how.

First and last name *
Company *
E-mail *		Phone *
Message *

Why Tesena

Technologies

Tesena Labs

Our team

Testing and Quality Engineering

Training courses

Webinars and Meetups

Klikaton

Blogs

Podcasts

Available positions

Benefits

Who will you be working with

FAQ

Who are we helping with bugs

How the Teseners see it

Skill matrix

Ohlédnutí za AI v roce 2024

Rok plný novinek: Od textových modelů po komplexnější vnímání a odpovědi

Co přinese rok 2025? Výzvy a očekávání