OpenAI představilo ChatGPT Images 2.0: lepší text v obrázcích i „thinking“ režim
OpenAI představilo novou generaci svého generátoru obrázků ChatGPT Images 2.0, který má výrazně zlepšit přesnost výstupů a použitelnost pro reálnou práci. Nový model staví na technologii GPT Image 2 a zaměřuje se hlavně na oblasti, kde starší generátory často selhávaly, například na správné vykreslení textu, ikon, uživatelských rozhraní nebo složitějších kompozic.
Novinka přináší také tzv. „thinking capabilities“, tedy schopnost před generováním lépe promyslet strukturu výsledného obrázku. V placených verzích ChatGPT (Plus, Pro, Business a Enterprise) dokáže model využít i informace z webu nebo z nahraných souborů a následně vytvářet například vizuální explainery, marketingové materiály nebo konzistentní sady až osmi obrázků najednou.
Výrazně se zlepšila také podpora vícejazyčného textu v obrázcích – nejen v angličtině, ale i v japonštině, korejštině, čínštině, hindštině nebo bengálštině. OpenAI uvádí, že model zvládá lépe zachovat detaily, přesněji následovat zadání a generovat výstupy až ve 2K rozlišení s různými poměry stran, například pro bannery, prezentace nebo sociální sítě.
Images 2.0 je dostupné pro všechny uživatele ChatGPT a Codex, přičemž pokročilé „thinking“ funkce jsou vyhrazené hlavně placeným tarifům. OpenAI zároveň zpřístupňuje také API modelu gpt-image-2 pro vývojáře, kteří jej mohou integrovat do vlastních aplikací.
Pro více informací: https://openai.com/index/introducing-chatgpt-images-2-0/
… reposted this!