https://www.bbc.com/news/videos/cll445rgjq0o
Компанія OpenAI представила останню версію технології, яка лежить в основі її чату ChatGPT. GPT-4o буде доступний всім користувачам попередньої версії, включаючи тих, хто не платить за користування сервісом. Як стверджують розробники, нова версія працює швидше за попередню і поводиться більш розкуто — може дозволити собі трохи побалакати, а то й пофліртувати.
GPT-4o може зчитувати зображення та обговорювати побачене, перекладати з однієї мови на іншу та визначати емоції з виразу обличчя. Робот, на відміну від попередніх версій, також може запам'ятовувати попередні розмови. Його можна переривати на півслові, і він має легший розмовний ритм — на демонстрації затримки між питанням і відповіддю практично не було.
Компанія OpenAI заявила, що впроваджуватиме нові функції поступово, щоб забезпечити їхнє безпечне використання. Нова модель — це крок уперед у галузі штучного інтелекту, переконана головний технічний директор OpenAI Миру Мураті. «Ми дивимося на майбутнє взаємодії між нами та машинами, — каже Мураті. — І ми вважаємо, що GPT-4o справді змінює цю парадигму».
Під час демонстрації голосової версії GPT-4o він не просто вирішив просте рівняння, написане на аркуші паперу, а й дав корисні рекомендації про те, як його вирішити. Він аналізував комп'ютерний код, перекладаючи з італійської на англійську, і інтерпретував емоції на фотографії усміхненої людини.
Після OpenAI материнська компанія Google Alphabet продемонструвала власні розробки у сфері штучного інтелекту. У тому числі вона показала чергову версію чат-бота Gemini та новий ШІ-помічник для свого пошуковика. Google оголосила про нові розробки під час щорічної конференції для розробників у Каліфорнії.
Основну увагу вона приділила вдосконаленій моделі Gemini Pro 1.5, яка тепер здатна "перетравлювати" вдвічі більше даних. Google також представила Veo — модель штучного інтелекту, яка, на його думку, є найпотужнішою для створення відео за простою текстовою командою.
Компанія зробила доступною технологію створення відео в січні, але лише через кілька тижнів вийшла Sora від OpenAI, виробника ChatGPT, що виявилася більш просунутою. Sora відразу привернула увагу Голлівуду, викликавши одночасно захоплення та занепокоєння.
Google також анонсував полегшену версію Gemini під назвою 1.5 Flash, яка покликана знизити вартість ШІ і збільшити швидкість отримання результатів. Як і потужніша версія, Flash може обробляти великі обсяги даних, але при цьому оптимізований для чат-додатків, відео та підписів до зображень.
Цього тижня сотні мільйонів користувачів пошуковика Google у США почнуть періодично отримувати короткий виклад результатів запиту, узагальнений технологією штучного інтелекту A.I. Overviews. Передбачається, що ці вичавки будуть з'являтися у верхній частині сторінки тільки в тому випадку, коли системи Google вважатимуть їх найшвидшим і найефективнішим способом задовольнити цікавість користувача.
Найчастіше це відбувається, коли запит стосується складніших тем та питань; при звичайному пошуку, наприклад, прогнозу погоди чи товарів у магазинах, результати, як і раніше, складаються з посилань на сайти. Google очікує, що до кінця року А.І. Overviews стане частиною результатів пошуку приблизно для 1 мільярда людей.
Функція А.І. Overviews може принести проблеми компанії, оскільки здатна скоротити доходи від реклами, які лише торік принесли Google 175 млрд доларів. Річ у тім, що й A.I. Overviews працюватиме надто добре і стане видавати користувачам все необхідне у верхній частині сторінки, знизиться кількість переходів за посиланнями (хоча вони все одно з'являтимуться в результатах пошуку). В результаті частину аудиторії можуть втратити різні сайти — від великих ЗМІ до підприємців та стартапів.
Читайте також:
Олена Зеленська зустрілася з Олександром Вучичем, до Києва прибув Ентоні Блінкен