Імовірність захоплення людства штучним інтелектом і перспективи еволюції технології. Інтерв’ю з науковцем

Be First!

byОлесандр Величко 29 Січня, 2024 Економіка

У 2023 році найпопулярнішим словом за версією словника англійської мови Collins стала абревіатура ШІ (штучний інтелект). Популярність цього терміну пояснюється бумом генеративних моделей, які заполонили інформаційний простір.

Про ШІ говорять усі: ЗМІ намагаються розібратися з популярністю технології, економісти дискутують про нього як про чинник четвертої промислової революції, а політики пропонують закони для його регулювання.

Однак попри жваву дискусію для більшості людей ШІ залишається чорною скринькою. З холодним розумом за цим спостерігають лише науковці, адже те, що всі називають революцією, для них – еволюція.

“Я вже 20 років у сфері ШІ. Моя магістерська робота була в цьому напрямку. Як викладач, як дослідник і людина, дотична до написання політик, вважаю, що те, що ми зараз чуємо про експоненціальний вибух розвитку ШІ та технологічну сингулярність, є перебільшенням”, – розповідає керівник магістерської програми з комп’ютерних наук за напрямом Data Science Українського католицького університету та очільник комітету з питань розвитку сфери ШІ при Мінцифри Олексій Молчановський.

Чим насправді є штучний інтелект поза гучними заголовками та маркетинговим впливом?

Про розвиток штучного інтелекту та його перспективи у 2024-му році

— Якщо уявити шкалу розвитку технологій ШІ, де 0 – це поява перших обчислювальних машин, які здатні доводити теореми, а 10 – це система, яка може виконати завдання з будь-якої сфери подібно до людського інтелекту. Де ми знаходимось сьогодні?

— При всій повазі до запитання, але воно намагається спростити багатовимірну історію розвитку ШІ до однієї шкали. Коли ми говоримо про загальний штучний інтелект (artificial general intelligence, AGI), яким лякають людей, то в експертному колі його появу очікують не скоро.

Натомість, якщо розкласти технології ШІ на окремі застосунки, які сфокусовані на конкретній задачі, то побачимо, що все більше і більше задач ці технології вирішують куди краще, ніж людина. Це як з калькулятором, який рахує набагато краще, ніж я, але це не означає що він інтелектуально мене переміг.

З ШІ ми бачимо, як він добре пише та перекладає тексти, але до повністю автономного суб’єкта, який збудований з кремнію та працює на електроенергії – до цього дуже далеко.

По вашій шкалі ми знаходимося на рівні 2. Але якщо ми розкладемо на окремі задачі, тоді це буде 9.

— Зараз можна побачити чимало дискусій про інтеграцію функціонала різних ШІ в одного агента. Чи можливий варіант, коли від цієї ідеї відійдуть визнавши її нереалістичною?

— Воно так і буде. Потрібно розуміти, що розвиток цих технологій не має необмеженого фінансування. До прикладу, пік інвестицій у сфері ШІ був у 2021 році, останні два роки ми бачимо спад.

Для створення такого універсального агента потрібно багато коштів та зусиль і бізнесу це не вигідно. Це класний сюжет для фантастичних фільмів, але з точки зору економіки та функціонування суспільства, я мало вірю в те, що ми будемо вкладати в це ресурси.

У 2024 році понад 2 мільярди людей проголосують. Уже зараз всі хвилюються через ШІ. Що відбувається?

— У 2022 році ми побачили LLM, які могли вдало генерувати текст. У 2023-му – генеративний ШІ, який вже непогано працює із зображеннями та аудіо. Які технології ШІ матимуть успіх у 2024 році?

— Зараз буде багато інвестуватися в те, щоб перейти від зображень до відео. Чому це важливо? Якщо читачі спробують за допомогою генеративного ШІ створити картинку, де будуть дві людини, які сидять за столом і спілкуються, і потім захочуть, щоб одна з них підняла праву руку, то система цього не зробить.

Річ у тім, що ШІ не розуміє те, що називається “модель світу”. Система розпізнає взаємозв’язки між окремими пікселями, але не розуміє їх. Це означає, що створити відео, яке динамічно відображає різні способи спілкування людей, є складним завданням, яке потребує значних функціональних зусиль.

Це як з ChatGPT чи іншими чат-ботами на мовних моделях. У них є контекстне вікно, це певна кількість символів (токенів), яку ChatGPT тримає у своїй пам’яті, спілкуючись з вами. У разі виходу за межу цього вікна він забуває, про що була розмова на початку і починає галюцинувати чи навіть суперечити сам собі.

Крім того, у 2024 році ми побачимо використання того ж генеративного ШІ у нових нішах, серед яких журналістика, юриспруденція та генерація ліків, яка є не новою, але зараз отримала додаткове підсилення.

Також ми побачимо певне розчарування у цій технології, оскільки те, що я спостерігаю, є певна штучно створена бульбашка надочікувань продуктивності цих систем. На тестових прикладах нейромережа показує хороші результати, що дозволяє створити стартапи та залучити перших клієнтів, але коли справа доходить до витривалішої роботи, коли вам треба на масштабі показувати результати, виникають проблеми.

Наприклад, якщо хтось з читачів закине це інтерв’ю у ChatGPT і попросить зробити коротке резюме все буде ОК, навіть якщо він упустить кілька деталей це не велика ризикова історія. Натомість якщо юрист за допомогою ШІ спробує написати якийсь специфічний договір, ціна помилки одразу стає високою.

— В історії були кілька так званих “зим ШІ” (період уповільнення або відсутності значного прогресу в дослідженнях та розробці). Чи правильно вважати, що успіх останніх моделей, та швидка інтеграція ШІ в економіку назавжди відкинула можливість повернення такого періоду?

— Треба розуміти, що сам термін “штучний інтелект” першочергово є маркетинговим. Під ним розуміється дуже багато різних технологій. Деякі з них, як-от генеративний ШІ, можуть зазнати розчарування.

Однак, основним рушієм сучасного ШІ є машинне навчання, глибинне навчання, яке скоріш за все залишаться з нами. Тобто, я думаю, що там якраз зими не буде. Ми виходимо на те, що різні технології ШІ будуть з нами так само як електрика, освітлення, інтернет, wi-fi чи мобільний зв’язок.

Про “повстання машин” та проблеми штучного інтелекту

— Роздуми про ШІ часто зводяться до картинки повстання машин. Ймовірно, це зумовлено кінематографом. Чи дійсно потрібно хвилюватись через те, що розвиток технологій зрештою призведе до так званого повстання машин?

— Хвилюватись треба, але не з цієї причини. Ймовірність сценарію, у якому ШІ захопить людство, я оцінюю менше 1%.

— На цьогорічному ВЕФ в Давосі на одній з панелей, де обговорювали розширення ШІ, прозвучала теза, що даних в інтернеті вже недостатньо для навчання нових моделей. Чи може криза даних зупинити розвиток ШІ?

— Думаю, що воно призупинить такий стрімкий розвиток як це було останні 2 роки. Зараз намагаються розв’язувати цю проблему за допомогою синтетичних даних (створені шляхом компʼютерної генерації, використовуються для тренування та тестування систем ШІ – ЕП).Є навіть статистика, яка говорить, що для тренування нових моделей ШІ, вже використовується більше синтетичних даних, ніж природніх.

Окремою проблемою є й навчання LLM, а саме брак якісних текстів. Генерувати неякісні тексти – великого розуму не потрібно. А звідки взяти якісні? Вже бачимо, що тексти, згенеровані ШІ, потрапляють далі в інтернет і наступні покоління LLM вчаться на них. Таким чином створюється зворотний зв’язок, який підсилює, наприклад, упередження, помилки, які були в згенерованих текстах.

Але якщо ми подивимося на людський інтелект, нам не потрібно прочитати весь інтернет для того, щоб мати нормальне життя чи професійно розв’язувати задачі. І, власне, науковці зараз працюють над тим, щоб зменшити обсяги даних, необхідних для якісних моделей.

— Процес навчання ШІ дорогий та тривалий. А в результаті ми отримуємо моделі, що здатні непропорційно якісно виконують завдання. Наприклад, ШІ може створити прекрасний пейзаж, але досі виникають проблеми з людськими пальцями (їх кількість іноді більша). Чому так відбувається?

— Як я вже казав, ці моделі не мають моделі світу. У нас з вами вона є, тому ми базово розуміємо, що в людини є голова, руки, ноги, п’ять пальців на кожній кінцівці. Крім того, ми маємо уявлення про інерцію. Якщо я візьму опущу свій смартфон, то приблизно розумітиму як він рухатиметься. Це все людина вивчає, взаємодіючи зі світом.

Сучасний ШІ, який заснований на машинному навчанні, глибокому навчанні, той самий генеративний ШІ він позбавлений цього підходу від слова зовсім. Він працює тільки на рівні спостережень. Щоб навчити систему малювати їй показали мільйони картинок, на яких вона натренувалась співставляти, що піксель такого кольору в такій позиції, як правило, знаходиться з пікселем такого кольору в такій позиції.

Тому, коли ви просите її намалювати руку, а вона малює руку, просто тому, що в наборі даних, на яких вона навчалась, набір символів “рука” співставлялися з набором пікселів, яку людина розпізнає як руку.

Впевненість “білих комірців” тане на очах. Чому штучний інтелект став центральною темою Давоса?

— Ще однією проблемою генеративних ШІ, які працюють з текстом є “галюцинації”. Чому вони виникають і чи є вже розуміння того, як можна розв’язувати цю проблему?

— Знову ж таки, це та сама проблема з моделлю світу. Будь-яка LLM, генеруючи текст на конкретний запит, підбирає послідовно слова, які статистично близько знаходяться до цих слів в текстах, на яких вона навчалась. Це те, що англійською називається “pattern recognition” (розпізнавання образів).

Тому ШІ нічого не розуміє про контекст і про справжність. Він оперує на рівні так званих токенів, як набору символів, що такі слова, як правило, йшли за такою послідовністю слів.

Наприклад, слова Київ і Україна в текстах, які зустрічалися моделі, були дуже часто близькі між собою і тому в принципі десь вони мають поруч бути. Але система не розуміє, що таке столиця, чи що таке місто. Через це ШІ зможе будь-яке вигадане вами слово обґрунтувати й пояснити, бо він не вміє відмовляти.

Зараз працюють над розв’язання цієї проблеми. Один з варіантів – надати ШІ доступ до баз даних з реальними фактами. Для цього нам треба розуміти, як співставляти ці факти, оскільки це не так просто, як може здатись.

Крім того, генеративний ШІ по своїй побудові не здатний гарантувати вам логічну несуперечність того, що він виводить. Тому інженери працюють над тим, що подружити генеративний ШІ з ще одним напрямком у цій сфері – математичною логікою. Поєднання цих двох напрямків – це ключ до безпечного та ефективного використання ШІ в медицині та інших сферах високого ризику.

— Сучасний бум довкола ШІ зумовлений трьома причинами: дані, обчислювальні потужності та алгоритми, останні ґрунтуються на алгоритмах 60-70-х років. Які фактори потрібні для нової якісної зміни?

— Привабливість науки полягає в тому, що ми не знаємо, що в нас за рогом. Так сталося, що у 2012 році ці три фактори зійшлися докупи, як наслідок кількість перейшла в якість. Зараз, наприклад, додатковим фактором можуть стати енергетичні ресурси.

Або приклад з вбудованим ШІ, який почне активно взаємодіяти зі світом. Але це теж небезпечна історія, адже що означає взаємодіяти зі світом? Вже зараз компанії, які створюють чат-боти на основі ШІ можуть таке зробити. Проте ми як користувачі цього не захочемо, бо тоді ШІ отримає певну агентність, коли він ставитиме над нами експерименти, видаючи різні відповіді, щоб перевірити власну гіпотезу.

— Які нові неочевидні сфери, де можна інтегрувати ШІ ви бачите?

— Тут відповідь проста. Ви можете застосовувати ШІ там, де у вас є достатньо унікальних і цікавих даних. Інколи ставлять подібне запитання про Україну: в якій сфері тут розвивати ШІ? Потрібно дивитись, де наша нація, держава, має якісь цікаві дані.

— Зараз це війна.

— Так, але не тільки. Це може бути агросектор чи та ж енергетика, або логістика.

— Наскільки людство далеке від появи AGI (artificial general intelligence – загальний ШІ)?

— Дуже далекі. Я не вірю, що він взагалі коли-небудь досяжний. У цього напрямку є багато запитань. Що ми розуміємо під загальним штучним інтелектом? Якщо він має бути подібним до людини, то до якої? До нас із вами чи до тієї, яка школу не закінчила чи до нобелівського лауреата? На кого ми орієнтуємося? І таких питань насправді дуже багато.

Про ризики штучного інтелекту та можливості для України

— Які ризики щодо використання ШІ наразі є найбільш серйозними?

— Найбільший ризик на сьогодні це використання ШІ для маніпуляцій людською свідомістю. Це все, що ми бачимо в інфопросторі, поширення фейків згенерованих моделлю для руйнування демократичних інституцій. Ті ж діпфейки, які стає все важче розпізнати.

Друге – це кібербезпека. Я припускаю, що кібератака на “Київстар”, або подібні випадки вже відбуваються за допомогою ШІ.

Третій – це фактично концентрація найпотужніших ШІ в руках корпорацій. Як наслідок ШІ перестав бути демократичним. Вже зараз, щоб натренувати модель рівня GPT чи LLaMA, жодний університет у світі не має відповідних потужностей. Нам стає все важче піддати сумніву і критикувати те, що створюють корпорації, оскільки ми банально не знаємо, що “під капотом” у тих же моделей OpenAI.

— У такому контексті чи зможе настати момент, коли при розумінні того, що щось пішло не так, ми вже не зможемо втрутитись в роботу ШІ, щоб внести зміни?

— Це складне питання, оскільки знову ж таки, немає одного ШІ, який захопив світ і достатньо його просто вимкнути з розетки. Натомість можемо припустити, що ми почали використовувати систему, на якій завʼязано багато процесів. У випадку, коли ми побачимо помилки, їхнє виправлення суто економічно може бути більш вартісним, ніж просто перестати користуватись конкретним ШІ.

У 2015 році в компанії Google стався цікавий випадок. Один з їхніх сервісів “Google фото”, куди завантажуються фотографії зі смартфона, використовує ШІ для автоматичного сортування зображень. ШІ може визначити, де пейзаж, а де зображено людину. І ось одного разу ШІ фотографі з темношкірими людьми підписав як “горила”. Це трапилось, тому що в компанії не було достатньо якісних даних, щоб натренувати систему розпізнавати темношкірих людей.

І Google не зміг це виправити, оскільки це все чорна скринька. Десь в системі є один нейрон чи кілька нейронів, які активізувались, коли побачили такий набір пікселів. У результаті компанії нічого не залишилось, як просто заборонити маркувати фото підписом “горила”.

“Війну виграють технології”. Як штучний інтелект допоможе перемогти у війні з РФ?

— Ви також є головою комітету з питань розвитку сфери ШІ при Мінцифри. Який шлях в контексті сучасних дискусій про регулювання ШІ є найбільш релевантним для України?

— Дискусії повʼязані з регулюванням ШІ, зокрема новим законодавством ЄС, яке вважають жорстким, стосується того як воно вплине на ринок і його конкурентноздатність. Одна сторона переконує, що нові норми ЄС зроблять їхній ринок менш привабливим, ніж, наприклад, у США.

Але є інша точка зору, де стверджується, що ринок ЄС дуже привабливий через свої розміри, і компанії все одно захочуть туди зайти, попри більш жорсткі закони. Щобільше, якщо вони не захочуть цього робити у Євросоюзі є свої компанії.

Україна рухається в ЄС. Коли ми станемо членами Євросоюзу, ми будемо змушені адаптувати наше законодавство до AI Act. Тому бігти поперед всіх, створюючи закон про ШІ немає сенсу, у нас не такий розвинений ринок.

Зараз в основі впровадження регулювання ШІ лежить bottom-up підхід, який передбачає рух від меншого до більшого: спочатку надання бізнесу інструменту для підготовки до майбутніх вимог, а після цього буде ухвалено закон.

— Яких ресурсів: даних, інтелектуально потенціалу чи обчислювальних потужностей Україні недостатньо для створення власних потужних систем ШІ?

— Найменша спроможність у технічних ресурсах. Зараз це основний gamechanger в індустрії. Ти можеш мати дані, можеш мати алгоритми, але якщо в тебе немає 100 чи 1000 графічних карток (відеокарт – ЕП), ти просто не отримаєш цю модель, ти будеш тренувати роками. І в Україні немає таких ресурсів, обчислювальний кластер нашого університету має порядку 15 таких карток, ми можемо подвоювати це число, проте це все одно дуже мало.

Як людина з академії, я б хотів побачити, щоб у нас з’явився обчислювальний центр, куди і науковці, і бізнес з демократичними принципами могли отримати доступ. Крім того, не менш важливим є створення в Україні власного генеративного ШІ.

Багато хто з нас користується ChatGPT, але ми до кінця не знаємо, скільки там українських текстів, на яких він був натренований. Проте їх однозначно менше, ніж російських. Можливо, в десятки чи навіть в сотні разів. І це створює це певно упередження, яке ми спостерігаємо зараз у світі щодо України.

Подібна ситуація спостерігається й в освіті, де школярі все частіше використовують генеративні ШІ для написання домашніх завдань та вивчення світу.

Якщо ми як нація не запропонуємо власний продукт, який не буде упередженим до українців, який буде відображати світогляд, закладений в нашому законодавстві, Конституції та історії, це може становити безпековий ризик для нації.

Цей продукт ніхто не створить за нас. Його повинні розробити українці – чи то академія, чи то суспільство, чи то держава, чи то свідома корпорація. Не важливо хто, але це мають зробити саме українці.

About Author

Олесандр Величко

Олесандр Величко відомий як опозиційний громадський діяч, зірка сучасної журналістики і борець за народні права. Він автор документальних фільмів про популярних діячів культури, спорту, політики та історичні події 20 століття. За самовіддану роботу в сфері телемовлення та журналістики Олесандр Величко у 2010 році отримав премію імені Влада Лістьєва, з яким у 90-х роках встиг попрацювати.

See author's posts

Олесандр Величко

Post Views: 41