Аніма Анандкумар, NVIDIA — про технології навчання ШІ, його адаптивності та проблеми

Думки
11 серпня 2020

Аніма Анандкумар, NVIDIA — про технології навчання ШІ, його адаптивності та проблеми

Далі

Христина
Рудич

Контриб’ютор

Христина
Рудич

Контриб’ютор

Штучний інтелект поступово проникає у всі сфери нашого життя, але паралельно він продовжує динамічно розвиватися. І незважаючи на гучні успіхи — перемогу ІІ над людиною в грі го, безпілотники та розпізнавання онкології на знімках, багато області досі залишаються лише предметом досліджень, що стають ще більш актуальними в умовах пандемії. «Хайтек» записав виступ Аніми Анандкумар, директора з досліджень в області машинного навчання в NVIDIA, на онлайн-конференції Startup Village. Аніма розповіла про те, як відбулася революція у розвитку глибинних нейромереж і які перспективи їх очікують.

Аніма Анандкумар — професор в Каліфорнійському технологічному інституті і директор по дослідженнях в області машинного навчання в NVIDIA. Раніше була головним науковим співробітником Amazon Web Services. Отримала кілька нагород, серед яких — стипендія імені Альфреда П. Слоана, премія за кар’єру NSF, нагороди молодих дослідників від Міністерства оборони і стипендії викладачів від Microsoft, Google і Adobe. Є членом експертної ради Всесвітнього економічного форуму. Захоплена розробкою алгоритмів ІЇ та їх застосуванням в міждисциплінарних додатках. Її дослідження зосереджені на неконтрольованому штучному інтелекті, оптимізації та тензорних методів.

«Ситуація з коронавірусом показує, що люди набагато випереджають ІІ»

Як почалася революція штучного інтелекту? Вже кілька десятиліть з’являються цікаві відкриття в цій області. Для людини немає нічого звичайнішого, ніж розпізнавати зображення на екрані. Але для ИИ це вкрай складне завдання, тому що він не народжується з уже заданими здібностями до цього. Перед вченими стояло завдання «навчити» машинний мозок ідентифікувати побачене. На самому початку досліджень один з професорів Стенфорда почав підписувати зображення, щоб комп’ютера було легше їх класифікувати. Саме марковані картинки стали початком революції глибинного нейронного навчання.

Вихід на новий рівень розробки ШІ розпочався із закладання в програму мільярдів параметрів, які дозволять йому дізнатися конкретний об’єкт. Складність завдання в тому, щоб глибинна нейромережа в умовах інваріантності розпізнала, наприклад, собаку незалежно від відмінності поз, фарбування, породи і так далі. Навчання штучного розуму означає, що під час процесингу зображення в ієрархічному порядку розглядається цілий ряд шарів кадру. Так, на базовому рівні видно лише лінії під різними кутами один до одного. Потім вони з’єднуються і утворюють більш складні форми, припустимо, морду собаки в кольорі. Помітні вже форма, колір та інші окремі характеристики. Саме етап, коли ми навчилися поділяти процес на частини, на рівні, став величезним кроком вперед.

Для подальшого розвитку потрібні не тільки глибинні нейронні мережі, але і величезні обчислювальні потужності. Протягом останніх десятиліть ми бачили уповільнення зростання можливостей наших комп’ютерів, коли більше не збільшується в два рази швидкість однопоточних обчислень. Але при цьому зараз ми можемо паралельно проводити розрахунок величезних за обсягом і складністю операцій. Сучасний рівень розвитку глибинних мереж привів до того, що зараз у них можуть відбуватися мільярди процесів одночасно. І мета їх одна: визначити, що ж зображено на фотографії. Ця процедура здійснюється за допомогою матриксних мультиплікаційних процесів і інших технологій. І тут, звичайно, все залежить від потужності відеокарт.

До 2014 року глибинні нейромережі змогли краще людей розпізнавати зображення, а значить, сьогодні вони стали ще досконалішими. Це сталося завдяки об’єднанню трьох факторів: можливостей маркованих даних, гнучкості існуючих алгоритмів глибинних нейромереж і величезних можливостей комп’ютерів. Є багато прекрасних прикладів того, які висоти вже брав машинний мозок, наприклад, глибинне навчання з підкріпленням допомогло ІІ перемогти людину в грі го. Цей гравець був одним з кращих, але він програв. Крім того, зараз штучний інтелект здатний генерувати фотографії людей настільки реалістичні, що ця технологія вже пройшла тест Тьюринга. Людина вже не може зрозуміти, яке зображення реально, а яке було створено машиною. Це відмінні приклади успіхів ШІ, але, напевно, на цьому прогрес не зупиниться.

Однак є цілий ряд прикладів, де ИИ не виправдав очікувань. Припустимо, ситуації, де ключовим аспектом є безпека. Вже кілька десятиліть ми бачимо посилення технологій, які використовуються в автономних автомобілях, але, на жаль, їх недостатня досконалість все одно призводить до аварій. Також машина не може замінити людину в тому, що стосується створення контенту та його редагування. І нинішня ситуація з коронавірусом показує, що люди набагато випереджають ІІ.

Чим ми будемо займатися в майбутньому, розвиваючи штучний інтелект і технології глибинних нейромереж? На даний момент активно розвивається робототехніка: наприклад, в одній компанії є робот, який вміє робити сальто назад. Але його не можна навіть порівняти із собакою. Цей робот незграбний, постійно падає, але тварина, падаючи, вчиться, як наступного разу зробити той чи інший рух, не впавши. А робот на це не здатний, він не навчений. Тут виникає питання, чи можливо зробити ШІ, який буде готовий самостійно навчатися і вирішувати проблеми?

«Розуміння алгоритмів знаходиться за межами наших можливостей»

Алгоритм штучного інтелекту — це сукупність заздалегідь закладеної інформації і дуже чіткого завдання. Ми визначаємо, які дані і попередньо задані параметри повинні використовуватися, а також як реалізувати процес прийняття рішень. Для створення і підтримки алгоритму ІІ потрібні величезні обсяги даних. Це складно, тому що даних стає все більше і більше, наприклад, при розпізнаванні відеопотоку кількість розпізнаваних кадрів дуже велике. Проблематично проводити маркування, тому що люди присвоюють назви мільйонам відеороликів, а значить, і об’єктів на екрані.

Що стосується заздалегідь закладених параметрів, то знову доводиться стикатися з тим, що все робиться вручну. Зараз легко обдурити ІІ. Наприклад, якщо у нас є знак «Стоп» і ми помістимо на нього кілька блоків, то штучний інтелект вже не зрозуміє його значення. І автомобіль, що рухається без допомоги водія, вже не розпізнає цей знак як заклик зупинитися. Наш, людський інтелект зовсім інший. Може бути, ми зможемо перенести образ нашого мислення в комп’ютер, але поки ми цього не змогли зробити. Що стосується вказівок, наказів та інструкцій, то доводиться діяти дуже просто: ми даємо одне завдання — розпізнати, що зображено на малюнку. А що стосується параметрів оцінки успіху або неефективності роботи алгоритму, то тут ми дуже обмежені.

Ми іноді не можемо зрозуміти, наскільки успішний діючий алгоритм, тому що це знаходиться за межами нашого розуміння. Крім того, є кілька проблем, пов’язаних з тим, що дані, які у нас є, в основному стосуються чоловіків зі світлою шкірою. З цієї причини ІЇ неправильно визначає темношкірих жінок. Є й інші помилки в розпізнаванні осіб. Проблема виникає із-за того, що оцінка ефективності штучного інтелекту вкрай обмежена. Не потрібно забувати про парадигмі, яка говорить, що нам потрібні величезні обсяги даних, і всі вони повинні бути марковані. Заздалегідь закладені параметри повинні бути зрозумілі алгоритму, а саме завдання повинно бути простим і логічним.

Спочатку потрібно добитися відсутності необхідності маркувати дані. ІЇ повинен працювати без допомоги людини, щоб комп’ютер сам знаходив концепти, формував ідеї, розумів особливості того чи іншого зображення. Чи складно це? Так, дуже, але ж люди це роблять, причому з легкістю. Що стосується заздалегідь закладаються даних, тут потрібно створювати дуже чіткі образи, показувати, що є що з тих даних, які ми «годуємо» системі. І тут можна багато чому навчитися у мозку людини. Ну і, нарешті, завдання, які ми даємо алгоритмом. ІІ повинен бути більш адаптивним, тому що зараз ми щоразу з нуля навчаємо нашу систему, а потрібно зробити так, щоб вона могла адаптуватися і змінюватися, виконувати різні завдання. Так що зараз ми тренуємося, щоб зробити штучний інтелект гнучким.

Як зрозуміти, що перед нами кішка?

Ми дізнаємося кішку, навіть якщо це розмита картинка, тому що наш мозок постійно намагається розмитому зображенні надати певну різкість для подальшого аналізу. Є багато теорій, і одна з найвідоміших говорить, що ми не тільки дивимося на якийсь об’єкт, але і одночасно мозок підбирає варіанти того, чим він може бути. Цим же займаються і глибинні нейронні мережі. У нас є апріорні дані про те, як повинна виглядати кішка. І ми намагаємося зіставляти цю картинку з уявленням про те, як виглядають коти. Це важливо розуміти при розробці, щоб було сталість ідентифікації зображень.

Як нам дійти до стабільності в ідентифікації об’єктів штучними мережами? Природним чином це відбувається з-за повторюваності. Ми беремо якусь зовнішню картинку і дивимося на неї, а сигнал надходить у мозок. Є також і спадна зворотний зв’язок. Використовуючи інформацію про те, як виглядає кішка, мозок формує певне сприйняття. Як зробити так, щоб ці складні процеси нашого мозку реалізовувалися ІІ? Необхідно поєднати гарний класифікатор для поняття «кішка», який будуть «згодовувати» нейронної мережі, з відмінним генератором цих зображень. Одночасно відбуватиметься класифікація поняття і навчання нейронної мережі. Буде отримана зворотний зв’язок для стандартних нейронних мереж. І ця зв’язок дасть можливість отримувати генеративну зворотний зв’язок. Іншими словами, при спробі обробити вхідний сигнал людина намагається маркувати зображення. І тоді виникає зворотній зв’язок, коли ми намагаємося згенерувати сприйняття на основі того, що бачимо. Ці два процеси повинні бути взаємопов’язані.

Стандартна нейромережа, як правило, не може розпізнати картинки нечіткі, але наша модель завдяки механізму зворотного зв’язку робить образи більш чіткими і потім зможе їх розпізнати. Ми бачимо, що така схема довела свою дієвість, тому можемо натхнені тим, як бачить людина, при створенні комп’ютерного зору. На основі вже розроблених моделей можна створювати більш досконалі алгоритми, які будуть відрізнятися високою продуктивністю. Але також потрібна ефективна інфраструктура, яка буде обробляти процеси ІЇ у великому масштабі. Ми працюємо з алгоритмами не окремо. Ви берете якісь дані і їх потрібно візуалізувати, що є дуже складним процесом. Тому потрібен потужний процесор, здатний обробляти значні обсяги інформації. Крім того, ми використовуємо певні фреймворки (CLARA) для різних додатків, в тому числі і для медицини. Зараз з урахуванням пандемії COVID-19 з’явилася потреба в тому, щоб тренувати моделі машинного навчання у великих масштабах. Метою цього є розробка вакцин і ліків від вірусу. Інструмент CLARA може працювати з об’ємними структурами і різними алгоритмами, будучи по суті координатором їх роботи.

Ще одна можливість навчання ШІ полягає у використанні не реальних, а стимульованих даних. У нас є ряд роботів, які можуть стати шеф-кухарями на наших кухнях. Такі машини здатні відкрити і закрити ящик, взяти якийсь предмет, щось змішати або збити. Ці прості для людини операції дуже складні для роботів, так як навчити їх цьому проблематично. Але з допомогою процесів моделювання ми зможемо відкривати неіснуючі, запрограмовані ящики. І таким чином робот навчається подібних операцій. Програми дозволяють робити це паралельно і у великих масштабах, що дозволяє подолати обмеження, які накладають на нас дані. Але така система навчання означає, що потрібно розробити дуже складні алгоритми, які переведуть машину зі світу симуляції в реальний світ, відкриваючи абсолютно нові, захоплюючі перспективи роботи з ІІ. Є програма, яка дозволяє додавати симуляцію до тим моделям, коли штучний інтелект навчається на реальних даних. Це ще один приклад того, що у нас є хороша інфраструктура і ми можемо працювати з дуже складними проблемами. З’явилася можливість створювати нові алгоритми і моделі, а також тестувати їх набагато швидше, ніж це робилося раніше.

Майбутнє ІІ повинно бути всеосяжним і знаходити своє втілення в різних сферах, щоб у нас був высокоадаптивный, постійно навчається інструмент. Для цього зараз потрібно переосмислити підходи до глибокого навчання. Самостійне навчання є ключем до успіху, тому потрібно знаходити способи вбудовувати програми неконтрольованого навчання в системи. І якщо говорити про згорткових нейромережах, система зворотного зв’язку робить їх більш стійким. А це перший крок до того, щоб створити реальну базу для ІІ нового покоління.

Читайте також:

Шукач скарбів знайшов скарб в Шотландії, якому 3000 років

Метеорний потік Персеїди — 2020: де його побачити, куди дивитися і як зробити фото

Подивіться на 3D-мапу Всесвіту: її складали 20 років і вона вже здивувала вчених

Источник

Описание admin

Рекомендуем прочесть

Tesla представить двофакторну аутентифікацію

Новини 16 серпня 2020 Tesla представить двофакторну аутентифікацію Далі Ильнур Шарафиев Редактор Ильнур Шарафиев Редактор …

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *