Область наук:

  • Філософія, етика, релігієзнавство

  • Рік видавництва: 2020


    Журнал: Соціальні та гуманітарні науки. Вітчизняна і зарубіжна література. Сер. 8, Науковедение: Реферативний журнал


    Наукова стаття на тему '2020.01.008. Ціхіних Р.М., КАЙЗЕР Д. ГЛИБИННІ нейронні мережі ЯК НАУКОВІ МОДЕЛІ. CICHY R.M., KAISER D. DEEP NEURAL NETWORKS AS SCIENTIFIC MODELS // TRENDS IN COGNITIVE SCIENCES. - 2019. - VOL. 23, N 4. - P. 305-317. - DOI: HTTPS://DOI.ORG/10.1016/J.TICS.2019.01.009 '

    Текст наукової роботи на тему «2020.01.008. Ціхіних Р.М., КАЙЗЕР Д. ГЛИБИННІ нейронні мережі ЯК НАУКОВІ МОДЕЛІ. CICHY R.M., KAISER D. DEEP NEURAL NETWORKS AS SCIENTIFIC MODELS // TRENDS IN COGNITIVE SCIENCES. - 2019. - VOL. 23, N 4. - P. 305-317. - DOI: HTTPS://DOI.ORG/10.1016/J.TICS.2019.01.009 »

    ?навчанні випробовуваних контролю патернів їх мозкової активності за допомогою декодувати нейронної зворотного зв'язку. Цей метод можна використовувати для того, щоб безпосередньо впливати на рівень впевненості, пов'язаний з репрезентації в ГРП. Застосовуючи цей метод в рамках різних експериментів, можна було б отримати докази того, що механізм метапізнання є загальним для всіх репрезентацій в межах ГРП. Автори відзначають, що їх дослідження «допомагає краще зрозуміти не тільки природу ГРП, а й репрезентації, які воно глобально транслює» [с. 569]. Це наближає вчених до розгадки характеру свідомості.

    М.А. Сущин

    2020.01.008. Ціхіних Р.М., КАЙЗЕР Д. ГЛИБИННІ нейронні мережі ЯК НАУКОВІ МОДЕЛІ.

    CICHY R.M., KAISER D. Deep neural networks as scientific models // Trends in cognitive sciences. - 2019. - Vol. 23, N 4. - P. 305-317. -DOI: https://doi.org/10.1016/j.tics.2019.01.009.

    Ключові слова: філософія науки; когнітивна наука; глибинні нейронні мережі; штучний інтелект; пояснення; передбачення; дослідження.

    Автори з Німеччини, когнітивні вчені, з позицій філософії науки обговорюють можливість використання глибинних нейронних мереж (ДПС) в якості моделей в когнітивної науці.

    Здобули з недавніх пір значну популярність ДПС є обчислювальні алгоритми, що дозволили комп'ютерам вирішувати когнітивні завдання в реальному світі, які довгий час були не по зубах системам штучного інтелекту (ІІ), але з якими легко справляються люди: розпізнавання образів, обробка природної мови, планування і т.д. В останні кілька років ДПС зробили революцію спочатку в області комп'ютерного зору, а потім і в інших областях - обробки природної мови, контролю та планування (в іграх Atari і го), а також в області вивчення просторового орієнтування (знаходження найкоротшого маршруту на карті метро).

    Як відзначають автори, незважаючи на те що спочатку ДПС були створені для вирішення прикладних і інженерних задач, їх

    застосування в когнітивної науці також може виявитися дуже плідним. Не так давно було показано, що ДПС здатні передбачити судження людей про перцептивном схожості (human perceptual similarity judgments), а також краще, ніж інші моделі, пояснити нейронну активність сенсорної кори приматів. Однак спроби застосування ДПС в когнітивної науці викликали запеклі дискусії.

    Щоб оцінити потенціал ДПС як наукових моделей, вважають автори, перш за все необхідно визначити, чим характеризуються хороші наукові моделі. Можна, наприклад, спробувати визначити характеристики найкращої можливої ​​наукової моделі і взяти її як зразок для порівняння. Чи можлива такого роду одна досконала наукова модель в когнітивної науці? Автори знаходять таку можливість вкрай малоймовірною, так як, на їхню думку, між кращими властивостями моделей в когнітивної науці повинен існувати баланс і жодна з них не може володіти відразу всіма цими властивостями.

    Перевага властивості (desiderata) моделей поділяються на два класи: теоретичні та нетеоретична. До теоретичних властивостями моделей біологічних феноменів, по авторам, відносяться точність (наскільки точний результат моделювання), реалізм (схожість моделі і феномена) і спільність. Одночасно всі ці властивості модель може мати тільки тоді, коли модельований клас феноменів є гомогенним, тобто володіє однаковими властивостями. У всіх інших випадках модель не може бути однаково точної і загальної.

    Поведінка ж і мозок біологічних організмів не є однорідними ні в якому відношенні. Відповідно, в когнітивної науці не може бути однієї моделі, яку б в рівній мірі добре відрізняли точність, реалізм і спільність. Замість цього має бути безліч моделей зі своїми сильними сторонами. Наприклад, можливі моделі зору для будь-якого однієї людини, групи індивідів або різних організмів (людини і павука), але не для всіх цих агентів відразу. Тому щоб оцінювати науковий потенціал ДПС, зауважують автори, необхідно брати до уваги цілі моделювання, а також те, які якості моделей дослідники бачать пріоритетними.

    Крім того, моделі можуть оцінюватися також на основі нетеоретична критеріїв, до яких відносяться практичні (швидкість обчислення, легкість обробки) і етичні міркування. У науковій практиці останні часто беруть верх над теоретичними властивостями моделей. У світлі такого роду нетеоретична міркувань, вважають автори, ДПС заслуговують дуже високої оцінки: «Вони виробляють обчислення дешево і швидко, і їх вивчення має менше етичних обмежень, ніж вивчення інших моделей» [с. 309].

    При цьому в наукових дисциплінах різного ступеня зрілості можуть співіснувати найрізноманітніші моделі. У когнітивної науці існують різні моделі - моделі з ящиками і стрілочками (наприклад, модель робочої пам'яті А. Бедделі), обчислювальні моделі (символьні і ін.), Моделі цілих організмів (аплізіі або миші) і т.д. Співіснування і успіх різноманітних моделей в науках різного ступеня зрілості говорить проти можливості одного найкращого виду моделей. Виходячи з цього, автори закликають не відкидати ДПС передчасно і не розглядати їх як єдиний тип моделей, до якого когнітивна наука в кінцевому рахунку повинна прийти.

    Незважаючи на свою різноманітність, наукові моделі часто розглядаються як такі, що загальний джерело, а саме теорію, з якої вони були виведені і на перевірку якої вони спрямовані. Однак ця точка зору не узгоджується з наукової практикою, оскільки моделі рідко виводяться безпосередньо з теорії. Створення моделей є більшою мірою творчим процесом, ніж прямолінійною логічної дедукцією. Використовувані в даний момент в когнітивної науці ДПС не виводилися з будь-якої теорії для її перевірки. (Хоча і вони, мабуть, були натхненні теоріями функціонування біологічного мозку.) Втім, ця обставина не є причиною для відмови від ДПС, оскільки їх походження не має відношення до оцінки їх наукової цінності.

    Як відомо, для технологічних та інженерних розробок першорядна мета полягає в створенні пристроїв, які виконують певну роботу (наприклад, коректно пророкують певний результат), тоді як завдання пояснення часто відходить на другий план. Незважаючи на те що значний

    пророкує потенціал ДПС не заперечується навіть їх критиками, ці моделі часто відкидаються через те, що пророкування бачиться менш значущим для науки, ніж пояснення.

    На противагу цій точці зору автори виділяють два моменти в тому, що пророкування значима для когнітивної науки. По-перше, ДПС можуть використовуватися чисто прагматично, як інструмент для вирішення практичних завдань без прямої відсилання до пояснення. У цьому випадку вони можуть застосовуватися для допомоги пацієнтам з ушкодженнями мозку і для не-інвазивного експериментального контролю активності мозку. По-друге, ДПС можуть бути етапом на шляху до справжнього пояснення. Як відзначають автори, «пророкує потенціал в кінцевому рахунку є критерієм для успішного пояснення: ми не можемо бути задоволені моделлю, яка пропонує пояснення, але яка не може успішно передбачати» [с. 310].

    Для багатьох дослідників в когнітивної науці зразком пояснювальних моделей є так звані математико-теоретичні моделі. В рамках цих моделей встановлюється певна кількість релевантних змінних для опису феномена, пропонується спосіб їх взаємодії, після чого змінні і їх взаємодія моделюються математично. Такого роду моделі досить прозорі. У порівнянні з цими моделями ДПС виглядають зовсім інакше. Глибинна нейронна мережа може володіти мільйонами параметрів, які вивчаються нею, а не встановлюються a priori. Тому відразу може бути неочевидно, як ці параметри співвідносяться зі світом або взаємодіють між собою. ДПС, без повного розуміння внутрішніх механізмів її роботи, може виглядати як чорний ящик. У зв'язку з цим виникає проблема, а саме що моделювання роботи мозку за допомогою ДПС подібно здійснювати спроби пояснити роботи одного чорного ящика через інший.

    У відповідь автори наводять три аргументи на користь того, що ДПС мають пояснювальній силою. Перший аргумент полягає в тому, що ДПС пропонують пояснення іншого виду - телеологічного пояснення. Інакше кажучи, ДПС функціонують певним чином не тому, що вони репрезентують певний аспект світу, а тому, що їм необхідно досягти певної мети, наприклад розпізнати об'єкт.

    Другий аргумент говорить, що насправді ДПС фактично використовуються так само, як традиційні математико-теоретічес-кі моделі. Зрештою, в фундаментальному сенсі вони визначаються поруч встановлюються a priori параметрів, таких як архітектура, матеріали для навчання, процедура і цілі навчання. Ці змінні прямо відносяться до специфічних феноменів в світі, тому модель є прозорою і володіє пояснювальній силою.

    Нарешті, третій аргумент полягає в тому, що непрозорість ДПС, пов'язана з їх складністю, являє собою проміжний стан, яке буде подолано на основі значних можливостей цих моделей для пояснення post hoc.

    Однак крім передбачення і пояснення, стверджують автори, наукові моделі виконують ще одну функцію, а саме дослідження нових горизонтів (exploration). Згідно ідеалізованому уявленню про природничих науках, прогрес в них відбувається за допомогою виведення з розвиненою теорії гіпотез і їх подальшої перевірки. Однак коли розвинена теорія відсутня, з'являється необхідність дослідити і створювати відправні точки для нових теорій, а не передбачати і пояснювати. Такого роду дослідження є всюдисущої практикою в науці. Автори стверджують, що ДПС вносять значний позитивний внесок в цю практику з двох причин. По-перше, через відсутність розвиненої теорії якої б то не було когнітивної функції ці моделі грають важливу дослідницьку роль. По-друге, через їх складності ДПС надають значні можливості для дослідження. На думку авторів, використання ДПС для дослідження нових горизонтів допомагає когнітивної науці в трьох аспектах.

    Перш за все, дослідження за допомогою ДПС може привести до формулювання нових гіпотез. Філософ науки Мері Хессе (Mary Hesse) запропонувала розуміти відношення між моделлю і її об'єктом в термінах аналогії. За М. Хессе, модель може мати позитивної, негативної і нейтральної аналогією стосовно свого об'єкту. Позитивні і негативні аналогії являють собою те, що, відповідно, об'єднує і розрізняє модель і її об'єкт. Якщо ж спільність або відмінність між моделлю і її об'єктом не встановлені, то модель має ній-

    тральної аналогією. Тому нейтральні аналогії дозволяють відкривати нові факти про об'єкти дослідження. Стосовно до дискусій про ДПС це означає, що дослідження нейтральних аналогій між цими моделями і мозком може виступити джерелом нових гіпотез для емпіричної перевірки. Якщо позитивні і негативні аналогії в цьому випадку є те, що об'єднує і розрізняє ДПС як моделі і мозок як їх об'єкт, то нейтральними є ті аналогії між ДПС і мозком, спільність або відмінність яких невідомі.

    Інша обіцяє напрямок використання ДПС в когнітивної науці, по авторам, полягає в демонстраціях можливості моделювання поведінки або нейронної активності і, відповідно, мотивації подальших досліджень на основі ідеї, яка застосовується в інженерній справі, - перевірки і підтвердження принципу дії (proof-of-principle demonstrations ). «В інженерній практиці ідея перевірки і підтвердження принципу дії показує здійсненність певного підходу до вирішення проблеми за допомогою створення пристрою, який вирішує проблему» [с. 314]. Цей успіх, в свою чергу, мотивує подальші дослідження. У когнітивної науці використання ДПС в цьому ключі може допомогти продемонструвати, наприклад, можливість висхідного або спадного підходу до вивчення зору і мотивувати, таким чином, подальше увагу до цієї теми.

    Нарешті, ДПС можуть використовуватися в когнітивної науці для оцінки доречності досліджуваного феномена і для зміни і уточнення понять, коли відсутня розвинена теорія. Так, наприклад, використання ДПС в дослідженнях нейрофізіологічних підстав зорового сприйняття допомогло уточнити добре відому гіпотезу двох зорових потоків. «В результаті, - пишуть автори, - пророкує сила ДПС створює прекрасну відправну точку для розвитку з їх допомогою нових теорій і перегляду існуючих теорій. Моделювання за допомогою ДПС породжує нові гіпотези, дозволяє підтверджувати принцип дії системи і допомагає уточнювати наші наукові поняття. Щоб не зійти з правильного шляху, дослідження нових горизонтів не повинно бути поплутано з поясненням або експериментом »[с. 315].

    На закінчення автори представляють чотири виведення свого дослідження: 1) ДПС повинні використовуватися в когнітивної науці як один з безлічі видів корисних моделей; 2) завдяки своїй пророкує силі ДПС можуть стати інструментом для наукового дослідження і практичного застосування; 3) необхідно використовувати пояснювальну силу ДПС для теоретичної роботи, але при цьому ясно обумовлювати, про який тип пояснення йдеться; 4) дослідницький потенціал ДПС може сприяти появі нових теоретичних розробок, які важко передбачити зараз.

    М.А. Сущин

    2020.01.009. УАЙТ К.Дж. Інтегруючи ГЛОБАЛЬНЕ РОБОЧЕ ПРОСТІР У ПРОГРАМУ передбачали ОБРОБКИ: НА ШЛЯХУ ДО робочої гіпотези. WHYTE C.J. Integrating the global neuronal workspace into the framework of predictive processing: Towards a working hypothesis // Consciousness and cognition. - 2019. - Vol. 73, art. 102763. - P. 1-9. -DOI: https://doi.org/10.1016/j.concog.2019.102763.

    Ключові слова: програма пророкує обробки; теорія глобального робочого простору; свідомість; мозок; передбачення.

    Автор з Австралії розглядає питання інтеграції двох провідних програм в сучасній когнітивної науці і дослідженнях свідомості - програми пророкує обробки (НВО) і моделі глобального нейронного робочого простору (ГНРП).

    ППО намагається охопити сприйняття, дія і пізнання в рамках єдиної обчислювальної перспективи наближеного байєсівського процесу мінімізації помилки в прогнозі. З цієї точки зору на основі внутрішньої моделі світу мозок породжує передбачення сенсорного входу і зіставляє їх з дійсними сенсорними сигналами. У разі невідповідності між ними (іменованого помилкою в передбаченні - prediction error) мозок вносить корективи у внутрішню модель світу для породження більш досконалих пророкувань. Таким чином, на відміну від традиційного погляду на сприйняття як на висхідний процес вилучення властивостей (feature extraction), ППО пропонує рассмат-


    Ключові слова: ФІЛОСОФІЯ НАУКИ /КОГНІТИВНА НАУКА /ГЛИБИННІ нейронні мережі /ШТУЧНИЙ ІНТЕЛЕКТ /ПОЯСНЕННЯ /ПЕРЕДБАЧЕННЯ /ДОСЛІДЖЕННЯ

    Завантажити оригінал статті:

    Завантажити