Бир жолу атып тууралоону үйрөнүү үчүн OpenAIдин жаңы ыкмасы, AIнин келечегине көз чаптыруу

Бир Дүйнөлүк Окутуу Үйрөнүү Ян Дуан, Марчин Андричович, Брэдли С. Стади, Джонатан Хо, Йонас Шнайдер, Илья Суцкевер, Питер Эббель, Войцех Заремба

16-майда, OpenAI изилдөөчүлөрү өз долбоорлорунун биринин видеосу менен бөлүштү, АИнин учурдагы өнүгүүсүнүн үч негизги түйүндөрүнүн чечимдерин изилдеген эки маанилүү документ: мета-окутуу, бир ок атуу жана автоматташтырылган маалыматтарды иштеп чыгуу. Мурунку постумда мен бир жолу окуунун кызыктуу көйгөйүнө арналган макала убада кылгам, ошондуктан бул жерде. Сиз алардын укмуштуу ишин түшүндүргөн видеону карап баштасаңыз болот:

Бул видеодо сиз бир колу бар физикалык роботторду бири-биринин үстүнө кубалап жаткандыгын көрө аласыз. Азыркы учурда өнөр жай роботтору аткара турган татаал тапшырмаларды билүү, эгер изилдөөчү эмне болуп жаткандыгын түшүндүрүп бербесе, бул көптөгөн кыйынчылыктарга алып келет. Контролдонгон чөйрөдө маселе жөнөкөй, жол-жоболоштурулган (татаал коддолгон) мамилелер бул көйгөйдү чечип койгон, перспективдүү жана революциячыл нерсе - бул жалпы алкак чуулгандуу чөйрөдө бир нече, татаал жана адаптивдүү жүрүм-турумга чейин жетиши мүмкүн.

Адам менен жогорку жаныбарлардын ортосундагы акылдын айырмасы, албетте, кандайдыр бир деңгээлде жана түрү боюнча эмес.
- Чарльз Дарвин

Аналогия боюнча, бул макала азыркы АИ (физикалык тутумдарды жасалма интеллект) жана 22-кылымдын роботторунун ортосундагы таанып-билүү тутумдарындагы айырмачылыктардын масштабдуу жана чоң эмес экендигинин күчтүү далили. ImageNet конкурсу * 2012-жылдан бери терең изилдөөлөр өнүгүп келе жатат, бул нейрон тармагы тарабынан жүргүзүлгөн бөлүштүрүлгөн эсептөө мүнөзүн өзгөртүү үчүн эмес, белгилүү бир тапшырманы үйрөнүү үчүн тармактарды түзүүнүн жаңы жолдорун табуу менен. Нейрон тармагынын функциясы структура болгондуктан, бул түзүлүш катуу коддолгон эмес (кол менен иштелип чыккан эмес), бирок, алгач, алардын түзүлүшүн жана туташууларын өзгөртүүгө мүмкүндүк берген, кириш жана чыгымдардын ортосунда туташкан атомдук эсептөө бирдиктеринин натыйжасы. Бул тармактын жалпы түзүмүн өзгөртүү аркылуу белгилүү бир функцияны үйрөнөт.

Бул макалада алар агентти абстракттуу түрдө көрсөтүүгө үйрөтө ала турган, ошондой эле жаңы тапшырманы бир гана демонстрациялоодон кийин (бир жолу окууну тууралоо) бул билимди жаңы көрүнбөгөн тапшырмаларга өткөрүп берүүгө үйрөтө ала турган жалпы алкакты түзүштү.

Милдеттери

Так архитектуралык ишке ашыруу ар кандай болгонуна карабастан, алар жалпы тапшырманын натыйжалуулугун көрсөтүү үчүн эки милдетти мисал катары алышат.

Бөлүкчөгө жетүү

Биринчи мисалда тутум түстөгү максаттуу позициялардын маалыматтарын жана көрсөтүлгөн максаттуу жерге баруучу симуляцияланган агенттин видео көрсөтүүсүн алат.

Сүрөт 2. Робот - бул 2 өлчөмдүү күч менен башкарылуучу чекиттик масса. Үй-бүлөнүн милдети максаттуу чекке жетүү. Белгилей турган жердин өзгөчөлүгү тапшырмадан тапшырмага чейин айырмаланат жана модель демонстрациянын негизинде кайсы максатты көздөгөнү аныкталышы керек. (солдо) роботтун иллюстрациясы; (орточо) тапшырма кызгылт сары кутуга жетүү, (оңдо) жашыл үч бурчтукка жетүү.

Окутуу учурунда система бир эле тапшырманы (кызгылт сарыга жетиши керек), бирок башка конфигурациядан, робот жана бутага карата ар кандай башталгыч позицияларга ээ болушу керек. Сыноо маалында агенттин ал (же кызгылт сары түстө) же буга чейин көрө элек тапшырмада (мисалы, жашыл түстө) же экөөндө тең сыналганбы, белгисиз.

Окутулган саясат жаңы сценарийлер боюнча бааланат жана тренинг учурунда көрүлбөгөн жаңы демонстрациялык траекториялар менен шартталат.

Агент максаттуу максатын уникалдуу демонстрациядан өткөрүп, кайрадан башка конфигурациядан баштоосу керек экендиги анык. Бул кыймылдаткычтын так тизмесин сыноодон мурун билүү мүмкүн болбогонун жана тапшырманы жана мотор пландаштырууну абстракциялоонун (жогорку деңгээлдеги структуралык өкүлчүлүк) натыйжасы жөнүндө айтууга болот.

Бөгөттөө

Экинчи мисалда агент кубиктерди (ар кандай түстөр менен аныкталган) бир симуляцияланган демонстрациядагыдай эле ирээтке келтирип үйрөнүшү керек. Бул окшоштурулган демонстрация роботтордун кыймылдаткычтары жана сенсордук аппараттарынын касиеттери моделденген 3D физикалык кыймылдаткычынын жардамы менен жаратылган 2D сүрөттөр сериясынан турат.

Бир ок атуу саясаты. Бирдиктүү саясат көптөгөн маселелерди чечүүгө үйрөтүлдү. Жогорку тапшырма: {abc, def}, Төмөнкү тапшырма: {ab, cd, ef}

Эки мисалда тең жана демонстрациядагы кубдун баштапкы позициясы айырмаланып турат, ар бир тапшырма башка баштапкы позициядан башталат. Робот демонстрациянын баштапкы абалына дал келүү үчүн кубду алмаштырууга аракет кылбайт, ал кубаттуулукту ал кандай гана абалда болбосун төкүп, жогорку деңгээлде өткөрүп берет.

Домендик рандомизациянын жардамы менен окутуу

Эки учурда тең окутуу учурунда колдонулган бардык сүрөттөр домендик рандомизация аркылуу симуляция жолу менен алынат, мында алар үлгүлөрдүн төмөнкү аспекттерин рандомизациялайт:

Столдогу алаксытуучу объектилердин саны жана формасы Үстөлдөгү бардык объектилердин абалы жана текстурасы Үстөлдүн, полдун, асман кутусунун жана роботтун текстуралары Камеранын абалы, багыты жана көрүү чөйрөсү Сахнадагы жарыктардын саны Орду, багыты, жана жарыктардын спекулярдык мүнөздөмөлөрү Сүрөттөргө кошулган кокус ызы-чуунун түрү жана көлөмү

Бөлүкчөлөргө жетүү үчүн машыгуу

Тапшырылган үй-бүлөлөрдүн татаалдаштырылган топтомун эсептейбиз, мында белги саны 2 ден 10го чейин көбөйөт. Ар бир тапшырма үчүн 10000 траекторияны чогултабыз, анда белгилердин позициясы жана чекит роботтун баштапкы абалы туш келди. Демонстрацияларды натыйжалуу түзүү үчүн биз коддуу эксперт саясатын колдонобуз. Эсептелген аракеттерди курчап турган чөйрөгө колдонуудан мурун, траекторияга ызы-чуу кошуп, нейрон тармак саясатын үйрөтүү үчүн жөнөкөй жүрүм-турум клондоосун колдонобуз.

Блок үймөк үчүн машыгуу

Башкача айтканда, биз 140 окуу тапшырмаларын жана 43 тест тапшырмаларын чогултуп, ар бири блоктордун ар кандай каалаган жайгашуусун камсыз кылдык. Ар бир тапшырмада блоктордун саны 2ден 10го чейин өзгөрүшү мүмкүн. Биз окутуу үчүн 1000 траекторияны чогултуп, баалоо үчүн колдонула турган траекториялардын жана баштапкы конфигурациялардын өзүнчө топтомун сактайбыз. Тапшырмага жеткен бөлүкчөгө окшоп, биз траекторияны чогултуу процессине ызы-чуу салабыз. Траекториялар катуу коддолгон саясатты колдонуп чогултулат.

Ийгиликтүү демонстрациялар катуу коддолгон саясатты колдонуп чогултулат

Окутуу учурунда туура траектория процесстик "катуу коддолгон" саясаттын жардамы менен келип чыккандыгын, тутумду аныктоонун жана башкаруунун классикалык ыкмаларына таянат деп ишенем. Ошентип, окутуу жана сыноо учурунда агенттин эки киргизүүсү бар: а) А конфигурациясындагы демонстрация, жана б) Баштапкы конфигурация Б. Окуу учурунда гана алгоритм идеалдуу жооп алууга мүмкүнчүлүк алат: B конфигурациясынан баштап траектория. көйгөйгө жооп берет жана окутуу учурунда агенттин жообу менен салыштырылат - бул көзөмөлдөнгөн окуу көйгөйү.

Ар бир окутуу тапшырмасы үчүн биз ийгиликтүү демонстрациянын болушун болжолдойбуз.

Эгер түшүнүксүз болсо, кийинки бөлүмдө ар кандай типтеги парадигмалардын ортосундагы айырмачылыктарды карап чыгам.

Алгоритм жана оптимизация функциясы

Жетекчиликке алынган окутуу - бул парадигмаларды билдирет, анда ар бир чечимде тармак өзү туура тандоого мүмкүнчүлүк алат, демек ката деген түшүнүк бар. Мисалы, иттер менен мышыктардын ортосундагы классификациялык тапшырмада окутуу учурунда иттер менен мышыктардын сүрөтү алдын-ала белгилүү болот жана каталар дароо табылат. Бул мааниде бул көзөмөлсүз үйрөнүүдөн айырмаланып, анда жалпысынан агенттен алынган кирүүчү материалдардан мурда белгисиз түзүлүштү табууну суранат, ал эми мышыктар менен иттердин энбелгисиз ар кандай объекттердин эки кластери гана бар экендигин аныктоого туура келет. маалыматтар камтылган маалымат. Reenforcement Learning-тен айырмаланып, ондогон адамдар чыныгы убакыт системасына колдонулат, ал жерде максатка жетелөөчү чечимдин так ырааттуулугу белгисиз, бирок ырааттуулуктун туура же туура эмес болгонун акыркы "сыйлык" гана чечет. Окутууну үйрөнүү менен, алар классикалык билим берүүнүн көйгөйүн көзөмөлдөнгөн окутуу көйгөйүнө айлантышат, анда ката алыстан байкалып калган траекторияга чейин эсептелген.

Кандайдыр бир көзөмөлдөнгөн машыгууларды орнотууда болгону сыяктуу, агенттин болжолдонгон жүрүм-турумдан канчалык алыс экендигин аныктоого багытталган, жоготуу функциясы толугу менен аныкталат. Бул функцияны аныктоо көбүнчө критикалык кадам болуп саналат, анткени ал оптимизация алгоритмдери моделдин параметрлерин кандайча жаңыртат. Бул алгоритмдер эсептөө убактысынын маанисинде чоң мааниге ээ, жана көбүнчө бир-бирине такыр шайкеш келбеши керек. Чындыгында, өтө чоң өлчөмдөгү функцияны минималдаштыруучу чечимдер параметр мейкиндигинин кичинекей кабыгында жайгашкан жана алардын ортосундагы кичинекей түйшүктүү аралык бар, анткени сиз ошол кичинекей доменден чыкканыңыздан кийин эритмелердин аралыгы тез өсөт. Дженнифер Чейстин укмуштуудай укмуштуу эмгектери бар, ал Talking Machines-тин акыркы эпизодундагы кызыктуу маегинде ушул теманы чагылдырат.

Саясат тармактарын окутуу учурунда (бүт тармак, кайсы иш-аракетти көрүүнү чечкен), алар алгач демонстрациянын траекториясын иштеп чыгышат. Бул бөлүктө алар эки мамилени, классикалык жүрүм-турум клондугун (алар колдонулгандыгын так билбейбиз) жана DAGGER алгоритмдерин салыштырып көрүшөт. Бул иш-аракеттердин үзгүлтүксүз же дискреттик (окуялардын кезек менен бөлүштүрүлүшүнө негизделген) негизделген l2 же кайчылаш энтропия жоготуулары аркылуу жоготуу функциясын итеративдүү азайтууга мүмкүндүк берет. Бардык тажрыйбаларда, Adamax алгоритмин 0.001 окуу ылдамдыгы менен оптимизацияны жүргүзүү үчүн колдонушкан.

Кадамдын өлчөмү кичинекейден башталат жана диспансердик мүнөзгө ээ.

Алгоритм өзү эле өткөрүп берүүгө мүмкүнчүлүк бербейт, бул сиздин машыгуу топтомуңузду жана өткөрүп берүүгө мүмкүнчүлүк берген жоготуу функцияңыз.

Тапшырмаларда өткөрүүнүн эки түрү бар. Биринчи түр "реалдуу ажырымды жоюу" деп аталат, ал симуляцияланган маалыматтарды киргизүү менен табигый сигналдар боюнча тестирлөөгө өтүү менен билим берүүнүн жалпылоосу. Симуляция маалыматтары көбүнчө реалдуу дүйнөнүн жакырланган жакындашуусу, өтө эле кемчиликсиз, реалдуу объекттин татаалдыгын көрсөтпөйт. Чыныгы дүйнөдө камера туура эмес иштей башташы мүмкүн, моторду башкаруу анча так эмес, түстөр өзгөрөт, текстуралар байый берет ж.б.у.с. Биринчи өткөрүп берүү үчүн алар "домендик рандомизация" деп аталган ыкманы колдонушат. : кирүүлөргө ызы-чуу кошуу менен, тармак жалпы дүйнө жүзүнө ылайыктуу жалпылоого мүмкүндүк бере турган жалпыга ылайыктуу түзүмгө ээ болот. Алар, мисалы, окутуу мисалдарынын ортосундагы камеранын бурчун өзгөртүп, текстурасын өзгөртө алышат же траекториясын анча кемчиликсиз кыла алышат. Машыгуу учурунда ызы-чуу кошуу менен, биз бекемдикке ээ болобуз.

Экинчи трансфер бул башка баштапкы конфигурацияда башталган, бирок акыркы максат менен окшош бир демонстрацияга негизделген мурда көрүлбөгөн конфигурация жана максаттагы тиешелүү мотор ырааттуулугун түзүү мүмкүнчүлүгү. Дагы бир жолу, бул окуу куралын кантип куруп, жоготуу функциясын моделдөө аркылуу мүмкүн болот. Окутуу учурунда бир эле баштапкы шарттан башталбаган, окшош максатка жетүү үчүн демонстрацияларды өткөрүү менен, сиз тармакка абсолюттуу позицияларды колдонбостон, максимумдун жогорку деңгээлдеги өкүлчүлүгүн киргизүүнү үйрөтсөңүз болот, жөнөкөй эмес мотор ырааттуулугу. Начар баштапкы архитектура структураны тиешелүү түрдө өзгөртүүгө мүмкүнчүлүк берет жана бул үйрөтүлгөн структура акыркы функцияны билдирет.

милдеттери

Блокторду топтоо парадигмасы үчүн бир нече кыйынчылыктар болгон, алар өзүлөрүнүн билим берүүчүсү менен жолугушууну каалашкан.

Ар кандай блокторго ээ болгон тапшырма инстанцияларына колдонуу оңой.
Табигый түрдө бир эле тапшырманын ар кандай өзгөрүлүшүн жалпылаштыруу керек. Мисалы, саясат {abc} тапшырмасында гана үйрөтүлгөн болсо дагы, {dcba} тапшырмасын жакшы аткарышы керек.
Ал өзгөрүлмө узундуктагы демонстрацияларды камтышы керек.

Алар бул тапшырманы аткарууну каалаган бир нече суроолорго жооп алышты.

Жетиштүү маалыматты оффлайнда чогултууга мүмкүнчүлүк бергенде, жүрүм-турумду клондоштуруу менен машыгууну DAGGER менен кандайча салыштырып болот?
Бүтүндөй демонстрациядагы кондицияны акыркы керектүү конфигурациядагы кондицияга кандайча салыштырууга болот, атүгүл акыркы конфигурацияда тапшырманы толугу менен көрсөтүүгө жетиштүү маалыматтар бар болсо дагы?
Бүт демонстрациядагы кондицияны траекториянын "тез сүрөтү" боюнча кондициялоого салыштырганда кандайча салыштырууга болот, бул кичинекей алкактардын алкактары болуп саналат.
Окутуу учурунда көрө элек тапшырмалардын түрүн биздин алкак ийгиликтүү жалпылай алабы? (++)
Учурдагы методдун чектөөлөрү кандай?

архитектура

Бөлүкчөлөргө жетүү

Ушул биринчи мисал үчүн, алар Long Short Term Memory (LSTM) нейрон тармактарына негизделген үч архитектураны салыштырып көрүштү. Бул тармактын сыпаттамасы эс тутум жана көңүл жөнүндө кийинки постто жарыяланат, алар таанып-билүүчүлүк жана эсептөө илиминде да абдан кызыктуу. LSTM негизинен тармактын ар бир жаңы убакыт аралыгында тармактын киришин (убакыттын өтүшү менен) камсыздайт, бул өткөн мамлекеттердин маалыматын ушул учурга (кыскача эс тутум тармактарынын аталышы) мүмкүндүк берет. Алар убакыт сериясы (Alexa, Siri ж.б.) менен алектенген көптөгөн заманбап технологиялардын өзөгүн түзөт.

Бул жерде алар ушул үч шартты колдонушат:

  1. Түз LSTM: траекторияны жана учурдагы абалды мотор кыймылын пайда кылган көп кабаттуу кабылдоочу жайга өткөрүп берүүнү үйрөнөт
  2. Көңүл бургула LSTM: траекториянын белгилери боюнча салмактанып берилген көрсөтмөлөрдү чыгар
  3. Көңүл бурулган акыркы абал: мурунку архитектурага окшош жерлерди ченөө үчүн, акыркы абалды окутууда гана колдонуңуз

Бөгөттөө

Негизинен, жалпы нейрон тармагы картографияны демонстрациядан жана учурдагы байкоодон тартып, тийиштүү иш-аракеттерге чейин үйрөнсө, биз ылайыктуу архитектураны колдонуу маанилүү деп таптык. Блок стекингин үйрөнүү боюнча биздин архитектурабыз бул эмгектин негизги салымдарынын бири, жана келечекте кандайдыр бир татаал тапшырмаларды бир жолу имитациялоо үчүн кандай архитектуралар көрүнүшү мүмкүн деп эсептейбиз.

Көңүл буруу модулдары

Макала үйрөнүү үчүн колдонулган тармактардын түзүлүшүн сүрөттөө жагынан салыштырмалуу жогорку деңгээлде калууда. Архитектуранын негизги компоненти - бул көңүл буруу модулу, бирок менимче, бул предмет үчүн маанилүү ролду деталдаштырган конкреттүү пост талап кылынат. Туруктуу көңүлдүн таанып-билүү илиминин түшүнүгүнө окшошуп, көңүл бөлүү модулдары мейкиндик жана убакыттын ар башка чөйрөлөрүндө камтылган маалыматтарды топтоого жана топтоого багытталат. Ал убакыт жана мейкиндикте созулган маалымат мазмунун камтыган туруктуу көлөмдө чыгарат. Математиканын бир тармагы болгон топологияга окшоштуруу менен, келечекте биз бөлүштүрүлгөн сүрөттөлүштөрдү кандай түшүнөрүбүздү билебиз, көңүл борбору маалыматтардын топологиялык изоморфизмин, бирдей ийри, ар кандай формадагы маалыматты аткарат. Бул тармак күтүлбөгөн же сейрек кездешүүчү окуяларга көңүл топтой алган жөнөкөй детектордун ролун ойнобой тургандыгын белгилей кетүү керек, бул нейробиологиядагы көңүл түшүнүгү менен байланышкан функция.

Бул жерде алар көңүл буруу тармагынын эки түрүн колдонушат: а) эс тутумда сакталган мазмундун (сурам, контекст жана эс-тутум векторлору) салыштырмалуу салмагын чыгаруучу убактылуу көңүл түйүнү; б) блокко салыштырмалуу маалыматты калыбына келтирүү мүмкүнчүлүгүнө ээ болгон конуштардын көңүл борбору. агенттин учурдагы сурамына жараша позициялар.

С: контексттик вектор, m: эстутум вектору, q: сурам вектору, v: үйрөнгөн вектордун салмагы менен, убактылуу көңүл чордонундагы тармак. Чыгуу эс тутум вектору менен бирдей. Бул вектордун сызыктуу айкалышы, кээ бир эс тутум векторунун контекстке жана сурам векторлоруна негизделген чыгуусуна көбүрөөк таасир тийгизүүгө мүмкүндүк берет.Ушул эле идея, мейкиндиктик маалыматтын ортосундагы атаандаштык көңүл тутуму тарабынан динамикалуу сакталууда.

Саясат тармагы

Толук тармак үч ар кандай ички тармактардан турат: демонстрация тармагы, контексттик тармак жана манипуляция тармагы.

Демонстрация тармагы демонстрациянын траекториясын киргизүү катары кабыл алат жана демонстрациянын саясатын колдоно турган жалгаштырууну жаратат. Бул орнотуунун өлчөмү демонстрациянын узундугу жана айлана-чөйрөдөгү блоктордун саны сыяктуу сызыктуу өсөт.

Бул жерде көрсөтүлгөндөй, демонстрация тармагы ар кандай татаалдыкта жана көлөмдөгү демонстрацияны жалпы форматка киргизе алат, ал тапшырманы чагылдыруу үчүн контексттик тармак тарабынан колдонулат. Жалпылоо жүрүп жатат, демонстрацияны жалгаштыруу ушул деңгээлде, демонстрациялар учурунда көрүлгөн так траектория жана куб абсолюттук позициялар жөнүндө маалыматты калтырышы керек.

Контексттик тармактын түзүлүшүн карасак, өтө жогорку деңгээлде болсо дагы, биз демонстрациянын борбордук убактылуу модулдарга өтүшүн камсыз кылган демонстрация тармагы менен интерфейсти көрөбүз. Мындан тышкары, мурунку аракеттер (LSTM) жана учурдагы абал мотор тармагына жиберилген глобалдык контексттик жалгаштырууну өндүрүү үчүн демонстрация орнотуу менен биригип киргизилген.

Бул тармактардын функцияларын сүрөттөө, менимче, кагаздын эң маанилүү бөлүгү:

Контексттик тармак сурам векторун учурдагы абалдын функциясы катары эсептөөдөн башталат, андан кийин демонстрация орнотууда ар кандай убакыт аралыгында катышуу үчүн колдонулат. Бир эле кадамдын ичиндеги ар кандай блоктордогу көңүлдөрдүн салмагы бир кадамга бирден салмак кошуу үчүн чогулат. Бул убактылуу көңүлдүн натыйжасы айлана чөйрөдөгү блоктордун санына пропорционалдуу болгон вектор. Андан кийин маалыматты ар бир блоктун ичине жайылтуу үчүн айлананын көңүлүн бурабыз. Бул жараян бир нече жолу кайталанат, анда абалы LSTM уячасын колдонуу менен өркүндөтүлөт.
Мурунку операциялардын ырааттуулугу кыналууну жаратат, анын өлчөмү демонстрациянын узундугуна карабастан, бирок блоктордун санына көз каранды. Андан кийин биз ченемдүү векторлорду чыгарууга стандарттык жумшак көңүл бурабыз, мында эс тутуму ар бир блоктун позициясынан турат, ал роботтун абалы менен бирге манипуляция тармагына берилген маалыматты түзөт.
Интуитивдүү түрдө, айлана-чөйрөдөгү объекттердин саны ар кандай болсо да, манипуляциялоо ишинин ар бир баскычында тиешелүү объекттердин саны анча чоң эмес жана туруктуу. Айрыкча блокторду топтоо чөйрөсү үчүн робот өзү тандап жаткан блоктун ордуна (булак блогу), ошондой эле анын үстүнө коюлган блоктун абалына көңүл бурушу керек. максаттуу блок). Демек, туура даярдалган тармак учурдагы абалды демонстрациянын тийиштүү баскычына дал келүүнү үйрөнөт жана ар кандай блокторго жумшак көңүлдүн салмагы катары көрсөтүлгөн булак жана максаттуу блокторду аныктап, кийинчерээк аларга ылайыктуу позицияларды алуу үчүн колдонулат. манипуляция тармагына өткөрүлүп берилет.

Алардын сүрөттөлүшүн кандай жол менен бүтүргөнү - экспертизалык тутумдан окуу тутумуна өтүү менен КИнин азыркы учурдагы иликтөөсүнүн мыкты мисалы, ошондой эле мээ төмөндө кантип өрчүй тургандыгы жөнүндө талкуулоодо.

Бул интерпретацияны окутууда колдонбосок дагы, биздин эксперименттик анализибиз үйрөнүлгөн саясаттын ички иштөө ыкмаларын чечмелеп берет.

Алар анын кантип иштээрин билишпейт! Алар белгилүү бир эсептөөлөрдү жүргүзө алган жана биз a-априор деп эсептеген белгилүү бир маалыматтарды сактай турган түзүлүштү курушат жана бүт структура үйрөнөт деп үмүттөнүп жатабыз! Жасалма интеллект изилдөөсүнүн өсүп-өнүгүү түрү бар, искусство, эвристикалык издөөнү туура багытка багыттай турган жол. Ушул сыйкырчылардын көпчүлүгү азыр openAIде иштеп жатышат окшойт.

Алардын сөзү боюнча, манипуляция тармагы жөнөкөй түзүлүш болуп саналат, контексттик камтылгандан баштап, көп катмардагы кабылдагычка чейин кыймылдаткыч кыймыл-аракет жасалат.

Жыйынтыгы

Натыйжалар көбүнчө мен үчүн анча деле кызыктырбайт, айрыкча укмуштуудай сонун техникалык документтерге. Мен тез, акырындап кетем, анткени бул ыкма иштейт, ал эксперттердин катаал коддоруна окшош тактык менен иштейт жана конкреттүү жол-жоболук мамилелерге карабастан, көптөгөн милдеттерди жалпылаштырат.

Бөлүкчөлөргө жетүү

Блок чогултуу

Бул тажрыйбаларда алар ар кандай шарттарды сынашкан. DAGGERди колдонуп, көрсөтүлгөн үч траекторияны бөлүп алуу менен үч башка киргизүү шарттарын салыштырып көрүштү: толук траектория, траекториянын сүрөтү же акыркы абалды колдонуу. Алар ошондой эле жүрүм-турумду клондоо алгоритмин демонстрациянын траекториясы менен салыштырышкан.

Системдин куб кубаттуулугун жалпылоо мүмкүнчүлүгүнүн күчтүү далили

талкулоо

Ушул акыркы бир нече айда OpenAI тарабынан жасалган ылдам ийгиликтер жөнүндө окуп жатып, мен алардын иши жөнүндө сүйлөшүүгө жана алардын иш-аракеттери жөнүндө жана жалпы АИ тармагындагы жетишкендиктер жөнүндө ой-пикирлерим менен бөлүшкүм келет. биологиялык мээлер иштейт. Тактап айтканда, адамдар арасындагы бир-бирине окшош таанып-билүүчүлүк функциялары кандайдыр бир тапшырманы кантип аткарууну билбеген жалпы түзүлүшкө байланыштуу эмес, тескерисинче, ошол эле чөйрөдө туруштук берген салыштырмалуу окшош нымдуулук түзүмдөрүнүн натыйжасында пайда болот деген түшүнүк. окшош тапшырмаларды аткарууну үйрөнүңүз. Функция бир гана айлана-чөйрө шартына ылайыкташуу үчүн бир-эки параметрлерди өзгөртүү менен жөнөкөй бир функцияны түзүп алгандан көрө, конкреттүү чөйрө менен белгилүү бир тапшырманы үйрөнө ала турган, иштебей турган структуранын натыйжасы.

Конфигурацияларга каршы тапшырмалар: негизсиз көрүнгөн аныктама

Чынын айтуу керек, мен эмне үчүн ар кандай тапшырмаларды сүйлөшүү үчүн тандап алгандыктарын түшүнбөйм. Блокторду топтоо экспериментинде бир-бирине салыштырмалуу блоктордун позициясын чагылдырган саптардын жыйындысы катары тапшырма белгиленет, топтомдогу элементтердин саны стектердин санын жана блоктун санын белгилөө үчүн блоктун санын аныктайт . Стек абсолюттук абалына карабастан, блокторду үймөктөргө жайгаштыруу милдети турат.

Кээ бир блоктор столдо болушу мүмкүн, бирок тапшырманын бөлүгү эмес

Алардын салыштырмалуу позициясын жана стекстердин санын өзүнчө тапшырманын критерийлери катары аныктоо тандоосу эркиме окшойт. Чындыгында, блоктордун абсолюттук баштапкы позицияларына негизделген ар кандай тапшырмалар жөнүндө сүйлөшүү туура болот (аларды конфигурация деп аташат). Аларга көйгөйдүн жалпы мүнөзү ачык көрүнөт деп ишенем, бирок ачык-айкындуулук үчүн алар майда-чүйдөсүнө чейин козголгусу келбейт. Саясий билим берүүнү жалпылоонун эки түрү катары, кийинчерээк кандайча жасоо керектиги көбүрөөк мааниге ээ:

Жалпылоо бир нече деңгээлде бааланып жаткандыгын эске алыңыз: үйрөнүлгөн саясат жаңы конфигурацияларга жана буга чейин көрүлгөн тапшырмаларды жаңы демонстрациялоого жалпыланып гана койбостон, жаңы тапшырмаларды жалпылаштыруу керек.

Жөн гана "тапшырмаларды" "стек буйрутмалар" менен алмаштырыңыз. Тапшырманы туура үйрөнүү дегеним, агент кубун (абалын), абсолюттук абстракттуулукту (конфигурацияны), ошондой эле алардын аныктыгын (тапшырмасын), стекстердин санын (тапшырманы) жана демонстрациянын траекториясын (кыскача киргизилген) үйрөнүүнү билдирет. цитата) тиешелүү мотор жообун иштеп чыгуу.

Бул жалпылоолор бир-бирине карама-каршы келгендей сезилет, кантип бир эле тармак кубдун баштапкы конфигурациясын же өздүгүн чагылдырып, моторго жооп берүү үчүн абсолюттук абалын калыбына келтире алат?

Бул үйрөнүү, ар кандай маалыматтарды кабыл алуу учурунда ар кандай кооперативдик ички тармактарга болгон муктаждыкты түшүндүрөт жана контексттик тармакта тапшырманын алдында абсолюттук позициялар сыяктуу куб абсолюттук позициялар сыяктуу тапшырманын абстрактуу чагылдырылышы көрсөтүлөт.

Тапшырмалардын жана конфигурациялардын ушул айырмачылыгын түшүндүрүп берүү акылсыз деп ойлойсуз, бирок бул ар кандай объектилерде ойноп жатканда абстракциянын бирдей процесси экендигин түшүнүү керек (жана бул кийинки бөлүмгө ачылат).

Инвариантсыз окуу жок

Трансфердик окутуу, албетте, ин-силико же in-vivo болобу, таанып-билүүнүн эң кызыктуу концепциясы, бул AI изилдөөчүлөрү үчүн да, неврологдор үчүн да абдан кызыктуу тема жана менин кандидаттык диссертациямдын темасы болуп калды. Машине үйрөнүүдөн мурун тыгыз байланышкан түшүнүктөр көптөгөн тармактарда изилденгендигин жана бул абстрактуу жана ар дайым жарым-жартылай аныкталган түшүнүктүн көптөгөн аталыштарга ээ экендигин белгилей кетүү керек. Философтор, антропологдор жана социологдор муну (Пост-) Структурализм деп аташат (Клод Леви-Стросс, Мишель Фуко), Лингвист Синтагма жана Уяланган дарак структуралары жөнүндө сөз кылат (Ноам Хомский), Математиктер Гомеоморфизм же Инварианттар жана Билим берүү жөнүндө ойлонушат. изилдөөчүлөр же неврологдор аны Структуралык окутуу деп аташы мүмкүн. Автоматтык окутуу чөйрөсүндө тиешелүү түшүнүктү көрө аласыз, мисалы, өкүлчүлүктүү окутуу жана мета-үйрөнүү, мисалы, авторго жараша трансфердик окутууну же трансфердик окутууну жүргүзүү үчүн колдонулган окутуу парадигмасын колдонсо болот. Терең Нейрон тармактары жөнүндө сөз болгондо, бул айырмачылыктар жокко эсе, анткени Нейрон тармагы белгилүү бир көйгөйдү (өкүлчүлүктүү окутуу) анын түзүмүн (мета-окутуу) өзгөртүү жолу менен, адатта, ызы-чуу чөйрөсүнө киргизүүнү үйрөнүүдө.

AI изилдөөчүлөрү жана когнитивдик илимпоз көп учурда трансфердик окутуунун так аныктамасына ээ, бул тутум белгилүү бир тапшырмада алган билимдерин жалпы композициялык структураны бөлүштүрүү үчүн башка тапшырманы аткаруу үчүн колдонууга мүмкүндүк берген процесс. Когнитивдик илимде эки тапшырманын ар башкача болуп көрүнгөнүнө карабастан жакынкы жана алыскы өткөрүлүп берүү түшүнүгү бар. Бирок абстракттуу көз караш менен айтканда, ызы-чуу жана татаал чөйрөдө, бардык билим берүү өткөрүп берүү формасы болуп саналат жана өтө жакын жана өтө алыс которуунун ортосундагы айырмачылык бир гана маалымат бөлүшүү маселеси - бул дагы табигый масштабдагы маселе.

Контролдонгон чөйрөдө реалдуулуктун коддолгон дискретизациясын түзүүгө аракет жасалат, бирок иш жүзүндө бул дискретизация өткөрүп берүү үйрөнүү процессинин жол-жобосун чагылдырат, ал жалпы абалда турган түзүмдүн астында чексиз абалда турган мамлекеттердин топтомун бириктирет. Transfer Learning түздөн-түз же процессти кеңейтүү менен түшүндүрүлөт, анын жардамы менен окутуу агенттери дүйнөнүн моделдерин түзүү үчүн инварианттарды колдонушат. Бул бирдей окшоштуктарды, кайталоолорду жана вариацияларды колдонуп, барган сайын абстракттуу жана курамдуу өкүлчүлүктү түзүү үчүн, диспетчердик диспансердин чегинде ансамблдерди түзө турган процесс. Жалпы жонунан алганда, ал маалыматтык топторду башкарган негизги операцияларды түзүүгө мүмкүндүк берет, мисалы, математикада бирлик жана кесилиштерге мүмкүндүк берет. Бул бирдейликти аныктоого мүмкүндүк берет, ал объектилерди категориялоого мүмкүнчүлүгүбүздү түшүндүрөт. Джош Тенембаум мага чындыгында эле бир мисал келтирди: сиз эки жашар балага биринчи жолу ат таанууну үйрөтүп жатасыз деп элестетесиз, ага ар кандай аттардын бир-эки сүрөтүн көрсөтүп, андан кийин башка аттын сүрөтүн жана үйдүн сүрөтүн сурап, аттын кайсынысын айтып берүүсүн сураныңыз. Бала бул ишти оңой эле жасай алат, бирок бул компьютердин бир нече гана маалыматты туура колдоно албаган нерсеси (бир эле жолу окууга).

Бала аны кантип жасады?

Жаныбарларды таануу балдарда изилденген жана объектилерди тиешелүү бөлүктөргө бөлүп берүү жөндөмүбүзгө, теринин түсү, моюнунун өлчөмү, жалпы форма ж.б.у.с. бул жөндөм сизге эшикти ачууга мүмкүнчүлүк берет. буга чейин эч качан көрбөгөн, кандайдыр бир кырдаалды жалпылаган (домендик жалпылоо) кыймылдаткычтын ырааттуулугун үйрөнгөнсүз. Дүйнөнү жөнөкөйлөтүүчү түшүндүрмө моделдерди жасоодо эмнени колдонсоңуз, атактуу швейцариялык саатта Куконун күтүлбөгөн жерден пайда болушуна таң калышыңыз мүмкүн, бирок экинчи жолу пайда болгондон кийин сиз күтөсүз. Нервдик тармак кандайча үйрөнүп, ал моделдер эс-тутумсуз курулгандыгы - инварсивдүүлүктү табуу. Мисал, биз математика жана сандар жөнүндө укпай туруп, физика жөнүндө интуитивдүү түрдө үйрөнүп жатабыз.

Мисалы, микроавтобуста төрөлгөн бала жердин тартылуу күчүнө кантип ылайыкташып, объекттер жерге кулап түшүп кетээрин интуитивдүү билсе болот?

Ымыркайлардын жана көпчүлүк жаныбарлардын аң-сезимсиз өз моделин кайра карап чыгат деп божомолдоого болот, мисалы, иттин башына байпак кийип, жаңы маалыматка көнүп кетүү үчүн бир аз убакыт талап кылынат.

Бирок кичинекей бала үчүн аң-сезимдүү суракка алуу жана анын интуитивдик моделин кайра карап чыгуу, кызыгуудан улам, тил аркылуу, символдор жана ишеним аркылуу болот. Биздин үлгүлөрдү билип туруп сурап билүү жана өзгөртүү жөндөмүбүз аябай кызыктуу, ал эми сиденот катары, адамдар процессти сөз менен айта алган бир гана түр болушу мүмкүн, бирок башка түрлөрү ушул сыяктуу аң-сезимдүү кайра карап чыгуулары мүмкүн.

Инварация - убакыттын милдеттүү касиети, эгерде ар дайым жаңы жана эч качан алдын-ала айтылбаса, анда дагы деле уникалдуу инвариант бойдон кала берет, ал ар дайым жаңы жана алдын-ала айтылбайт. Инвариантсыз бир дүйнөнү элестетүү мүмкүн эмес, анткени шилтеме бере турган дүйнө болбошу мүмкүн, инвазиваниясыз жашоо мүмкүн эмес жана мээбиз пайдасыз болот. Жашоо - бул окуяларды алдын-ала кайталоо, себептерди жана кесепеттерди кайталоо, организмге энергияны циклдик кайра калыбына келтирүү менен иштеген машина. Жашоонун керектүү циклдерин колдонууну жакшыртууда, мээбиз эң мыкты шайман. Бул божомолдоо машинасы, кайталоону динамикалык жол менен таба алган жана аны дүйнө менен жакшыраак байланышуу үчүн колдоно алган адаптивдүү орган.

Жашоонун тандап алган бул ыкмасы түзүлүштүн бир аз өзгөрүшүнө өтө күчтүү. Дүйнө жүзү, айлана-чөйрөнүн статистикалык касиеттери ошол бойдон калат, бирок аны менен байланышкан нейрондук структура ал иштеп чыккан маалыматты камтыганга чейин өзгөрүлүп турат. Бул эмне үчүн биздин мээбиздин индивидуалдуу индивидуалдуу, атүгүл башталгыч кортеждерден ушунчалык айырмаланып, ошол эле учурда бирдей функцияларды бөлүштүрүшү мүмкүн экендигин түшүндүрөт.

Нерв системалары ыңгайлашкан, жүрүм-турумду тиешелүү жол менен өзгөртүү үчүн эволюциянын жана жай генетикалык мутациялардын кереги жок. Э. Элегенс системасындагы жөнөкөй нерв системасы тубаса ички координатор жана тышкы сенсор катары кызмат кылат: тамакты сезип, ага карай кыймылдаңыз, оорудан качыңыз, көбөйүңүз. Ал жөнөкөй системалар башында катаал болгон жана биздин ызы-чуу жараткан дүйнөнү мүмкүн болушунча кичинекей мамлекеттерде (сол жакта тамак, жылуулук ж.б.) бөлүп көрсөтүү үчүн өтө жакын болгондой. Биздин кыймылдаткыч жана сезүү жөндөмдүүлүктөрү биздин нерв системабыздын божомолдоо жөндөмдүүлүктөрү менен тыгыз байланышта. Биздин сенсорлорубуз такыраак болгондо, нерв системасы маалыматты сактоо жана тажрыйбадан үйрөнүү үчүн акырындык менен өзүнүн түзүлүшүн өзгөртө баштады. Башында, жыттардын түрлөрү же жарык үлгүлөрү сыяктуу айрым категорияларды таанып билүүгө, ошондой эле улам барган сайын татаалдашкан мотор системасын башкарууну сыноо жана каталар аркылуу үйрөнүүгө мүмкүнчүлүк түзүлдү. Дүйнө ушунчалык татаал болгондуктан, мээбиз тубаса процедуралык ыкмага эмес, окуу парадигмасына өткөн. Эсептөө жагынан алганда, Го жөнөкөй оюну космостук мейкиндикке ээ (2.10 the) ааламдагы атомдордун санына караганда (10⁸⁰), жана организмдер татаалдашып, мүмкүн болушунча жакын аралыкта жакындай алышы мүмкүн. комбинатордук жарылуудан улам тез эле чечилиши мүмкүн деп айтылат.

Кээ бир адамдар мээбиздин ал пайда боло турган мейкиндикти түзө тургандыгына, ДНКнын кайсы бир жеринде бетти түзгөн генге же үн толкундарынын убактылуу уюшулгандыгына байланыштуу курулган деп ишенишет. созго чейин. Бул тубаса билим кайсы бир жерде төрөлгөндө коддолот деп ишенишет. Башкалар, менин орто мектепте окуп жүргөн кезимдеги философия мугалими сыяктуу, жашоонун маңызы бар экендигине жана биздин мээбиз организм менен дүйнөнүн жолугушуусу менен аныкталат деп ишенишет. Чындыгында, албетте, кыйла татаал жана ушул кезге чейин изилденген теленцефалдык системалардын көпчүлүгүндө мээ чексиз иштеп жаткан функцияны кодтой бербейт, бирок анын ичине кирген маалыматка жараша үйрөнөт. Эгерде тиешелүү маалыматтарда маалымат өтө начар болсо, анда ошол структурада билүү мүмкүнчүлүгүнүн жарактуулук мөөнөтү болушу мүмкүн (мисалы, Амблёпия). Бирок тубаса түзүлүш акыркы функцияны кодтой албаса, мээде белгилүү бир түзүлүш бар. Бул түзүлүш жеке адамдар боюнча сакталат жана бир түрдөгү адамдар жалпы функцияларды аткарат жана дисктер. ДНК белгилүү бир түзүлүштү орнотуп, жыйынтыктоочу функцияларын чексиз аткара албаган, бирок жеке тажрыйбанын негизинде конкреттүү тапшырмалардын татаалдыгын биле алган түзүлүш. Эволюция мээни дененин калган бөлүктөрүнөн, ошондой эле менингдерден жана аны тышкы дүйнөдөн коргогон катуу сөөктүн кабыгынан бөлүп турган натыйжалуу кан-мээ тосмолорунун пайда болушуна себеп болгону таң калыштуу эмес, анткени башка органдардан айырмаланып. түзүлүш геномдо коддолгон, үйрөтүлгөн мээнин түзүлүшүн чексиз сакталган модельден калыбына келтирүү мүмкүн эмес. Баарынан кызыгы, биз окшош окутуу механизмдерин улам барган сайын татаалдашкан тапшырмаларды аткарган улам барган сайын татаал терең тармактарды иштеп чыгуу аркылуу көрөбүз.

Композициялык түзүлүштөрдү көрүү кыйын, бирок бардык жерде

Таң калыштуусу, таң калыштуусу, атүгүл авторлор да максатка жетүү боюнча биринчи милдетинин композициялык түзүлүшкө ээ экендигин түшүнүшпөйт.

Тапшырмаларга жетишкен бөлүкчө жалпылоонун кыйынчылыктарын жөнөкөй сценарий менен жакшы көрсөтөт. Бирок, тапшырмалар жаңы тапшырмаларга жалпылоону баалоону татаалдаштырып, курамдык структураны бөлүшпөйт.

Түзүлүш чындыгында блокторго караганда төмөн деңгээлде экендиги жана эксперименталдык манипуляцияларга оңой жете албаса да, милдет чындыгында биргелешкен структурадан турат. Дүйнөнү тегиздикке жакындатуунун бир композициялык түзүлүшү - бул куб кубаттуулугу (түсү) котормо менен сакталат жана А блокунан же кокус баштапкы абалда - (Xa1, Ya1) позициясында (Xb1, Yb2) В блокуна чейин барат. ) А блокунан (Xa2, Ya2) В абалына (Xb2, Yb2) барууга караганда бир аз жогору буйрутма курамдык түзүмдүн бөлүгү.

Тармактар ​​ортосундагы интерфейстер

Абстракциянын ар кандай деңгээлдеринде киргизилген маалыматтарды карай алган нейрон тармактарын өркүндөтүү үчүн, интерфейстер керек болот. Бул интерфейстер көп мүнөзгө ээ болушу мүмкүн. Алар, мисалы, эки тармактын ортосунда жалпы тил катары каралышы мүмкүн, анткени макалада көрсөтүлгөндөй, көңүл борбору менен куралданган төмөнкү деңгээлдеги тармак (демонстрация тармагы) башка тармактын өкүлчүлүгүндө (контексттик тармак) демонстрацияны колдоно алат. демонстрациянын узактыгына же баштапкы конфигурациясына карабастан иш-аракеттерди багыттоо.

Бул тилдин бети бул жерде көлөмү бекем болгон, бирок тармактын ортосундагы байланышты өркүндөтө турган өзгөрүүлөрдү элестетүү мүмкүн. Мисалы, тилдин татаалдыгын кыскан же кеңейткен тармактар ​​өз ара аракеттенгендиктен, бетинин көлөмүн динамикалык өсүп же кичирейтүүгө болот. Мисалы, кайтарым байланыш аркылуу динамикалык өз ара аракеттешүүнү элестете алабыз. Экинчи тармактын киришине жана чыгышына негизделген биринчи тармактын киришин модуляциялоону үйрөнгөн параллелдик тармак катары иштеп жаткан тармактардын ортосундагы байланышты жөнгө салууну үйрөнгөн фасилитатордук тармактардын бар экендигин элестете алдык. Биз көптөгөн адистештирилген тармактарга тоникалык (жай өзгөрүлүп турган) агым катары кызмат кылган татаал контексттик тармактарды элестете алабыз ... Келечектеги изилдөө чөйрөсүнүн кызыктуу жерлери!

Жаңы модулдар мүмкүн болгон ролдор боюнча иштебей калуу учурлары

Белгилей кетүүчү нерсе, каталар көбүнчө мотордун катасынан улам келип чыгат жана тапшырманын татаалдыгына байланыштуу каталардын саны көбөйөт.

Мотор функциясын бутага алгандардын санын көбөйтүү менен гана начарлатууга болбойт, бул көбөйүү тармагынын мотор тармагы менен сүйлөшүүнү үйрөнүп жаткандыгынын күчтүү далили. Бул таң калыштуу нерсе, анткени алардын текшерүүсү контексттик тармак менен мотор тармагынын ортосундагы интерфейс салыштырмалуу конкреттүү экендигин көрсөтөт (роботтун позициясы, бута позициясы).

Мүмкүн болгон чечим, бул модулдук архитектура болгондуктан, ар кандай жоготуу функцияларын же тапшырманын ар бир аспектин чагылдырган модулдук жоготуу функцияларын колдонсо болот. Демонстрацияны камсыз кылуу үчүн мээге чейинки мотор аянттарынын эквиваленти жардам берет жана контексттик тармак мотордун буйругун бузбастан абстрактуу бойдон кала берет. Эң мыкты мотор командасын тандоо үчүн, премотордук аймактар ​​объектилерди максатын (абстрактуу тармактардан) жана сенсордук киргизүүлөргө ылайыкташтырышы керек. Контексттик тармак демонстрацияны жогорку деңгээлдеги орнотууга өткөрүп, кыймылдаткыч аракеттерди учурдагы контекстте даярдоого аракет кылып жаткан окшойт. Автоунаага чейинки тармактын ролу мотор системасы менен максатка ылайыкташтырылган жана адаптациялык жол менен байланышууну үйрөнүү, моторду үйрөнүү жана тез көнүп кетүү үчүн жай жана мээ целлюлумунун функцияларын айкалыштырат.

Моравеканын парадоксунда кызыктуу бир теория бар, ал эсептөөчү салык болуп эсептелген жогорку деңгээлдеги таанып-билүү болбойт, бирок сенсордук кирүүлөрдү жана мотор тутумдарын иштетүү. Бул чындыгында мээ целлюлумундагы нейрондордун көп бөлүгүн (мээбиздин калган бөлүктөрүнө караганда) мотор кыймылын адаптациялык көзөмөлдөө үчүн. Бул парадокс биз өзүбүздүн билимдерибизди көзөмөлсүз ызы-чуу чөйрөлөрүндө татаал тапшырмаларды аткаруу үчүн машинага киргизе алабыз деп ойлогон мезгилде (80-жылдары) түзүлгөн. Албетте, бул парадокс, эгерде кандайдыр бир жол менен машина дүйнөнү белгилүү бир мамлекеттердин жыйындысында көрсөтө алса, ага жогорку деңгээлдеги функцияны орнотуу оңой болмок. Бирок менимче, экөө тең өтө салык төлөшөт жана тармактардын ортосундагы интерфейсте колдонулган ички өкүлчүлүк биздин жеке аң-сезимдүү өкүлчүлүктөргө окшош нерседен алыс болот.

жыйынтыктоо

Бул макалада ар кандай көйгөйдү чечүүгө жооп берген ар кандай нейрон тармактарын бириктирип, жалпылаштырууну талап кылган тапшырманы түзүп, домендик рандомизация аркылуу эстутумга жана эстутумга жете турган нейрон тармагы аркылуу ылайыктуу окуу чөйрөсүн түзүү керектиги көрсөтүлөт. көңүл системасы жөнөкөй көбөйтүүдөн тышкары жалпылоону үйрөнөт. Ал маалыматтын визуалдык агымында бир гана жолу көрсөтүлүп, жогорку максатка жетишүүнү үйрөнүп, ал максатты башка контекстте кайра жарата алган тиешелүү аракеттерди калыбына келтирүү үчүн жалпыланган мейкиндикте эсептөө жүргүзөт.

Келечекте биз атомдук блоктордун үстүнө курулган татаал маселелерди жалпылоону үйрөнө ала турган, бирок маанилүү шарттарда бир нече тапшырманы жаңы шарттарда аткара ала турган, курулуштарды алдын-ала иштетүү же катуу коддолгон ыкмаларга анчалык ишенбестен барган сайын көбөйүп баратканын көрөбүз. эс тутуму. Эстутум сактагыч эс тутум тармагы боюнча бөлүштүрүлгөн өкүлчүлүктөргө, көңүл тутумдар реалдуу убакытта көңүл тармактарында циклдик иш-аракеттерге алмаштырылат. Күчтүү сериялык технологияны (Тьюринг машиналары) орнотулган эсептөө системасындагы бөлүштүрүлгөн эсептөө техникасына болгон ишенимибизге кандайча ылайыкташтыра алабыз деген суроо бойдон калууда.