01.10.2018 Новости, Искусственный интеллектИсследователи подразделения Google Brain, Сандийской национальной лаборатории и кафедры информатики Университета Нью-Мексико внедрили в обычное ПО «усиленную» форму машинного обучения (reinforcement learning) — оно применяется для обучения роботов навыкам ориентирования на незнакомой им территории. Труд ученых «Resilient Computing with Reinforcement Learning on a Dynamical System: Case Study in Sorting» призван опытным путем установить, можно ли создать такое ПО, которое бы не боялось непредсказуемых ситуаций. Это уже не первые опыты подобного рода. В начале этого года вышла работа, где описывались алгоритмы обучения робототехники и беспилотных летательных аппаратов для навигации по пересеченной местности и в воздухе. По мнению Александры Фэуст из Google Brain, большинство программных продуктов разрабатывалось по классической схеме и не обладает устойчивостью при возникновении внештатных ситуаций, например, при нарушении работы ОЗУ или других сбоях в работе оборудования. Другими словами, надежность работы ПО напрямую зависит от надежности аппаратных средств. Дэвид Экли из Университета Нью-Мексико прозвал такую схему работы ПО одержимостью «CEO» (Correctness and Efficiency Only, корректность и продуктивность во главе угла). Она предполагает, что софт с четко прописанными действиями выполнит и завершит задачу, это происходит последовательно, но ровно до тех пор, пока алгоритм не столкнется с непредвиденными ошибками. По словам Экли, практика написания ПО десятилетиями ...
читать далее.