Иллюстратор Dzmitry Ryzhykau | Dreamstime
Дизайнер обложки Александр Юрьевич Чесалов
Редактор Хаджимурад Ахмедович Магомедов
© Александр Юрьевич Чесалов, 2024
© Dzmitry Ryzhykau | Dreamstime, иллюстрации, 2024
© Александр Юрьевич Чесалов, дизайн обложки, 2024
ISBN 978-5-0055-8957-6
Создано в интеллектуальной издательской системе Ridero
Александр Юрьевич Чесалов
Доктор технических наук, Член-Корреспондент РАЕН,
Разработчик программы Центра искусственного интеллекта МГТУ им. Н. Э. Баумана, программы «Искусственный интеллект» и «Глубокая аналитика» проекта «Приоритет 2030» МГТУ им. Н. Э. Баумана в 2021—2022 годах.
Сертифицированный специалист: IBM Professional certificate foundations of AI, IBM Professional certificate Essential Technologies for Business и др.
Добрый день, дорогие друзья и коллеги!
2021 – 2022 годы выдались для меня не просто жаркими, но и щедрым на разные события, которые оказали на меня и мою повседневную работу огромное влияние.
Первое из них и, пожалуй, самое существенное событие – это мое участие в Конкурсе, проводимом Аналитическим Центром при Правительстве России по отбору получателей поддержки исследовательских центров в сфере искусственного интеллекта, в том числе в области «сильного» искусственного интеллекта, систем доверенного искусственного интеллекта и этических аспектов применения искусственного интеллекта, в качестве менеджера и специалиста перед которым была поставлена задача создать Центр разработки и внедрения сильного и прикладного искусственного интеллекта МГТУ им. Н. Э. Баумана, разработать и написать программу и план мероприятий Центра. Этому знаменательному событию я посвятил целую книгу «Как создать центр искусственного интеллекта за 100 дней». Информацию о ней вы можете найти на моем блоге chesalov.com и сайте ridero.ru.
Второе приятное событие – это мое ежегодное участие в Благотворительной ИТ-конференция «CISummIT Digital Hearts», которая проводится журналом «Современные Информационные Системы» и фондом Константина Хабенского. Конференция «CISummIT Digital Hearts» собирает самых активных участников ИТ-рынка, ведущих производителей и экспертов, чтобы собрать средства для помощи детям с заболеваниями головного мозга.
CISummIT Digital Hearts
Третье – это Первый международный форум «Этика искусственного интеллекта: начало доверия», который состоялся 26 октября 2021 года. В рамках этого форума была организована церемония торжественного подписания Национального кодекса этики искусственного интеллекта, а также мне представилась возможность сделать доклад на тему «Роль искусственного интеллекта в образовании».
Форум «Этика искусственного интеллекта: начало доверия»
Как отмечается в самом документе: «Кодекс этики в сфере искусственного интеллекта (далее – Кодекс) устанавливает общие этические принципы и стандарты поведения, которыми следует руководствоваться участникам отношений в сфере искусственного интеллекта (далее – Акторы ИИ) в своей деятельности, а также механизмы реализации положений настоящего Кодекса». Форум стал первой в России специализированной площадкой, где около полутора тысяч разработчиков и пользователей технологий искусственного интеллекта обсудили в рамках пяти параллельных секций шаги по эффективному внедрению этики искусственного интеллекта в приоритетных отраслях экономики Российской Федерации. Вопросы, которые обсуждались на Форуме вызвали у меня, как и у многих других людей, самый что ни на есть живой интерес и, порой, было сложно выбрать кого из докладчиков на какой сессии слушать. На что я обратил свое особое внимание, так это на то, что не остался без внимания вопрос, связанный с религией и искусственным интеллектом.
В 2022 году я принял участие в работе собрания уполномоченных по этике искусственного интеллекта и присоединился к рабочей группе по созданию свода наилучших практик решения возникающих этических вопросов в жизненном цикле искусственного интеллекта.
Четвертое событие – это конечно же Международная конференция по искусственному интеллекту и анализу данных AI Journey, в рамках которой 10 ноября 2021 года компания «Программные системы Атлансис» (Atlansys Software) присоединилась к подписанию Национального Кодекса этики искусственного интеллекта. Число спикеров конференции поразило – их было более двухсот, а число онлайн-посещений сайта более сорока миллионов. Этому мероприятию и темам, которые были представлены докладчиками можно посвятить целую книгу, но я бы порекомендовал читателю ознакомиться с записями выступлений на сайте мероприятия: https://ai-journey.ru/media/broadcast.
К последним, так сказать, приятным событиям я бы отнес свои выступления по направлению «искусственный интеллект» на таких мероприятиях, как Interpolitex и форум по цифровизации оборонно-промышленного комплекса России «ИТОПК».
Interpolitex
Посещение первой в истории пленарной дискуссии «Особенности управления правами на результаты интеллектуальной деятельности в сфере технологий искусственного интеллекта», проводимой Министерством обороны Российской Федерации.
Дискуссия «Особенности управления правами на результаты интеллектуальной деятельности в сфере технологий искусственного интеллекта»
А также мой доклад на Международном военно-техническом форуме «Армия-2022» на тему: «Разработка программно-аппаратных комплексов для решения широкого круга прикладных задач с использованием технологий машинного обучения и доверенного искусственного интеллекта в Оборонно-промышленном комплексе РФ».
Презентация доклада на форуме «Армия-2022»
И последнее из всех – это участие в круглом столе «Информатизация профессиональной юридической деятельности: LegalTech и искусственный интеллект», проводимым Комитетом Совета Федерации по конституционному законодательству и государственному строительству совместно с Советом по развитию цифровой экономики при Совете Федерации.
Резюмируя всю свою активную работу за весь период с 2021 по 2022 годы, могу сказать, что где бы я не выступал с разными докладами по теме «искусственный интеллект», всегда возникали вопросы и жаркие споры среди участников мероприятий и ученых, относящиеся к терминам и определениям. Коллеги часто спорили, что же такое «искусственный интеллект», «сильный искусственный интеллект», что такое «Artificial general intelligence» и как переводить «general» – («сильный» или «общий», а может быть «прикладной»? Много было споров по определению термина «доверенный» искусственный интеллект и так далее.
Круглый стол «Информатизация профессиональной юридической деятельности: LegalTech и искусственный интеллект» в Совете Федерации
Как следствием этого, я увидел необходимость в составлении (для себя лично) краткого словаря для помощи в выполнении повседневной работы, который назвал «Глоссариум» по аналогии с латинским словом «glossarium», что означает словарь узкоспециализированных терминов.
Первый вариант этой книги был опубликован в 2021 году и включал порядка 400 терминов. Второй вариант книги был готов уже летом 2022 года и в нее вошло более 1000 терминов и определений. В 2023 году я дополнил книгу новыми актуальными терминами и доработал некоторые старые.
Настоящий краткий словарь по искусственному интеллекту и информационным технологиям, в том числе, включает термины и определения из следующих документов:
– Стратегия развития информационного общества в Российской Федерации на 2017 – 2030 годы [1].
– Национальная стратегия развития искусственного интеллекта на период до 2030 года [2].
– Указ Президента Российской Федерации от 7 мая 2018 №204 «О национальных целях и стратегических задачах развития Российской Федерации на период до 2024 года» [3].
– Федеральный закон от 27.07.2006 N 152-ФЗ (ред. от 24.04.2020) «О персональных данных» [4].
– Национальная программа «Цифровая экономика Российской Федерации» [5].
– Кодекс этики ИИ [6].
– ГОСТы РФ. В том числе ГОСТ 59925 – 2021 «Информационные технологии. Большие данные. Техническое задание. Требования к содержанию и оформлению».
И многих других.
В том числе к ним добавились пара моих книг: «Цифровая трансформация» [7] и «Цифровая экосистема Института омбудсмена: концепция, технологии, практика» [8], и много других источников (смотри список литературы).
В этой небольшой, но как мне кажется, очень полезной книге я хочу предложить Вам краткий словарь из более чем 1000 терминов и определений по машинному обучению, искусственному интеллекту и информационным технологиям на русском и английском языках. Надеюсь, он поможет Вам сориентироваться во всем многообразии новых терминов и определений в период активных цифровых трансформаций и применения технологий четвертой промышленной революции.
Я, как автор-составитель, не претендую на авторство и уникальность представленных терминов и определений (конечно, коме тех, которые написал сам и сделал на них соответствующие ссылки). Тем не менее, я продолжаю работу в направлении по улучшению и наполнению этой книги новыми терминами и определениями, и, возможно, в ближайшее время, на суд читателя будет представлен более основательный труд.
Ссылки на первоисточники проставлены у оригинальных терминов и определений (т.е. если определение изначально было на английском языке из иностранного источника, то ссылка указывается возле него. Ссылка на тоже определение, переведенное или адаптированное на русский в этом издании не указывается. Это сделано с тем, чтобы не дублировать ссылки, не перегружать текст, не тратить, так сказать, бумагу, путая читателя).
Также, хочу сделать небольшое отступление и проинформировать уважаемого читателя о том, что эта книга является личным проектом автора и абсолютно свободным к распространению документом. Вы можете использовать эту книгу по-своему усмотрению, но ссылка на нее обязательна.
Буду Вам благодарен за любые отзывы, предложения и уточнения. Направляйте их, пожалуйста, на aleksander.chesalov@yandex.ru
Подробно ознакомиться с моей работой и моими проектами в области цифровой экономики, искусственного интеллекта и создания различных ИТ-решений и систем Вы можете на моем персональном сайте chesalov.com.
Приятного Вам чтения и продуктивной работы!
Ваш, Александр Чесалов.
25.12.2021. Издание первое. 400 терминов.
27.06.2022. Издание второе. Дополнено до 1000 терминов.
29.04.2023. Издание третье. Дополнено. Корректировка ссылок.
Автоассоциативная память (Auto Associative Memory) – это однослойная нейронная сеть, в которой входной обучающий вектор и выходные целевые векторы совпадают. Веса определяются таким образом, чтобы сеть хранила набор шаблонов. Как показано на следующем рисунке, архитектура сети автоассоциативной памяти имеет «n» количество входных обучающих векторов и аналогичное «n» количество выходных целевых векторов9.
Автоматизация (Automation) – это технология, с помощью которой процесс или процедура выполняется с минимальным участием человека.
Автоматизированная обработка персональных данных (Automated processing of personal data) – это обработка персональных данных с помощью средств вычислительной техники.
Автоматизированная система (Automated system) – это организационно-техническая система, которая гарантирует выработку решений, основанных на автоматизации информационных процессов во всевозможных отраслях деятельности.
Автоматизированная система управления (Automated control system) – это комплекс программных и программно-аппаратных средств, предназначенных для контроля за технологическим и (или) производственным оборудованием (исполнительными устройствами) и производимыми ими процессами, а также для управления такими оборудованием и процессами.
Автономное транспортное средство (Autonomous vehicle) – это вид транспорта, основанный на автономной системе управления. Управление автономным транспортным средством полностью автоматизировано и осуществляется без водителя при помощи оптических датчиков, радиолокации и компьютерных алгоритмов.
Автономные вычисления (Autonomic computing) – это способность системы к адаптивному самоуправлению собственными ресурсами для высокоуровневых вычислительных функций без ввода данных пользователем.
Автономный искусственный интеллект (Autonomous artificial intelligence) – это биологически инспирированная система, которая пытается воспроизвести устройство мозга, принципы его действия со всеми вытекающими отсюда свойствами.
Адаптивная система (Adaptive system) – это система, которая автоматически изменяет данные алгоритма своего функционирования и (иногда) свою структуру для поддержания или достижения оптимального состояния при изменении внешних условий.
Аддитивные технологии (Additive technologies) – это технологии послойного создания трехмерных объектов на основе их цифровых моделей («двойников»), позволяющие изготавливать изделия сложных геометрических форм и профилей.
Активное обучение/Стратегия активного обучения (Active Learning/Active Learning Strategy) – это особый способ полу управляемого машинного обучения, в котором обучающий агент может в интерактивном режиме запрашивать оракула для получения меток в новых точках данных. Подход к такому обучению основывается на самостоятельном выборе алгоритма некоторых данных из массы тех, на которых он учится. Активное обучение особенно ценно, когда помеченных примеров мало или их получение слишком затратно. Вместо слепого поиска разнообразных помеченных примеров алгоритм активного обучения выборочно ищет конкретный набор примеров, необходимых для обучения.
Алгоритм (Algorithm) – это точное предписание о выполнении в определенном порядке системы операций для решения любой задачи из некоторого данного класса (множества) задач. Термин «алгоритм» происходит от имени узбекского математика Мусы аль-Хорезми, который еще в 9 веке (ок. 820 г. н.э.) предложил простейшие арифметические алгоритмы. В математике и кибернетике класс задач определенного типа считается решенным, когда для ее решения установлен алгоритм. Нахождение алгоритмов является естественной целью человека при решении им разнообразных классов задач. Также, алгоритм – это набор правил или инструкций, данных ИИ, нейронной сети или другим машинам, чтобы помочь им учиться самостоятельно; классификация, кластеризация, рекомендация и регрессия – четыре самых популярных типа.
Алгоритм Q-обучения (Q-learning) – это алгоритм обучения, основанный на ценностях. Алгоритмы на основе значений обновляют функцию значений на основе уравнения (в частности, уравнения Беллмана). В то время как другой тип, основанный на политике, оценивает функцию ценности с помощью жадной политики, полученной из последнего улучшения политики. Табличное Q-обучение (при обучении с подкреплением) представляет собой реализацию Q-обучения с использованием таблицы для хранения Q-функций для каждой комбинации состояния и действия. «Q» в Q-learning означает качество. Качество здесь показывает, насколько полезно данное действие для получения вознаграждения в будущем10.
Алгоритм любого времени (Anytime algorithm) – это алгоритм, который может дать частичный ответ, качество которого зависит от объема вычислений, которые он смог выполнить. Ответ, генерируемый алгоритмами anytime, является приближенным к правильному. Большинство алгоритмов выполняются до конца: они дают единственный ответ после выполнения некоторого фиксированного объема вычислений. Однако в некоторых случаях пользователь может захотеть завершить алгоритм до его завершения. Эта особенность алгоритмов anytime моделируется такой теоретической конструкцией, как предельная машина Тьюринга (Бургин, 1992; 2005)11.
Алгоритмическая оценка (Algorithmic Assessment) – это техническая оценка, которая помогает выявлять и устранять потенциальные риски и непредвиденные последствия использования систем искусственного интеллекта, чтобы вызвать доверие и создать поддерживающие системы вокруг принятия решений ИИ.
Алгоритмическая предвзятость (Biased algorithm) – это систематические и повторяющиеся ошибки в компьютерной системе, которые приводят к несправедливым результатам, например, привилегия одной произвольной группы пользователей над другими.
Алгоритмы машинного обучения (Machine learning algorithms) – это фрагменты кода, которые помогают пользователям исследовать и анализировать сложные наборы данных и находить в них смысл или закономерность. Каждый алгоритм – это конечный набор однозначных пошаговых инструкций, которые компьютер может выполнять для достижения определенной цели. В модели машинного обучения цель заключается в том, чтобы установить или обнаружить закономерности, с помощью которых пользователи могут создавать прогнозы либо классифицировать информацию. В алгоритмах машинного обучения используются параметры, основанные на учебных данных (подмножество данных, представляющее более широкий набор). При расширении учебных данных для более реалистичного представления мира с помощью алгоритма вычисляются более точные результаты. В различных алгоритмах применяются разные способы анализа данных. Они часто группируются по методам машинного обучения, в рамках которых используются: контролируемое обучение, неконтролируемое обучение и обучение с подкреплением. В наиболее популярных алгоритмах для прогнозирования целевых категорий, поиска необычных точек данных, прогнозирования значений и обнаружения сходства используются регрессия и классификация12.
Анализ временных рядов (Time series analysis) – это раздел машинного обучения и статистики, который анализирует временные данные. Многие типы задач машинного обучения требуют анализа временных рядов, включая классификацию, кластеризацию, прогнозирование и обнаружение аномалий. Например, вы можете использовать анализ временных рядов, чтобы спрогнозировать будущие продажи зимних пальто по месяцам на основе исторических данных о продажах.
Аналитика больших данных – это методы, инструменты и приложения, которые используются для сбора и обработки больших наборов разнородных, быстро создаваемых данных и извлечения из них ценной информации. Эти данные могут поступать из самых разных источников: браузеров, мобильных приложений, электронной почты, социальных сетей и интеллектуальных сетевых устройств. Зачастую они генерируются с высокой скоростью и не обладают строго определенной формой: они могут быть полностью структурированными (таблицы баз данных или электронные таблицы Excel), частично структурированными (XML-файлы, веб-страницы) и неструктурированными (изображения, аудиофайлы)13,14.
Аналитика принятия решений (Decision intelligence) – это практическая дисциплина, используемая для улучшения процесса принятия решений путем четкого понимания и программной разработки того, как принимаются решения, и как итоговые результаты оцениваются, управляются и улучшаются с помощью обратной связи.
Аппаратное обеспечение (Hardware) – это система взаимосвязанных технических устройств, предназначенных для ввода (вывода), обработки и хранения данных.
Аппаратное обеспечение ИИ (AI hardware, AI-enabled hardware, AI hardware platform) – это аппаратное обеспечение ИИ, аппаратные средства ИИ, аппаратная часть инфраструктуры или системы искусственного интеллекта, ИИ-инфраструктуры.
Аппаратно-программный комплекс (Hardware-software complex) – это набор технических и программных средств, работающих совместно для выполнения одной или нескольких сходных задач.
Аппаратный акселератор (Hardware accelerator) – это устройство, выполняющее некоторый ограниченный набор функций для повышения производительности всей системы или отдельной её подсистемы. Например, purpose-built hardware accelerator – специализированный аппаратный ускоритель.
Аппаратный Сервер (аппаратное обеспечение) (Hardware Server) – это выделенный или специализированный компьютер для выполнения сервисного программного обеспечения (в том числе серверов тех или иных задач) без непосредственного участия человека. Одновременное использование как высокопроизводительных процессоров, так и FPGA позволяет обрабатывать сложные гибридные приложения.
Архитектура вычислительной машины (Architecture of a computer) – это концептуальная структура вычислительной машины, определяющая проведение обработки информации и включающая методы преобразования информации в данные и принципы взаимодействия технических средств и программного обеспечения.
Архитектура вычислительной системы (Architecture of a computing system) – это конфигурация, состав и принципы взаимодействия (включая обмен данными) элементов вычислительной системы.
Архитектура механизма обработки матриц (MPE) (Matrix Processing Engine Architecture) – это многомерный массив обработки физических матриц цифровых устройств с умножением (MAC), который вычисляет серию матричных операций сверточной нейронной сети.
Архитектура системы (Architecture of a system) – это принципиальная организация системы, воплощенная в её элементах, их взаимоотношениях друг с другом и со средой, а также принципы, направляющие её проектирование и эволюцию.
Архитектура фон Неймана (модель фон Неймана, Принстонская архитектура) (Von Neumann architecture) – это широко известный принцип совместного хранения команд и данных в памяти компьютера. Вычислительные машины такого рода часто обозначают термином «машина фон Неймана», однако соответствие этих понятий не всегда однозначно. В общем случае, когда говорят об архитектуре фон Неймана, подразумевают принцип хранения данных и инструкций в одной памяти15.
Архитектурная группа описаний (Architectural description group, Architectural view) – это представление системы в целом с точки зрения связанного набора интересов.
Архитектурный фреймворк (Architectural frameworks) – это высокоуровневые описания организации как системы; они охватывают структуру его основных компонентов на разных уровнях, взаимосвязи между этими компонентами и принципы, определяющие их эволюцию16.
Асинхронные межкристальные протоколы (Asynchronous inter-chip protocols) – это протоколы для обмена данных в низкоскоростных устройствах; для управления обменом данными используются не кадры, а отдельные символы.
Ассоциация по развитию искусственного интеллекта (Association for the Advancement of Artificial Intelligence) – это международное научное сообщество, занимающееся продвижением исследований и ответственным использованием искусственного интеллекта. AAAI также стремится повысить общественное понимание искусственного интеллекта (ИИ), улучшить обучение и подготовку специалистов, занимающихся ИИ, и предоставить рекомендации для планировщиков исследований и спонсоров относительно важности и потенциала текущих разработок ИИ и будущих направлений.