Многие алгоритмы машинного обучения на квантовых компьютерах страдают от так называемого “бесплодного плато” неразрешимости, где они сталкиваются с тупиками в задачах оптимизации. Этот вызов был относительно не изучен – до сих пор. Строгая теоретическая работа установила правила, которые гарантируют, будет ли данный алгоритм машинного обучения работать при масштабировании на больших компьютерах.
“Работа решает ключевую проблему применимости квантового машинного обучения. Мы строго доказали условия, при которых некоторые архитектуры вариационных квантовых алгоритмов будут или не будут иметь бесплодных плато по мере их масштабирования”, – сказал Марко Сересо, ведущий автор статьи, опубликованной в Nature Communications командой ученых Лос-Аламосской национальной лаборатории.
“С помощью наших теорем вы можете гарантировать, что архитектура будет масштабироваться до квантовых компьютеров с большим количеством кубитов.”
“Обычно подход состоял в том, чтобы запустить оптимизацию и смотреть, работает ли она, и это приводило к усталости среди исследователей в этой области”, – сказал Патрик Коулз, соавтор исследования. Установление математических теорем и выведение первых принципов выводит догадки из разработки алгоритмов.
Команда Лос-Аламоса использовала общий гибридный подход для вариационных квантовых алгоритмов, обучая и оптимизируя параметры на классическом компьютере и оценивая функцию стоимости алгоритма или меру успеха алгоритма на квантовом компьютере.
Алгоритмы машинного обучения переводят задачу оптимизации – скажем, поиск кратчайшего маршрута для коммивояжера через несколько городов – в функцию затрат, говорят исследователи. Это математическое описание функции, которая будет сведена к минимуму. Функция достигает своего минимального значения только в том случае, если вы решаете задачу.
Большинство квантовых вариационных алгоритмов начинают свой поиск случайным образом и оценивают функцию стоимости глобально по каждому кубиту, что часто приводит к бесплодному плато.
“Мы смогли доказать, что если вы выберете функцию стоимости, которая локально смотрит на каждый отдельный кубит, то мы гарантируем, что масштабирование не приведет к невероятно крутой кривой зависимости времени от размера системы и, следовательно, может быть обучено”, – сказал Патрик Коулз.
Квантово-вариационный алгоритм создает ландшафт решения проблем, где пики представляют точки с высокой энергией системы или проблемы, а долины – низкие значения энергии. Ответ лежит в самой глубокой долине. Это основное состояние, представленное функцией минимизации затрат. Чтобы найти решение, алгоритм тренирует себя в ландшафте, тем самым перемещаясь к низкому месту.
“Люди предлагали квантовые нейронные сети и сравнивали их, делая мелкомасштабные симуляции на нескольких кубитов”, – говорят исследователи. “Проблема в том, что вы не увидите бесплодное плато с небольшим количеством кубитов, но когда вы попытаетесь масштабировать его до большего количества кубитов, оно появляется. Затем алгоритм должен быть переработан для более крупного квантового компьютера.”
Бесплодное плато – это проблема обучаемости, возникающая в алгоритмах оптимизации машинного обучения, когда пространство решения задач становится “плоским” по мере выполнения алгоритма. В этой ситуации алгоритм не может найти нисходящий уклон в том, что кажется невыразительным ландшафтом, и нет четкого пути к минимуму энергии. Не имея ландшафтных особенностей, машинное обучение не может тренировать себя, чтобы найти решение.
“Если у вас есть бесплодное плато, вся надежда на квантовое ускорение или квантовое преимущество потеряна”, – говорят исследователи.
Прорыв Лос-Аламосской команды делает важный шаг к квантовому превосходству, когда квантовый компьютер выполняет задачу, которая заняла бы бесконечно много времени на классическом компьютере.
Достижение квантового превосходства в краткосрочной перспективе зависит от масштабирования вариационных квантовых алгоритмов. Эти алгоритмы имеют потенциал для решения практических задач, когда квантовые компьютеры в 100 кубитов и более станут доступны. Квантовые компьютеры в настоящее время достигают максимума в 65 кубитов. Кубит – это основная единица информации в квантовом компьютере, как и биты в классическом цифровом компьютере.
“Самая горячая тема в квантовых компьютерах среднего масштаба – это вариационные квантовые алгоритмы, или квантовое машинное обучение и квантовые нейронные сети”, – говорит Патрик Коулз. “Они были предложены для приложений от решения структуры молекулы в химии до моделирования динамики атомов и молекул и факторинга чисел.”
Источник: