В СФУ создали программу-«предсказатель» новых химических соединений
Машинное обучение для обнаружения взаимосвязи между химической формулой неорганических красных и инфракрасных люминофоров и длинной волны излучения, а также полушириной максимума излучения применил ученый Сибирского федерального университета (СФУ) Максим Молокеев, 19 января сообщает пресс-служба СФУ.
Метод может быть расширен для решения ряда материаловедческих задач, в первую очередь, для поиска химических соединений, которые будут максимально «заточены» под конкретные отрасли и способы их применения, отмечает разработчик.
Ученые СФУ несколько лет занимаются поиском люминофоров, которые можно применять в лампах дневного света, рекламной подсветке, но главное — для того чтобы выращивать различные сельскохозяйственные растения в теплицах, при этом не теряя их полезные пищевые свойства.
Максим Молокеев, доцент базовой кафедры физики твердого тела и нанотехнологий Института инженерной физики и радиоэлектроники (ИИФиРЭ) СФУ, предложил способ подбора люминофоров с подходящей длиной волны излучения с помощью машинного обучения.
Само обучение разработанной им программы было проведено на случайной выборке 70% из 300 известных соединений. Проверка выполнялась с помощью десятикратной кросс-валидации на оставшихся 30% известных соединений. Она показала точность прогноза +/– 30 нм на диапазоне прогнозируемых длин волн от 620 до 1030 нм.
Ученый рассказал о проведенной им работе: «На основе 300 научных статей из различных источников была систематизирована информация о составе и некоторых характеристиках люминофоров. Этот „информационный массив“ был использован для обучения модели в написанной мной программе машинного обучения. Программа оказалась способной ученицей — теперь она умеет по химической формуле прогнозировать люминесцентные свойства соединений».
Достоинством программы является ее способность делать прогноз только по химической формуле, без ввода каких-либо сложных структурных характеристик. Причем она предсказывает люминесцентные свойства даже таких соединений, которые пока не существуют. Если их предсказанные свойства заинтересуют химиков, то они займутся созданием такого соединения в реальности.
Программа также может быть использована для улучшения уже известных химических соединений с хорошими квантовыми выходами, но не оптимальной длиной волны — она поможет «подстроить» длину волны излучения, сделав ее более эффективной для роста растения. Программа укажет на необходимую небольшую коррекцию химического состава соединения, которая изменит длину волны в нужную сторону.
Максим Молокеев рассказал, что уже сейчас его коллеги-химики в России и Китае используют прогнозы новой программы для синтеза ранее не существовавших соединений, но которым программа предсказала необходимую ученым длину волны.
Он пояснил, что совпадение длины волны излучения у синтезированного соединения в пределах +/– 30 нм докажет высокую практическую ценность его разработки, а если этого не произойдет, то модель будет обучаться на новых данных, восполняя пробелы в своих познаниях для повышения точности последующих «предсказаний».
Ученый отметил, что сбор данных для обучения занял всего лишь четыре дня и это открывает огромные перспективы применения в будущем информации, содержащейся в научных статьях, для машинного обучения моделей, «предсказывающих» другие свойства химических соединений.