Репозиторий проекта "Аппроксимация обменно-корреляционных функционалов в квантовой химии математическими выражениями с помощью символьной регрессии", выполненного в рамках летней школы AIRI
Авторы: Ким Павел, Кулаев Кирилл
Куратор: Рябов Александр
Репозиторий состоит из папок, каждая из которых содержит в себе файл .ipynb и опционально дополнительные файлы, необходимые для корректного запуска кода в jupyter-файле.
ВАЖНО
В силу большого числа зависимостей при установке пакетов, настоятельно рекомендуется запускать .ipynb файлы в среде Google Colab, дополнительные файлы (при наличии) копировать из папки в директорию /content. Только так авторы могут гарантировать воспроизводимость полученных результатов.
-
Директория "GA символьная ререссия" содержит часть работы, посвященной изучению возможностей генетического алгоритма для решения задач символьной регрессии
- Директория "GA предсказание формул известных потенциалов" содержит используемые в коде датасеты и .ipynb файл, код в котором решает задачу символьной регрессии с помощью генетического алгоритма для уже известных функционалов в приближении LDA: lda_x, lda_c_chachiyo, lda_c_pw_mod.
- Директория "GA предсказание формулы нейросетевого потенциала" содержит используемый в коде датасет и .ipynb файл, код в котором решает задачу символьной регрессии с помощью генетического алгоритма для нейросетевого обменно-корреляционного функционала, аналитический вид которого неизвестен.
-
Директория "Meta NN символьная регрессия" содержит часть работы, посвященной изучению возможностей нейронной сети-трансформера от Meta для решения задач символьной регрессии
- Директория "NN предсказание формул известных потенциалов" содержит используемые в коде датасеты и .ipynb файл, код в котором решает задачу символьной регрессии с помощью нейросети-трансформера для уже известных функционалов в приближении LDA: lda_x, lda_c_chachiyo, lda_c_pw_mod.
- Директория "NN предсказание формулы нейросетевого потенциала" содержит используемый в коде датасет и .ipynb файл, код в котором решает задачу символьной регрессии с помощью нейросети-трансформера для нейросетевого обменно-корреляционного функционала, аналитический вид которого неизвестен.
-
Директория Генерация потенциалов содержит часть работы по генерации используемых датасетов (.csv файлов).
- Директория Генерация известных потенциалов содержит .ipynb файл с кодом для расчета известных обменно-крреляционных потенциалов (lda_x, lda_c_chachiyo, lda_c_pw_mod) с помощью пакета pycsf на процедурно сгенерированных значениях электронной плотности и используемый для расчетов электронной плотности атома ртути UGBS базис. Результат выполнения кода - список директорий, в каждой из которых содержится четыре .csv файла (две колонки: x_0 - электронная плотность, y - расчитанный обменно-корреляционный потенциал) - трейн и тест для первого эксперимента (_first-файлы, значения электронной плотности от 0 до 1000), и трейн и тест датасет для второго эксперимента (_second-файлы, значения электронной плотности от 0 до 1000000 ).
- Директория Генерация нейросетевого потенциала содержит .ipynb файл с кодом для расчета нейросетевого обменно-корреляционного потенциала неизвестного аналитического вида на рассчитанных для молекулы воды значениях электронной плотности, а также ряд необходимых для корректной работы кода файлов. Результат выполнения кода - .csv файл (две колонки: x_0 - электронная плотность, y - расчитанный обменно-корреляционный потенциал) с генерированными нейросетью данными.
-
Директрия Референсная энергия содержит .ipynb файл для расчета референсного значения энергии молекулы воды, используя обменно-корреляционный функционал lda_x+lda_c_chachiyo, посчитанный с помощью программного пакета pycsf.
-
Директория Сравнение энергий полученных функционалов содержит .ipynb файл с кодом для вычисления энергии молекулы воды с использованием разных обменно-корреляционных потенциалов (нейросетевой, взятый из работы https://github.com/ml-electron-project/NNfunctional/tree/master; lda_x+lda_c_chachiyo из Meta NN символьной регрессии; lda_x+lda_c_chachiyo из GA символьной регрессии; нейросетевой из Meta NN символьной регрессии и нейросетевой из GA символьной регрессии. Также в директории находятся файлы LSDA_*.py с кодом для непосредственно расчетов энергии, а также ряд других файлов, необходимых для корректной работы кода.
- GA предсказание формул известных потенциалов
- GA предсказание формулы нейросетевого потенциала
- NN предсказание формул известных потенциалов
- NN предсказание формулы нейросетевого потенциала
- Генерация известных потенциалов
- Генерация нейросетевого потенциала
- Референсная энергия
- Сравнение полученных функционалов
- https://github.com/facebookresearch/symbolicregression/tree/main - нейросеть-трансформер от Meta для решения задачи символьной регрессии;
- https://github.com/trevorstephens/gplearn - генетический алгоритм для решения задачи символьной регрессии;
- https://github.com/ml-electron-project/NNfunctional/tree/master - работа с вычисленным нейросетевым обменно-корреляционным потенциалом.