Способ генерации случайной кристаллической структуры, использующий базу данных периодических сеток

Изобретение относится к области генерации кристаллических структур. Технический результат заключается в генерации новых периодических сеток, имеющих более низкую симметрию. Раскрыт компьютерно-реализуемый способ генерации кристаллической структуры химического соединения, использующий базу данных периодических сеток, содержащий этапы, на которых: формируют базу данных периодических сеток, содержащую информацию о группах симметрии, которые описывают максимально возможные симметрии структур сеток и информацию о структурной связности сеток; сетки, входящие в базу данных, получают несколькими способами: импортированием данных из известных баз данных периодических сеток; упрощением известных структур химических веществ путем замены в них структурных единиц на узлы упрощенной сетки, совпадающие с центрами тяжести структурных единиц, и последующим удалением 0-, 1- и 2-координированных узлов упрощенной сетки; генерацией подсеток и надсеток из имеющихся периодических сеток путем удаления из них или добавления в них новых ребер; классифицируют периодические сетки по топологическим типам, определяемым уникальными наборами топологических индексов, в части координационных последовательностей, точечных и вершинных символов независимых узлов сетки; формируют в базе данных периодических сеток таблицу, в которой хранится информация о различных типах атомов и список предпочитаемых координационных чисел атомов, определенных на основе имеющейся экспериментальной информации по строению химических соединений; формируют на основе базы данных периодических сеток базу данных производных периодических сеток следующим образом: выбирают подгруппу Gsub, соответствующую пространственной группе симметрии G исходной периодической сетки и генерируют новую периодическую сетку, имеющую более низкую симметрию Gsub, при условии, что позиции узлов новой сетки совпадают с позициями узлов исходной сетки, однако в узлы новой сетки, ставшие неэквивалентными вследствие понижения симметрии, помещают атомы разных типов; записывают в базу данных производных периодических сеток данные новой сетки, характеризующие: максимальную симметрию для новой сетки, список позиций симметрично независимых атомов, а именно узлов сетки, и список симметрично независимых связей, ребер сетки. 1 з.п. ф-лы, 6 ил.

 

ОБЛАСТЬ ТЕХНИКИ

[0001] Настоящее техническое решение относится к области кристаллохимии, а именно к области генерации кристаллических структур для последующего использования их в алгоритмах глобальной оптимизации.

УРОВЕНЬ ТЕХНИКИ

[0002] Из уровня техники известны способы, с помощью которых можно генерировать кристаллические структуры случайным образом.

Первый способ - полностью случайно выбрав координаты всех атомов (1), либо второй способ – это использовать группу пространственной симметрии и выбирать только координаты, удовлетворяющие этой группе (2).

Введение симметрии уменьшает количество степеней свободы и таким образом увеличивает разнообразие и степень упорядоченности получающихся структур. Описание таких типов решений (2) можно найти в программах USPEX [A. O. Lyakhov, A. R. Oganov, H. T. Stokes, and Q. Zhu, New developments in evolutionary structure prediction algorithm USPEX., Comput. Phys. Commun. 184, 1172 (2013).], и CALYPSO [Wang Y, Lü J, Zhu L, et al. Crystal structure prediction via particle-swarm optimization. Phys Rev B, 2010, 82:094116].

В качестве решения на текущем уровне техники, локально решающего вопрос генерации структур с использованием баз данных структурных прототипов (3), можно рассматривать публикацию [Chuanxun Su et al (2017) Construction of crystal structure prototype database: methods and applications. J. Phys.: Condens. Matter 29, 165901] Этот метод позволяет увеличить степень упорядоченности генерируемых структур, но снижает их разнообразие.

Общим требованием к таким решениям является, высокое разнообразие структур и при этом высокая степень упорядоченности.

[0003] Таким образом, известные из уровня техники решения, предназначенные для генерирования случайных кристаллических структур, имеют ряд недостатков, а именно, решения типа (1) не удовлетворяют даже минимальным требованиям по упорядоченности и разнообразию структур. Создаваемые структуры аморфны, а значит и неотличимы друг от друга по физическим и химическим свойствам. Решения (2) дают высокую степень разнообразия и неплохую степень упорядоченности, но для систем, состоящих из большого числа атомов, также начинают давать аморфные структуры. Решения (3) дает высокую степень упорядоченности, но крайне низкую степень разнообразия. У решения (1), (2) есть дополнительный недостаток, состоящий в невозможности контролировать химическое окружение атомов. Невозможно запретить одни координационные числа и поощрять другие.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

[0004] Технической проблемой, на решение которой направлено заявленное техническое решение, является создание нового способа генерации случайной кристаллической структуры, использующего базу данных периодических сеток.

[0005] Данное техническое решение направлено на устранение недостатков, присущих существующим решениям из уровня техники.

[0006] Технический результат заключается в генерации новых периодических сеток, имеющих более низкую симметрию.

[0007] В предпочтительном варианте реализации заявлен способ генерации случайной кристаллической структуры, использующий базу данных периодических сеток, содержащий этапы, на которых:

- формируют базу данных периодических сеток, содержащую информацию о группах симметрии, которые описывают максимально возможные симметрии структур сеток и информацию о структурной связности сеток; сетки, входящие в базу данных, получают несколькими способами:

1) импортированием данных из известных баз данных периодических сеток;

2) упрощением известных структур химических веществ путем замены в них структурных единиц на узлы упрощенной сетки, совпадающие с центрами тяжести структурных единиц, и последующим удалением 0-, 1- и 2-координированных узлов упрощенной сетки;

3) генерацией подсеток и надсеток из имеющихся периодических сеток путем удаления из них или добавления в них новых ребер;

- классифицируют периодические сетки по топологическим типам, определяемым уникальными наборами топологических индексов, в части координационных последовательностей, точечных и вершинных символов независимых узлов сетки;

- формируют в базе данных периодических сеток таблицу, в которой хранится информация о различных типах атомов и список предпочитаемых координационных числах атомов, определенных на основе имеющейся экспериментальной информации по строению химических соединений;

- формируют на основе базы данных периодических сеток базу данных производных периодических сеток следующим образом:

выбирают подгруппу Gsub, соответствующую пространственной группе симметрии G исходной периодической сетки и генерируют новую периодическую сетку, имеющую более низкую симметрию Gsub; позиции узлов новой сетки совпадают с позициями узлов исходной сетки, однако в узлы новой сетки, ставшие неэквивалентными вследствие понижения симметрии, помещают атомы разных типов

записывают в базу данных производных периодических сеток данные новой сетки, характеризующие:

максимальную симметрию для новой сетки, список позиций симметрично независимых атомов, а именно узлов сетки, и список симметрично независимых связей, ребер сетки.

ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0008] Реализация изобретения будет описана в дальнейшем в соответствии с прилагаемыми чертежами, которые представлены для пояснения сути изобретения и никоим образом не ограничивают область изобретения. К заявке прилагаются следующие чертежи:

Фиг. 1 иллюстрирует возможные разложения Pmm2 и соответствующие структуры;

Фиг. 2 иллюстрирует пример работы заявленного способа;

Фиг. 3 иллюстрирует статистику эволюционного поиска для Mg4Al8O16;

Фиг. 4 иллюстрирует сравнение для системы: Ca4F8;

Фиг. 5 иллюстрирует сравнение для системы: Cu4In4S8;

Фиг.6 иллюстрирует общую схему компьютерного устройства, обеспечивающего обработку данных, необходимую для реализации заявленного решения.

ДЕТАЛЬНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

[0009] В приведенном ниже подробном описании реализации изобретения приведены многочисленные детали реализации, призванные обеспечить отчетливое понимание настоящего изобретения. Однако, квалифицированному в предметной области специалисту, будет очевидно каким образом можно использовать настоящее изобретение, как с данными деталями реализации, так и без них. В других случаях хорошо известные методы, процедуры и компоненты не были описаны подробно, чтобы не затруднять излишне понимание особенностей настоящего изобретения.

[0010] Кроме того, из приведенного изложения будет ясно, что изобретение не ограничивается приведенной реализацией. Многочисленные возможные модификации, изменения, вариации и замены, сохраняющие суть и форму настоящего изобретения, будут очевидными для квалифицированных в предметной области специалистов.

[0011] Настоящее изобретение направлено на обеспечение способа генерации случайной кристаллической структуры, использующий базу данных периодических сеток.

[0012] В заявленном способе осуществляют генерацию бесконечного количества структур основываясь на конечном числе периодических сеток. В рамках топологического подхода, каждая структура представляется набором узлов и связей между ними. Типы атомов и их положения игнорируются. Таким образом многие различные структуры будут иметь одинаковую топологию. Топология структуры хранит в себе информацию о максимально возможной симметрии структуры и о ее химии (структурной связности). Последнее свойство позволяет подбирать структуры основываясь на предпочитаемых координационных числах составляющих элементов. В свою очередь, предпочитаемые координационные числа атомов определяются на основе анализа имеющейся экспериментальной информации по строению химических соединений; таблица, содержащая информацию «имя атома – список предпочитаемых координационных чисел» является частью базы данных периодических сеток.

[0013] Топология структуры задается периодической сеткой, состоящей из узлов и ребер, соответствующих атомам и связям; при этом информация о геометрии структуры игнорируется. Базовая топология – это еще более упрощенное описание структуры. Для получения базовой топологии из исходной структуры проводятся два шага упрощения. На первом шаге каждый структурный группировки (кластер, координационная группа, молекула) упрощается (стягивается) в его центр тяжести и представляется одним узлом упрощенной сетки. На втором шаге упрощения однокоординированные узлы, соответствующие терминальным (концевым) группировкам удаляются, как не влияющие на топологию структуры в целом, а двухкоординированные узлы, соответствующие мостиковым группировкам (линкерам) преобразуются в ребра упрощенной сетки. Полученная базовая сетка имеет только трех- и выше координированные узлы, которые соответствуют структурообразующим группировкам исходной структуры, а ребра – межатомным связям или мостиковым группировкам атомов, связывающим структурообразующие группировки в трехмерный каркас. Простейший случай генерации структуры — это взять такую базовую сетку и случайно сопоставить узлы разным типам атомов. Для этого однако, нужна информация о геометрии окружения узлов, так как различные атомы имеют не только типичные координационные числа, но и типичную геометрию окружения (координационную фигуру). Такое сочетание основной топологии и геометрии, есть в базе данных идеализированных топологий комплекса программ ToposPro. В этой базе данных можно найти как уже найденные в природе топологии, так и гипотетические. Она содержит максимально симметричные пространственные вложения для каждой топологии и включает почти 200000 записей. Т.е. из всех систем с различными симметриями и данной топологией, только наиболее симметричная представлена в базе данных. Записи в базе данных содержат информацию о группе симметрии, параметрах ячейки, и симметрично независимых узлах базовой сетки, находящихся в соответствующих позициях Уайкоффа. Действуя на независимые узлы операторами группы симметрии, мы получим все узлы в сетке. Таким образом записи в этой базе данных дают прекрасную стартовую точку для дальнейшей генерации структуры.

[0014] При случайном сопоставлении узлов выбранной базовой сетки с типами атомов произойдет нарушение симметрии. Это снизит степень упорядоченности структуры, а значит этого надо избегать. Избежать этого можно, сопоставив химические элементы не только независимым узлам. Тогда атомы одного элемента будут переходить друг в друга под действием операторов симметрии. Таким образом высокая степень упорядоченности сохранится, но структур на выходе будет производиться мало. Можно добавить возможность группировать разные независимые узлы и сопоставлять химические элементы таким группам. Это расширит число структур на выходе. Но реальный потенциал использования базы данных гораздо выше.

[0015] Наибольший эффект для увеличения разнообразия структур имеет предложенный нами метод разложения пространственных групп. Процедура сводится к выбору подгруппы данной пространственной группы. Это можно сделать с использованием Международных Таблиц для Кристаллографии [International Tables for Crystallography (2004) Vol. A1: Symmetry Relations between Space Groups, Eds. H. Wondratschek, U. Müller, Kluwer: Dordrecht.]; соответствующий алгоритм реализован в процедуре Generate Representations комплекса программ ToposPro. После выбора подгруппы симметрии пересматривается набор независимых узлов в данной структуре, так чтобы после применения у этим независимым узлам новой, меньшей, группы симметрии, полный набор узлов не изменился. К новому набору независимых узлов, снова применяется процедура группировки и сопоставления химическим элементам. Полученные структуры обладают высокой степенью упорядоченности и разнообразия.

[0016] На фиг. 1 представлены возможные разложения Pmm2 и соответствующие структуры. Линии обозначают плоскости симметрии, зерноподобные символы – оси второго порядка. Начальная структура a) имеет симметрию Pmm2 и содержит два независимых узла, один в общей позиции Уайкоффа и одну в специальной. В зависимости от выбранной подгруппы получаются разные структуры. Структуры b) и d) имеют 3 основных узла, а структура c) имеет 4. Начальная структура a) допускает только составы A2B4 и A6. Структуры b) и d) допускают A2B4, A2B2C2 и A6. Структура c) допускает A1B1C2D2, A1B1C4, A1B2C3, A1C5, A2B2C2, A2B4, A3B3, A6.

[0017] Далее с отсылкой к Фиг.2 будет раскрыт пример работы заявленного способа (200).

[0018] На этапе (201) формируют базу данных периодических сеток, содержащую информацию о группах симметрии, которые описывают максимально возможные симметрии структур сеток и информацию о структурной связности сеток; сетки, входящие в базу данных, получают несколькими способами:

1) импортированием данных из известных баз данных периодических сеток;

2) упрощением известных структур химических веществ путем замены в них структурных единиц на узлы упрощенной сетки, совпадающие с центрами тяжести структурных единиц, и последующим удалением 0-, 1- и 2-координированных узлов упрощенной сетки;

3) генерацией подсеток и надсеток из имеющихся периодических сеток путем удаления из них или добавления в них новых ребер.

[0019] На этапе (202) классифицируют периодические сетки по топологическим типам, определяемым уникальными наборами топологических индексов, в части координационных последовательностей, точечных и вершинных символов независимых узлов сетки.

[0020] На этапе (203) формируют в базе данных периодических сеток таблицу, в которой хранится информация о различных типах атомов и список предпочитаемых координационных числах атомов, определенных на основе имеющейся экспериментальной информации по строению химических соединений.

[0021] На этапе (204) формируют на основе базы данных периодических сеток базу данных производных периодических сеток следующим образом:

выбирают подгруппу Gsub, соответствующую пространственной группе симметрии G исходной периодической сетки и генерируют новую периодическую сетку, имеющую более низкую симметрию Gsub; позиции узлов новой сетки совпадают с позициями узлов исходной сетки, однако в узлы новой сетки, ставшие неэквивалентными вследствие понижения симметрии, помещают атомы разных типов

[0022] На этапе (205) записывают в базу данных производных периодических сеток данные новой сетки, характеризующие:

максимальную симметрию для новой сетки, список позиций симметрично независимых атомов, а именно узлов сетки, и список симметрично независимых связей, ребер сетки.

Пусть n - количество независимых атомных позиций, N1, N2, … Nn - количества атомных позиций в ячейке полученных после применения операций симметрии к каждой независимой позиции. Если необходимо сгенерировать структуру для соединения Mg4Al8O16, нужно взять те записи в базе данных, для которых выполняется условие: Ni1+Ni2+… = 4, Nj1+Nj2+… = 8, Nk1+Nk2+… = 16, так чтобы все неэквивалентные типы узлов были использованы. При необходимости можно наложить дополнительные условия, согласно которым атомы должны иметь типичные координационные числа (КЧ) и фигуры (КФ), содержащиеся в топологической базе данных; например, для Mg или Al КЧ=4 (КФ – тетраэдр) или КЧ=6 (КФ – октаэдр), для O КЧ=2 (КФ – гантель) или КЧ=3 (КФ – треугольник или треугольная пирамида) или КЧ=4 (КФ – тетраэдр).

[0023] Было проведено два типа тестов:

1) Сравнение стандартного эволюционного глобального поиска с использованием заявленного решения и такого же поиска без использования заявленного решения.

2) Простое сравнение известного из уровня техники решения (2) и заявленного решения.

Эволюционный поиск является вычислительно дорогим, поэтому он был проведен только для одной системы Mg4Al8O16, c использованием эмпирического силового поля.

Простое сравнение сделано для трех систем: Ca4F8, Cu4In4S8, Mg4Al8O16. (первые две системы с использованием ab initio, последняя с использованием силового поля).

Сравнение эволюционных поисков дает следующие результаты (средний номер поколения в котором найдено основное состояние, средний номер структуры (стандартное отклонение номера структуры)):

Симметрический Рандом 22, 1069(700)

Топологический Рандом 8, 368(247)

Простое сравнение дает следующие результаты:

На фиг. 3 изображена статистика для Mg4Al8O16. Нормированное распределение структур, сгенерированных топологическим (TR) и симметрическим генератором по локально оптимизированным энергиям.

Общее число структур для TR – 8990, а для SR – 21200.

[0024] Результаты для Ca4F8 изображены на фиг. 4:

a) не нормированное распределение по энергиям структур сгенерированных топологическим (TR-USPEX) и симметричным (SR-USPEX) генераторами. Общее число структур для TR-USPEX – 475 и для SR-USPEX – 500;

b) не нормированное распределение по энергиям структур сгенерированных "методом big data" (BDM-Calypso) и симметричным генератором (SR-Calypso).

Общее число структур для BDM-Calypso и SR-Calypso – 58 каждое.

[0025] Результаты для Cu4In4S8 изображены на фиг. 5:

a) не нормированное распределение по энергиям структур сгенерированных топологическим (TR-USPEX) и симметричным (SR-USPEX) генераторами. Общее число структур для TR-USPEX – 2842 и для SR-USPEX – 3000;

b) не нормированное распределение по энергиям структур сгенерированных "методом big data" (BDM-Calypso) и симметричным генератором (SR-Calypso).

Общее число структур для BDM-Calypso и SR-Calypso – 106 каждое.

[0026] Из проведенного сравнения хорошо видно, что заявленное решение дает существенно лучшие результаты, чем известное решение (2), и не обладает таким ограничением по числу генерированных структур как известное решение (3).

[0027] Данное изобретение в различных своих вариантах осуществления выполнено в виде способа, реализуемого на компьютере.

[0028] На Фиг.6 далее будет представлена общая схема компьютерного устройства (600), обеспечивающего обработку данных, необходимую для реализации заявленного решения.

[0029] В общем случае устройство (600) содержит такие компоненты, как: один или более процессоров (601), по меньшей мере одну память (602), средство хранения данных (603), интерфейсы ввода/вывода (604), средство В/В (605), средства сетевого взаимодействия (606).

[0030] Процессор (601) устройства выполняет основные вычислительные операции, необходимые для функционирования устройства (600) или функционала одного или более его компонентов. Процессор (601) исполняет необходимые машиночитаемые команды, содержащиеся в оперативной памяти (602).

[0031] Память (602), как правило, выполнена в виде ОЗУ и содержит необходимую программную логику, обеспечивающую требуемый функционал.

[0032] Средство хранения данных (603) может выполняться в виде HDD, SSD дисков, рейд массива, сетевого хранилища, флэш-памяти, оптических накопителей информации (CD, DVD, MD, Blue-Ray дисков) и т.п.

[0033] Интерфейсы (604) представляют собой стандартные средства для подключения и работы с удаленными устройствами, например, USB, RS232, RJ45, LPT, COM, HDMI, PS/2, Lightning, FireWire и т.п.

[0034] Выбор интерфейсов (604) зависит от конкретного исполнения устройства (600), которое может представлять собой персональный компьютер, мейнфрейм, серверный кластер, тонкий клиент, смартфон, ноутбук и т.п.

[0035] В качестве средств В/В данных (605) может использоваться: клавиатура, джойстик, дисплей (сенсорный дисплей), проектор, тачпад, манипулятор мышь, трекбол, световое перо, динамики, микрофон и т.п.

[0036] Средства сетевого взаимодействия (606) выбираются из устройства, обеспечивающий сетевой прием и передачу данных, например, Ethernet карту, WLAN/Wi-Fi модуль, Bluetooth модуль, BLE модуль, NFC модуль, IrDa, RFID модуль, GSM модем и т.п. С помощью средств (305) обеспечивается организация обмена данными по проводному или беспроводному каналу передачи данных, например, WAN, PAN, ЛВС (LAN), Интранет, Интернет, WLAN, WMAN или GSM.

[0037] Компоненты устройства (600) сопряжены посредством общей шины передачи данных (610).

[0037] В настоящих материалах заявки было представлено предпочтительное раскрытие осуществление заявленного технического решения, которое не должно использоваться как ограничивающее иные, частные воплощения его реализации, которые не выходят за рамки испрашиваемого объема правовой охраны и являются очевидными для специалистов в соответствующей области техники.

1. Компьютерно-реализуемый способ генерации кристаллической структуры химического соединения, использующий базу данных периодических сеток, содержащий этапы, на которых:

формируют базу данных периодических сеток, содержащую информацию о группах симметрии, которые описывают максимально возможные симметрии структур сеток и информацию о структурной связности сеток; сетки, входящие в базу данных, получают несколькими способами:

импортированием данных из известных баз данных периодических сеток;

упрощением известных структур химических веществ путем замены в них структурных единиц на узлы упрощенной сетки, совпадающие с центрами тяжести структурных единиц, и последующим удалением 0-, 1- и 2-координированных узлов упрощенной сетки;

генерацией подсеток и надсеток из имеющихся периодических сеток путем удаления из них или добавления в них новых ребер;

классифицируют периодические сетки по топологическим типам, определяемым уникальными наборами топологических индексов, в части координационных последовательностей, точечных и вершинных символов независимых узлов сетки;

формируют в базе данных периодических сеток таблицу, в которой хранится информация о различных типах атомов и список предпочитаемых координационных чисел атомов, определенных на основе имеющейся экспериментальной информации по строению химических соединений;

формируют на основе базы данных периодических сеток базу данных производных периодических сеток следующим образом:

выбирают подгруппу Gsub, соответствующую пространственной группе симметрии G исходной периодической сетки и генерируют новую периодическую сетку, имеющую более низкую симметрию Gsub, при условии, что позиции узлов новой сетки совпадают с позициями узлов исходной сетки, однако в узлы новой сетки, ставшие неэквивалентными вследствие понижения симметрии, помещают атомы разных типов;

записывают в базу данных производных периодических сеток данные новой сетки, характеризующие:

максимальную симметрию для новой сетки, список позиций симметрично независимых атомов, а именно узлов сетки, и список симметрично независимых связей, ребер сетки.

2. Способ по п. 1, отличающийся тем, что в узлы новой сетки помещают атомы разных типов на основе координационных чисел и геометрии окружения.



 

Похожие патенты:
Наверх