Выполнено моделирование теплоемкости одноатомных спиртов с использованием дескрипторов, генерируемых программой Dragon. Качество прогнозирования характеризуется коэффициентом корреляции R= 0,9979 и стандартным отклонением s= 3,35. Сделана оценка значений теплоемкости для 79 веществ, не исследованных экспериментально.
Одним из фундаментальных свойств вещества является теплоемкость - физическая величина, определяющая отношение бесконечно малого количества теплоты δQ, полученного телом, к соответствующему приращению его температуры dT. Различают теплоемкость системы в целом (Дж/К), удельную теплоемкость [Дж/(г·К)], молярную теплоемкость [Дж/(моль·К)]. Упрощенно теплоемкость часто определяют как количество теплоты, затрачиваемое для изменения температуры на 1 °С.
Данные о теплоемкости необходимы для расчетов энергетических балансов процессов в химических реакторах, для выбора оптимальных теплоносителей. Экспериментальное определение теплоемкости в широком диапазоне от низких до высоких температур является основой для вычисления термодинамических свойств веществ. Информация о теплоемкости реактантов в диапазоне температур дает возможность расчёта теплового эффекта химической реакции. Велика роль теплоемкости в структурных исследованиях веществ и систем, поскольку она чувствительна к структурным, конфигурационным изменениям в объекте. Теоретический расчет теплоемкости осуществляется методами статистической термодинамики, но он дает приемлемую точность лишь для сравнительно простых молекул. Экспериментальные измерения теплоемкости осуществляются относительно дорогостоящими и затратными методами, поэтому развиваются методы QSAR/QSPR, устанавливающие корреляцию теплоемкости с различными дескрипторами молекулярной структуры [1-7].
На основе комбинированного использования искусственных нейронных сетей и фрагментных дескрипторов Зефировым и сотр. осуществлено прогнозирование теплоемкости органических соединений различных классов [1]. Для набора из 189 кислородсодержащих соединений получена модель с R2 = 0,9751 и s = 16,3.
Рен и Ху при моделировании теплоемкости олефинов достигли значения R = 0,99 [2].
Авторы [3] разработали нейросетевые модели теплоемкости полярных ароматических соединений. Модель всего набора из 116 веществ характеризовалась R=0,9859 и s=3,017. Для тренировочной выборки из 74 веществ R=0,9915, s= 2,163, для контрольной выборки (21 вещество) R=0,9841, s=4,262. Для внешнего испытательного набора из 21 веществаR=0,9761, s= 4,755. В работах Иванчук и др. различные модели для набора алканов характеризовались R = 0,987,s = 4,10 [4] иR = 0.9883, s = 3,92 [5].
Модели теплоемкости кислородсодержащих гетероциклов, построенные с использованием 1-3 D дескрипторов имели значения R2 = 0.847 - 0.998[6]. В недавней работе [7] c использованием алгоритма генетического отбора и адаптивных нейросетей на наборе из 706 соединений получены модели с максимальным значением R2 = 0,973.
Наше исследование было направлено на определение применимости дескрипторов, продуцируемых программой Dragon 5.5, к QSPR – прогнозированию стандартных значений изобарной теплоемкости Cp органических соединений (жидкая фаза) на примере одноатомных предельных спиртов.
Dragon 5.5 предлагает 3224 молекулярных дескриптора, которые разделены на 22 логических блока: constitutional descriptors (48), topological descriptors (119), walk and path counts (47), connectivity indices (33), information indices (47), 2D autocorrelations (96), edge adjacency indices (107), Burden eigenvalue descriptors (64), topological charge indices (21), Randic molecular profiles (44), geometrical descriptors (74), RDF descriptors (150), 3D-MoRSE descriptors (160), WHIM descriptors (99), GETAWAY descriptors (197), functional group counts (154), atom-centred fragments (120), charge descriptors (14), molecular properties (29), 2D binary fingerprints (780), 2D frequency fingerprints (780).
Все расчеты выполнены с помощью разработанной нами [8] компьютерной программы PROGROC (PROGgram RObustness Calculation), перед вычислениями дескрипторы в столбцах матрицы подвергались нормированию и центрированию для уменьшения размаха значений.
Основным источником экспериментальных значений теплоемкости послужил справочник [9], содержащий наибольшее число данных.
Построение пробных моделей выявило значительные ошибки прогнозирования для изопропанола, бутанола-2, 2-метил-пропанола-1, н- бутанола. Для этих соединений значения теплоемкости были взяты из базы NIST [10], которой следует отдать больший приоритет. Этот факт демонстрирует потенциальные возможности не только прогнозирования, но и редактирования справочных данных методами QSPR. Окончательно для моделирования было отобрано 156 веществ, 106 из которых входили в тренировочную выборку и 50 - в контрольную.
На рисунке 1 изображена зависимость между расчетными и экспериментальными значениями теплоемкости для всего набора веществ.
Статистические показатели соответствующих корреляционных зависимостей приведены в таблице 1.
Таблица 1 - Показатели корреляции между экспериментальными и вычисленными значениями изобарной теплоемкости спиртов
Показатели |
Весь набор |
Тренировочная |
Контрольная |
корреляции |
выборка |
выборка |
|
R |
0,9979 |
0,9989 |
0,9945 |
s |
3,35 |
2,51 |
4,61 |
Проверка качества корреляционных моделей в QSAR/QSPR – исследованиях иногда осуществляется путем «перекрестной проверки» - leave-one-out или скользящего контроля. Из исследуемого набора поочередно извлекается каждое вещество, модель строится по оставшимся веществам, затем выполняется оценка свойства удаленного вещества.
Для улучшения качества прогнозирования свойств веществ, в том числе и неисследованных, нами предложен прием, суть состоит в контролировании качества прогнозирования спарринг-свойства при его одновременном прогнозировании с целевым свойством. В качестве спарринг-партнера удобнее всего использовать молекулярную массу. Алгоритм решения будет заключаться в поиске условий (веществ тренировочной выборки, ранга матрицы дескрипторов и др.), при которых достигается наиболее точное значение спарринг – партнера. Результаты прогнозирования в режиме скользящего контроля по спарринг – свойству приведены на рисунке 2.
Рисунку 2 соответствуют такие статистические параметры, как R= 0,9903 и s= 7,06. Достигнутое качество прогнозирования на модельных объектах сопоставимо с результатами простого моделирования по литературным данным. Можно предположить, что оценка значений теплоемкости неисследованных веществ будет иметь подобные
155
статистические параметры. В таблице 2 приведены оценочные значения теплоемкости 79 неисследованных веществ.
156
Соединение |
CAS |
M W |
Cp (расч.) |
(R)-2-Hexanol |
26549-24-6 |
102 .2 |
258.8 |
DL-2-Hexanol |
20281-86-1 |
102 .2 |
258.8 |
Threo-3 -methyl-2-pentanol |
1502-93-8 |
102 .2 |
271.3 |
2,3,3-trimethyl-2-butanol |
594-83-2 |
116 .2 |
257.4 |
1-Heptanol |
53535-33-4 |
116 .2 |
276.5 |
(S)-4-methyl-1-hexanol |
1767-46-0 |
116 .2 |
296.2 |
(R)-2-Heptanol |
6033-24-5 |
116 .2 |
297.0 |
(S)-2-Heptanol |
6033-23-4 |
116 .2 |
297.0 |
(S)-2-Octanol |
6169-06-8 |
130 .3 |
329.4 |
(R)-2-Octanol |
5978-70-1 |
130 .3 |
329.4 |
2-Octanol |
4128-31-8 |
130 .3 |
329.4 |
3-Octanol |
20296-29-1 |
130 .3 |
333.4 |
(S)-4-octanol |
90365-63-2 |
130 .3 |
337.8 |
2,2,4,4-tetramethyl-3-pentanol |
14609-79-1 |
144 .3 |
323.3 |
2,4-dimethyl-3 -heptanol |
19549-72-5 |
144 .3 |
340.0 |
2,5-dimethyl2-heptanol |
1561-18-8 |
144 .3 |
344.1 |
5 -ethyl -2 -heptanol |
19780-40-6 |
144 .3 |
344.6 |
1-Nonanol |
28473-21-4 |
144 .3 |
346.7 |
3 -ethyl -4 -heptanol |
19780-42-8 |
144 .3 |
347.1 |
2-methyl-2-propyl-1-pentanol |
57409-52-6 |
144 .3 |
352.7 |
7 -methyl -1 -octanol |
2430-22-0 |
144 .3 |
356.4 |
(6S)-6-methyl-1-octanol |
110453-78-6 |
144 .3 |
357.3 |
3-Nonanol |
624-51-1 |
144 .3 |
362.3 |
(S)-4-Nonanol |
52708-03-9 |
144 .3 |
362.9 |
3,4-diethyl-3-hexanol |
19398-78-8 |
158 .3 |
343.8 |
2,2,5,5-tetramethyl-3-hexanol |
55073-86-4 |
158 .3 |
358.2 |
1-Decanol |
36729-58-5 |
158 .3 |
366.9 |
Соединение |
CAS |
M W |
Cp (расч.) |
3,7 -dimethyl -3 -octanol |
57706-88-4 |
158 .3 |
373.7 |
3 -ethyl-4-methyl-3 -heptanol |
66719-39-9 |
158 .3 |
376.3 |
4-ethyl-3-octanol |
19781-26-1 |
158 .3 |
376.4 |
(2R)-2-isopropyl-5-methyl-1 -hexanol |
41884-28-0 |
158 .3 |
376.9 |
4-ethyl-2-octanol |
19780-78-0 |
158 .3 |
378.8 |
2,7-dimethyl-1-octanol |
15250-22-3 |
158 .3 |
379.5 |
(S)-3,7-dimethyl -1 -octanol |
68680-98-8 |
158 .3 |
381.7 |
3,7 -dimethyl -1 -octanol |
59204-02-3 |
158 .3 |
381.7 |
(R)-3,7-dimethyl -1 -octanol |
1117-60-8 |
158 .3 |
381.7 |
2-methyl-2-decanol |
3396-02-9 |
172 .4 |
377.1 |
1-Undecanol |
112-42-5 |
172 .4 |
382.3 |
3-Undecanol |
6929-08-4 |
172 .4 |
386.1 |
2-methyl-1 -decanol |
18675-24-6 |
172 .4 |
388.5 |
9-methyl-1 -decanol |
55505-28-7 |
172 .4 |
391.4 |
2-methyl-3-decanol |
83909-79-9 |
172 .4 |
393.3 |
4-ethyl-2,6-dimethyl-4-heptanol |
54460-99-0 |
172 .4 |
394.1 |
4,8-dimethyl-1-nonanol |
33933-80-1 |
172 .4 |
395.2 |
2-ethyl-2-propyl-1 -hexanol |
54461-00-6 |
172 .4 |
395.9 |
6-Undecanol |
23708-56-7 |
172 .4 |
396.3 |
4-Undecanol |
4272-06-4 |
172 .4 |
397.7 |
3-methyl-4-decanol |
55816-17-6 |
172 .4 |
398.3 |
5-Undecanol |
37493-70-2 |
172 .4 |
401.6 |
2-nonanol, 5-ethyl- |
103-08-2 |
172 .4 |
410.6 |
5 -ethyl-4-nonanol |
19780-73-5 |
172 .4 |
411.3 |
5 -ethyl-3 -nonanol |
19780-71-3 |
172 .4 |
421.2 |
2-Dodecanol |
10203-28-8 |
186 .4 |
389.6 |
1-Dodecanol |
112-53-8 |
186 .4 |
396.1 |
Соединение |
CAS |
M W |
Cp (расч.) |
2-methyl-1-undecanol |
10522-26-6 |
186 .4 |
396.6 |
3-Dodecanol |
10203-30-2 |
186 .4 |
398.5 |
2-ethyl-1-decanol |
21078-65-9 |
186 .4 |
401.4 |
4-Dodecanol |
10203-32-4 |
186 .4 |
403.2 |
2,2-dimethyl-1-decanol |
2370-15-2 |
186 .4 |
405.1 |
2-methyl-5 -undecanol |
33978-71-1 |
186 .4 |
409.1 |
5-Dodecanol |
10203-33-5 |
186 .4 |
411.9 |
2,6-dimethyl-4-(1 -methylethyl)-4-heptanol |
54775-01-8 |
186 .4 |
412.3 |
6-Dodecanol |
6836-38-0 |
186 .4 |
412.6 |
2,6,8-trimethyl-4-nonanol |
123-17-1 |
186 .4 |
416.6 |
2-butyl-1-octanol |
3913-02-8 |
186 .4 |
421.6 |
6-ethyl-3-decanol |
19780-31-5 |
186 .4 |
436.2 |
Полученные результаты свидетельствуют о высокой информационной емкости дескрипторов программы Dragon 5.5, позволяющих строить модели теплоемкости органических соединений с высокими статистическими данными.
Использование метода скользящего контроля со спарринг-партнером (молекулярная масса), дает возможность оценки значений теплоемкости, не измеренных в эксперименте, с точностью, сопоставимой с разбросом данных, полученных из разных источников.
ЛИТЕРАТУРА
- Ivanova A.A., Palyulin V.A., Zefirov A.N., Zefirov N.S. Fragment Descriptors in QSPR: Application to Heat Capacity Calculation // Russian Journal of Organic Chemistry - 2004. - Vol. 40. - № 5. - P. 644-649.
- Ren B., Xu Y. A novel topological index for QSPR/QSAR study of organic compounds // Acta Chimica Sinica - 1999. - Vol.57. - № 6. - P. 563-571.
- Habibi-Yangjeh A., Esmailian M. Prediction partial molar heat capacity at infinite dilution for aqueous solutions of various polar aromatic compounds over a wide range of conditions using artificial neural networks // Bull. Korean Chem. Soc. - 2007. - Vol. 28.- № 9. - P. 1477.
- Ivanciuc O., Ivanciuc T., Cabrol-Bass D., Balaban A.T. Optimum Structural Descriptors Derived from the Ivanciuc-Balaban Operator // Internet Electronic Journal of Molecular Design - 2002. - Vol. 1. -№ 6, - P. 319-331.
- Ivanciuc O., Ivanciuc T., Balaban A. T. Quantitative Structure-Property Relationship evaluation of structural descriptors derived from the distance and reverse wiener matrices // Internet Electronic Journal of Molecular Design - 2002. - Vol. 1.- № 9. - P. 467-487.
- Adams N., Clauss J., Meunier M., Schubert U.S. Predicting thermochemical parameters of oxygen-containing heterocycles using simple QSPR models // Molecular Simulation - 2006. - Vol. 32.- № 2. - P. 125-134.
- Khajeh A., Modarress H. Quantitative Structure-Property Relationship Prediction of Liquid Heat Capacity at 298.15 K for Organic Compounds // Ind. Eng. Chem. Res. - 2012.-Vol. 51. -P. 6251-6255.
- Важев В.В. Использование ИК - и масс-спектров в QSAR/QSPR - исследованиях. - Костанай: Изд-во КГУ, 2003. - 114 с.
- YawsC.L. Yaws' Handbook of Thermodynamic and Physical Properties of Chemical Compounds // Ed. Carl L. Yaws New York: Norwich. - 2003. - 779 p.
- NIST Chemistry WebBook. NIST Standard Reference Database Number 69 - November 1998 Release. http: // webbook.nist.gov/chemistry/