Прогнозирование теплоемкости химических соединений методами qspr

Выполнено моделирование теплоемкости одноатомных спиртов с использованием дескрипторов, генерируемых программой Dragon. Качество прогнозирования характеризуется коэффициентом корреляции R= 0,9979 и стандартным отклонением s= 3,35. Сделана оценка значений теплоемкости для 79 веществ, не исследованных экспериментально.

Одним из фундаментальных свойств вещества является теплоемкость - физическая величина, определяющая отношение бесконечно малого количества теплоты δQ, полученного телом, к соответствующему приращению его температуры dT. Различают теплоемкость системы в целом (Дж/К), удельную теплоемкость [Дж/(г·К)], молярную теплоемкость [Дж/(моль·К)]. Упрощенно теплоемкость часто определяют как количество теплоты, затрачиваемое для изменения температуры на 1 °С.

Данные о теплоемкости необходимы для расчетов энергетических балансов процессов в химических реакторах, для выбора оптимальных теплоносителей. Экспериментальное определение теплоемкости в широком диапазоне от низких до высоких температур является основой для вычисления термодинамических свойств веществ. Информация о теплоемкости реактантов в диапазоне температур дает возможность расчёта теплового эффекта химической реакции. Велика роль теплоемкости в структурных исследованиях веществ и систем, поскольку она чувствительна к структурным, конфигурационным изменениям в объекте. Теоретический расчет теплоемкости осуществляется методами статистической термодинамики, но он дает приемлемую точность лишь для сравнительно простых молекул. Экспериментальные измерения теплоемкости осуществляются относительно дорогостоящими и затратными методами, поэтому развиваются методы QSAR/QSPR, устанавливающие корреляцию теплоемкости с различными дескрипторами молекулярной структуры [1-7].

На основе комбинированного использования искусственных нейронных сетей и фрагментных дескрипторов Зефировым и сотр. осуществлено прогнозирование теплоемкости органических соединений различных классов [1]. Для набора из 189 кислородсодержащих соединений получена модель с R2 = 0,9751 и s = 16,3.

Рен и Ху при моделировании теплоемкости олефинов достигли значения R = 0,99 [2].

Авторы [3] разработали нейросетевые модели теплоемкости полярных ароматических соединений. Модель всего набора из 116 веществ характеризовалась R=0,9859 и s=3,017. Для тренировочной выборки из 74 веществ R=0,9915, s= 2,163, для контрольной выборки (21 вещество) R=0,9841, s=4,262. Для внешнего испытательного набора из 21 веществаR=0,9761, s= 4,755. В работах Иванчук и др. различные модели для набора алканов характеризовались R = 0,987,s = 4,10 [4] иR = 0.9883, s = 3,92 [5].

Модели теплоемкости кислородсодержащих гетероциклов, построенные с использованием 1-3 D дескрипторов имели значения R2 = 0.847 - 0.998[6]. В недавней работе [7] c использованием алгоритма генетического отбора и адаптивных нейросетей на наборе из 706 соединений получены модели с максимальным значением R2 = 0,973.

Наше исследование было направлено на определение применимости дескрипторов, продуцируемых программой Dragon 5.5, к QSPR – прогнозированию стандартных значений изобарной теплоемкости Cp органических соединений (жидкая фаза) на примере одноатомных предельных спиртов.

Dragon 5.5 предлагает 3224 молекулярных дескриптора, которые разделены на 22 логических блока: constitutional descriptors (48), topological descriptors (119), walk and path counts (47), connectivity indices (33), information indices (47), 2D autocorrelations (96), edge adjacency indices (107), Burden eigenvalue descriptors (64), topological charge indices (21), Randic molecular profiles (44), geometrical descriptors (74), RDF descriptors (150), 3D-MoRSE descriptors (160), WHIM descriptors (99), GETAWAY descriptors (197), functional group counts (154), atom-centred fragments (120), charge descriptors (14), molecular properties (29), 2D binary fingerprints (780), 2D frequency fingerprints (780).

Все расчеты выполнены с помощью разработанной нами [8] компьютерной программы PROGROC (PROGgram RObustness Calculation), перед вычислениями дескрипторы в столбцах матрицы подвергались нормированию и центрированию для уменьшения размаха значений.

Основным источником экспериментальных значений теплоемкости послужил справочник [9], содержащий наибольшее число данных.

Построение пробных моделей выявило значительные ошибки прогнозирования для изопропанола, бутанола-2, 2-метил-пропанола-1, н- бутанола. Для этих соединений значения теплоемкости были взяты из базы NIST [10], которой следует отдать больший приоритет. Этот факт демонстрирует потенциальные возможности не только прогнозирования, но и редактирования справочных данных методами QSPR. Окончательно для моделирования было отобрано 156 веществ, 106 из которых входили в тренировочную выборку и 50 - в контрольную.

На рисунке 1 изображена зависимость между расчетными и экспериментальными значениями теплоемкости для всего набора веществ.

Статистические показатели соответствующих корреляционных зависимостей приведены в таблице 1.

Таблица 1 - Показатели корреляции между экспериментальными и вычисленными значениями изобарной теплоемкости спиртов

Показатели

Весь набор

Тренировочная

Контрольная

корреляции

 

выборка

выборка

R

0,9979

0,9989

0,9945

s

3,35

2,51

4,61

Проверка качества корреляционных моделей в QSAR/QSPR – исследованиях иногда осуществляется путем «перекрестной проверки» - leave-one-out или скользящего контроля. Из исследуемого набора поочередно извлекается каждое вещество, модель строится по оставшимся веществам, затем выполняется оценка свойства удаленного вещества.

Для улучшения качества прогнозирования свойств веществ, в том числе и неисследованных, нами предложен прием, суть состоит в контролировании качества прогнозирования спарринг-свойства при его одновременном прогнозировании с целевым свойством. В качестве спарринг-партнера удобнее всего использовать молекулярную массу. Алгоритм решения будет заключаться в поиске условий (веществ тренировочной выборки, ранга матрицы дескрипторов и др.), при которых достигается наиболее точное значение спарринг – партнера. Результаты прогнозирования в режиме скользящего контроля по спарринг – свойству приведены на рисунке 2.

Рисунку 2 соответствуют такие статистические параметры, как R= 0,9903 и s= 7,06. Достигнутое качество прогнозирования на модельных объектах сопоставимо с результатами простого моделирования по литературным данным. Можно предположить, что оценка значений теплоемкости неисследованных веществ будет иметь подобные

155

статистические параметры. В таблице 2 приведены оценочные значения теплоемкости 79 неисследованных веществ.

156

Соединение

CAS

M

W

Cp (расч.)

(R)-2-Hexanol

26549-24-6

102

.2

258.8

DL-2-Hexanol

20281-86-1

102

.2

258.8

Threo-3 -methyl-2-pentanol

1502-93-8

102

.2

271.3

2,3,3-trimethyl-2-butanol

594-83-2

116

.2

257.4

1-Heptanol

53535-33-4

116

.2

276.5

(S)-4-methyl-1-hexanol

1767-46-0

116

.2

296.2

(R)-2-Heptanol

6033-24-5

116

.2

297.0

(S)-2-Heptanol

6033-23-4

116

.2

297.0

(S)-2-Octanol

6169-06-8

130

.3

329.4

(R)-2-Octanol

5978-70-1

130

.3

329.4

2-Octanol

4128-31-8

130

.3

329.4

3-Octanol

20296-29-1

130

.3

333.4

(S)-4-octanol

90365-63-2

130

.3

337.8

2,2,4,4-tetramethyl-3-pentanol

14609-79-1

144

.3

323.3

2,4-dimethyl-3 -heptanol

19549-72-5

144

.3

340.0

2,5-dimethyl2-heptanol

1561-18-8

144

.3

344.1

5 -ethyl -2 -heptanol

19780-40-6

144

.3

344.6

1-Nonanol

28473-21-4

144

.3

346.7

3 -ethyl -4 -heptanol

19780-42-8

144

.3

347.1

2-methyl-2-propyl-1-pentanol

57409-52-6

144

.3

352.7

7 -methyl -1 -octanol

2430-22-0

144

.3

356.4

(6S)-6-methyl-1-octanol

110453-78-6

144

.3

357.3

3-Nonanol

624-51-1

144

.3

362.3

(S)-4-Nonanol

52708-03-9

144

.3

362.9

3,4-diethyl-3-hexanol

19398-78-8

158

.3

343.8

2,2,5,5-tetramethyl-3-hexanol

55073-86-4

158

.3

358.2

1-Decanol

36729-58-5

158

.3

366.9

Соединение

CAS

M

W

Cp (расч.)

3,7 -dimethyl -3 -octanol

57706-88-4

158

.3

373.7

3 -ethyl-4-methyl-3 -heptanol

66719-39-9

158

.3

376.3

4-ethyl-3-octanol

19781-26-1

158

.3

376.4

(2R)-2-isopropyl-5-methyl-1 -hexanol

41884-28-0

158

.3

376.9

4-ethyl-2-octanol

19780-78-0

158

.3

378.8

2,7-dimethyl-1-octanol

15250-22-3

158

.3

379.5

(S)-3,7-dimethyl -1 -octanol

68680-98-8

158

.3

381.7

3,7 -dimethyl -1 -octanol

59204-02-3

158

.3

381.7

(R)-3,7-dimethyl -1 -octanol

1117-60-8

158

.3

381.7

2-methyl-2-decanol

3396-02-9

172

.4

377.1

1-Undecanol

112-42-5

172

.4

382.3

3-Undecanol

6929-08-4

172

.4

386.1

2-methyl-1 -decanol

18675-24-6

172

.4

388.5

9-methyl-1 -decanol

55505-28-7

172

.4

391.4

2-methyl-3-decanol

83909-79-9

172

.4

393.3

4-ethyl-2,6-dimethyl-4-heptanol

54460-99-0

172

.4

394.1

4,8-dimethyl-1-nonanol

33933-80-1

172

.4

395.2

2-ethyl-2-propyl-1 -hexanol

54461-00-6

172

.4

395.9

6-Undecanol

23708-56-7

172

.4

396.3

4-Undecanol

4272-06-4

172

.4

397.7

3-methyl-4-decanol

55816-17-6

172

.4

398.3

5-Undecanol

37493-70-2

172

.4

401.6

2-nonanol, 5-ethyl-

103-08-2

172

.4

410.6

5 -ethyl-4-nonanol

19780-73-5

172

.4

411.3

5 -ethyl-3 -nonanol

19780-71-3

172

.4

421.2

2-Dodecanol

10203-28-8

186

.4

389.6

1-Dodecanol

112-53-8

186

.4

396.1

Соединение

CAS

M

W

Cp (расч.)

2-methyl-1-undecanol

10522-26-6

186

.4

396.6

3-Dodecanol

10203-30-2

186

.4

398.5

2-ethyl-1-decanol

21078-65-9

186

.4

401.4

4-Dodecanol

10203-32-4

186

.4

403.2

2,2-dimethyl-1-decanol

2370-15-2

186

.4

405.1

2-methyl-5 -undecanol

33978-71-1

186

.4

409.1

5-Dodecanol

10203-33-5

186

.4

411.9

2,6-dimethyl-4-(1 -methylethyl)-4-heptanol

54775-01-8

186

.4

412.3

6-Dodecanol

6836-38-0

186

.4

412.6

2,6,8-trimethyl-4-nonanol

123-17-1

186

.4

416.6

2-butyl-1-octanol

3913-02-8

186

.4

421.6

6-ethyl-3-decanol

19780-31-5

186

.4

436.2

Полученные результаты свидетельствуют о высокой информационной емкости дескрипторов программы Dragon 5.5, позволяющих строить модели теплоемкости органических соединений с высокими статистическими данными.

Использование метода скользящего контроля со спарринг-партнером (молекулярная масса), дает возможность оценки значений теплоемкости, не измеренных в эксперименте, с точностью, сопоставимой с разбросом данных, полученных из разных источников.

 

ЛИТЕРАТУРА

  1. Ivanova A.A., Palyulin V.A., Zefirov A.N., Zefirov N.S. Fragment Descriptors in QSPR: Application to Heat Capacity Calculation // Russian Journal of Organic Chemistry - 2004. - Vol. 40. - № 5. - P. 644-649.
  2. Ren B., Xu Y. A novel topological index for QSPR/QSAR study of organic compounds // Acta Chimica Sinica - 1999. - Vol.57. - № 6. - P. 563-571.
  3. Habibi-Yangjeh A., Esmailian M. Prediction partial molar heat capacity at infinite dilution for aqueous solutions of various polar aromatic compounds over a wide range of conditions using artificial neural networks // Bull. Korean Chem. Soc. - 2007. - Vol. 28.- № 9. - P. 1477.
  4. Ivanciuc O., Ivanciuc T., Cabrol-Bass D., Balaban A.T. Optimum Structural Descriptors Derived from the Ivanciuc-Balaban Operator // Internet Electronic Journal of Molecular Design - 2002. - Vol. 1. -№ 6, - P. 319-331.
  5. Ivanciuc O., Ivanciuc T., Balaban A. T. Quantitative Structure-Property Relationship evaluation of structural descriptors derived from the distance and reverse wiener matrices // Internet Electronic Journal of Molecular Design - 2002. - Vol. 1.- № 9. - P. 467-487.
  6. Adams N., Clauss J., Meunier M., Schubert U.S. Predicting thermochemical parameters of oxygen-containing heterocycles using simple QSPR models // Molecular Simulation - 2006. - Vol. 32.- № 2. - P. 125-134.
  7. Khajeh A., Modarress H. Quantitative Structure-Property Relationship Prediction of Liquid Heat Capacity at 298.15 K for Organic Compounds // Ind. Eng. Chem. Res. - 2012.-Vol. 51. -P. 6251-6255.
  8. Важев В.В. Использование ИК - и масс-спектров в QSAR/QSPR - исследованиях. - Костанай: Изд-во КГУ, 2003. - 114 с.
  9. YawsC.L. Yaws' Handbook of Thermodynamic and Physical Properties of Chemical Compounds // Ed. Carl L. Yaws New York: Norwich. - 2003. - 779 p.
  10. NIST Chemistry WebBook. NIST Standard Reference Database Number 69 - November 1998 Release. http: // webbook.nist.gov/chemistry/
Год: 2012
Город: Костанай