Использование масс-спектров для прогнозирования температуры кипения алкенов

Исследована возможность использования масс-спектров как дескрипторов молекулярной структуры при прогнозировании температуры кипения некоторых алкенов. Качество прогнозирования, для набора из 116 соединений, характеризуется коэффициентом корреляции 0.9994 и стандартным отклонением 1.70 К.

Развитие методов прогнозирования физико-химических свойств органических соединений путем установления их корреляций с дескрипторами структуры молекул (QSPR- исследования) является одним из приоритетных направлений современной химии. Прогнозирование позволяет заменить экспериментальное изучение расчетом, а также оценить целевые свойства еще не синтезированных веществ. Вследствие технологической значимости температуры кипения (ТК) вещества и наличия обширных экспериментальных данных, необходимых для формирования обучающих выборок, именно это свойство чаще всего прогнозируется и моделируется. В литературе описано множество QSPR - моделей как для наборов веществ отдельных классов соединений, так и для смешанных наборов различных классов. В то же время прогнозированию ТК алкенов (олефинов) - основных исходных реагентов в химической промышленности - посвящено всего несколько статей. Основной причиной такого положения, на наш взгляд, является наличие диастереомерии у алкенов, значительно осложняющее прогнозирование. Наряду с изомерией углеродного скелета и различием в положении двойной связи возможна геометрическая (цис-, транс-) изомерия, обусловленная большим барьером вращения вокруг двойной связи. Обычно применяемые в качестве дескрипторов структуры топологические индексы, как следует из самого определения, не отражают стереохимической информации и вынуждают применять дополнительно дескрипторы иной природы.

В данной работе представлены результаты использования масс- спектров низкого разрешения в качестве дескрипторов молекулярной структуры алкенов для прогнозирования ТК. Ранее масс-спектры были успешно применены нами при прогнозировании ТК алканов [1] и циклоалканов [2]. Использованы масс- спектры и значения температур кипения 116 алкенов с числом атомов углерода от 3 до 11, имеющиеся на сервере Национального Института Стандартов (МБ^США) [3]. В наборе масс-спектров использованных веществ имеется 123 значения отличных от нуля интенсивностей пиков в диапазоне отношений m/z от 1 до 156. Для получения рабочих значений дескрипторов масс-спектры перед расчетами были преобразованы по формуле

d -

∑ h,к-1

где d - рабочие значения дескрипторов, используемые в расчетах; n- количество пиков; h - их относительные интенсивности; i – номер вещества; j- номер пика с соответствующим m/z - отношением массы к заряду k-го иона в молекуле с номером i. Элементы dιj формируют матрицу дескрипторов . Тренировочная выборка состояла из 95, а контрольная - из 21 вещества. Расчеты выполнены с помощью разработанной нами компьютерной программы PROGROC (PROGgramRObustness Calculation). Качество прогнозирования характеризовалось коэффициентом корреляции R между прогнозируемыми и экспериментальными значениями ТК и стандартным отклонением s.

Результаты прогнозирования температуры кипения алкенов приведены в таблицах 1, 2 и на рисунках 1, 2.

Таблица 1 -Экспериментальные [3] и рассчитанные по масс-спектрам значения температуры кипения алкенов (К), контрольная выборка

Соединение

Экспер.

Рассч

Разн

1

Г ептен-3

369.0

369.2

-0.2

2

2-Метилпентен-2

340.2

338.2

2.0

3

Цис-2-бутен

276.9

279.7

-2.8

4

Транс-нонен-3

420.7

425.0

-4.3

5

3 -Метилгексен-1

358.0

359.1

-1.1

6

2,3,3-Триметилбутен-1

351.1

350.2

0.9

7

Транс-октен-2

398.2

399.9

-1.7

8

Г ептен-2 (цис,транс)

371.4

368.2

3.2

9

Цис-3 -метилгексен-3

368.6

368.3

0.3

10

Транс-3-гексен

340.2

337.5

2.7

11

2,4-Диметилпентен-1

354.8

354.7

0.1

12

Т ранс-4-ундецен

466.2

467.2

-1.0

13

Гексен-1

336.6

338.3

-1.7

14

Октен-2 (цис,транс)

398.0

398.6

-0.6

15

Транс-пентен-2

309.5

311.7

-2.2

16

Цис-4,4-диметилпентен-2

353.6

356.5

-2.9

17

3-Этилпентен-1

357.3

358.8

-1.5

18

3,3 - Диметилбутен-1

314.5

313.7

0.8

19

2,4,4-Триметилпентен-2

378.0

377.3

0.7

20

Цис-3 -метилпентен-2

340.9

342.0

-1.1

21

Т ранс-2-ундецен

465.7

467.0

-1.3

Полученным результатам соответствует ранг матрицы дескрипторов p(D)=78.

149

Таблица 2 -Показатели корреляции между экспериментальными и вычисленными значениями температуры кипения алкенов

Показатели корреляции

Весь набор

Тренировочная выборка

Контрольная выборка

R

0.9994

0.9994

0.9992

s

1.70

1.64

1.88

Абс. средняя ошибка

1.29

1.23

1.59

Для оценки качества выполненного нами прогнозирования, обратимся к литературным данным, приведенным в табл.3.

Таблица 3 -Результаты прогнозирования ТК по литературным данным

Вещества

Кол-

во

R

s

Л

ит.

Алкены, диены

144

0.9998

5

0.9

2

[4^ ]

Алканы, алкены, диены, алкины

327

0.9998

5

1.1

5

[4 ]

Алканы

211

0.9991

6.0

46

[5 ]

Алканы

7-1

0.9968

3.8

48

[6 ]

Алканы

160

0.9987

3.0

6

[7 ]

Алканы

īī¯¯

0.9968

3.8

48

[8 ]

Алканы

īī¯¯

0.9986

4.1

87

[9 ]

Углеводороды

296

0.997

6.3

[1

0]

Алканы, спирты

328

0.9990

6.0

21

[5 ]

Алканы, спирты

245

0.97

8.0

[1

1]

Набор разных классов

612

0.9823

Is.

5

[1

2]

Набор разных классов.

298

0.990

10.

62

[1

3]

Рассмотрим более подробно результаты работы [4], поскольку они заметно выделяются среди прочих, тем более, что в ней приводятся данныепо прогнозированию ІК алкенов. Авторы этой работы кроме пяти топологических индексов связности использовали в качестве дополнительных дескрипторов дипольный момент и относительную молекулярную массу. Для вычислений использовано предложенное авторами некоторое расширение нейросетевого подхода к QSPR, называемое fuzzy ARTMAP. Следует отметить, что при выделении из общего результата подкласса алкенов (97 веществ), значение R понизится до 0.9982. В этой же статье упоминается о работе Занга и др.[14], в которой для нейросетевого моделировании ІК 85 алкенов приведено значение средней абсолютной ошибки 2 К, максимальная ошибка- 5.7 К.

Сравнивая данные табл. 2 с литературными данными, можно видеть, что полученные нами результаты сопоставимы с лучшими примерами прогнозирования других авторов. Развиваемый нами подход позволяет прогнозировать свойства неизвестных соединений, используя лишь их масс-спектры.

 

ЛИТЕРАТУРА

  1. Важев В.В. Прогнозирование температуры кипения алканов по их ИК- и масс- спектрам// Нефть и газ: Алматы. - 2003. - №4. - C. 74-82.
  2. Важев В.В. Прогнозирование температуры кипения циклоалканов по их масс- спектрам// Нефть и газ: Алматы. - 2004. - №2. - С. 74-80.
  3. NIST Chemistry WebBook. NIST Standard Reference Database Number 69 - November 1998 Release. http://webbook.nist.gov/chemistry/
  4. Espinosa G., Yaffe D., Cohen Y., Arenas A., Giralt F. Neural Network Based Quantitative Structural Property Relations (QSPRs) for Predicting Boiling Points of Aliphatic Hydrocarbons // J. Chem. Inf. Comput. Sci. - 2000. - V. 40. - №3. - P. 859-879.
  5. Cao C., Liu S., Li Z. On Molecular Polarizability: 2. Relationship to the Boiling Point of Alkanes and Alcohols//J. Chem. Inf. Comput. Sci. - 1999. - V. 39.- №6. - P. 1105-1111.
  6. Ren B. Application of novel atom-type AI topological indices to QSPR studies of alkanes //Computers and Chemistry. - 2002. - V. 26. - P. 357-369.
  7. Cao C., Jiang L., Yuan H. Eigenvalues of the Bond Adjacency Matrix Extended to Application in Physicochemical Properties of Alkanes//Internet Electron. J. Mol. Des. - 2003. - № 2. – P. 621-641.
  8. Ren B. Application of novel atom-type AI topological indices to QSPR studies of alkanes //Computers and Chemistry. - 2002. - V. 26. - P. 357-369.
  9. Krenkel G., Castro E.A., Toropov A.A. 3D and 4D molecular models derived from the ideal symmetry method: prediction of alkanes normal boiling points //Chemical Physics Letters. - 2002. - V. 355. - № 5-6. - P. 517-528.
  10. Wessel M.D., Jurs P.C. Prediction of Normal Boiling Points of Hydrocarbons from Molecular Structure. //J. Chem. Inf. Comput. Sci. - 1995. - 35. - P. 68-76.
  11. Hall L.H., Kier L.B. Electrotopological State Indices for Atom Types: A Novel Combination of Electronic, Topological, and Valence State Information. //J. Chem. Inf. Comput. Sci. - 1995. - 35. - P. 1039-1045.
  12. Katritzky A.R., Lobanov V.S., Karelson M. Normal Boiling Points for Organic Compounds: Correlation and Prediction by a Quantitative StructureProperty Relationship //J. Chem. Inf. Comput. Sci. -1998. - V. 38. - №1. - P. 2841.
  13. Goll E.S., Jurs PC. Prediction of the Normal Boiling Points of Organic Compounds from Molecular Structures with a Computational Neural Network Model // J. Chem. Inf. Comput. Sci. -1999. - V. 39. - № 6. - P. 974-983.
  14. Zhang R., Kiu S., Liu M., Hu Z. Neural Networks-Molecular Descriptors Approach to the Prediction of Properties of Alkenes. //Computers Chem. - 1997. - V. 21. - № 5. - P. 335-342.
Год: 2012
Город: Костанай