Побудова масштабних моделей ПРОСТОРОВОЇ СТРУКТУРИ БІЛКА ПО ЙОГО НУКЛЕОТИДНОЇ ПОСЛІДОВНОСТІ

Резюме: пропонується метод передбачення вторинної і третинної структур білків еукаріот по нуклеотидної послідовності відповідних генів. Точність досягає часткою пікометр.

В даний час залишається невирішеним питання, яким чином довгою поліпептидного ланцюга вдається прийняти ту єдину тривимірну форму, яка необхідна для виконання біохімічної функції. Ми припускаємо, що вторинна структура натурального білка еукаріот визначається в процесі його біосинтезу на рибосомі третім нуклеотидом кодону і пропонуємо таблицю "квазікомпозіціонного коду" (ТКК) відповідності певного кодону з тією структурою, в яку входить дана амінокислота.

ВСТУП

Справжня робота є складовою частиною комплексного дослідження в суміжних областях науки. Гіпотеза про зв'язок генетичного коду і структури білка з'явилася в іншій області, яка виходить за рамки цієї статті, однак перевірка цієї гіпотези і апробацію таблиці квазікомпозіціонного коду заснована на біохімічних методах. Це звузило список цитованої літератури до трьох: довідник по кореляційному аналізу, банк нуклеотиднихпослідовностей і банк структур.

Суть роботи полягає в наступному. Існує дві загальновизнаних таблиці генетичного коду. Одна з них пов'язує триплетний код ДНК з первинною структурою білка, синтезованого рибосомою клітини. Друга таблиця - код мітохондрій. Ми пропонуємо третю таблицю для клітин еукаріот, в якій є додаткова графа, яка вказує на композицію даного амінокислотного залишку по відношенню до попереднього.

Мета цієї роботи - перевірка таблиці квазікомпозіціонного коду методом кореляційного аналізу. Для цього порівняємо вторинні структури, отримані по нуклеотидної послідовності білка з використанням нашої таблиці і вторинні структури цього білка за даними координатного банку.

На цьому шляху нас підстерігають такі проблеми:

Механізм рибосоми еукаріотичної клітини, згідно з нашою гіпотезою, лише "правильно" встановлює амінокислоти в зростаючу молекулу білка, що заміняє тривалий процес самозборки вторинної і третинної структур. Мутація в третій позиції кодону лише сповільнить процес біосинтезу, але физикохимические взаємодії переведуть білок в "правильну" стійку конформацию. В такому білку-мутант композиційний код порушений, а процес складання білка уповільнений.

Мікроструктура гомологічних ділянок може кардинально відрізнятися (різними мікропутямі можна викреслити макроструктуру). Ця проблема виключає перевірку ТКК за кодами гомологів, зокрема з різним вмістом C + G-підстав. Обмежуючи вибірку класичної альфа-спіраллю (альфа-Керотин, тропонин-С, міоглобін, інсулін), класичної бета-структурою (Фиброин), відомими структурами, для яких код відомий не по гомологів, ми з одного боку ризикуємо втратити достовірність, а з іншого боку збільшуємо чистоту експерименту.

Вимога чистоти експерименту обмежило вибірку від багатьох сотень до 15 білків. Загальна кількість альфа-спіральних ділянок в цих білках склало кілька сотень, а кількість зіставляються амінокислотних залишків перевищило 2800.

Використовуючи біноміальний критерій нам вдалося отримати достовірні результати в рамках жорстких фінансових обмежень цього дослідження, що не дозволили обробити весь обсяг банків даних.

Нам доводиться спиратися тільки на дуже надійні дані по класичним альфа-спіральним ділянкам і класичним бета-верствам. З цих міркувань ми провели додаткове дослідження сімейства Фиброин, білків з класичної бета-Cтруктура, і альфа-Керотин з класичної альфа-структурою

Варіант 1 відповідає входженню залишку в 4/10 альфа-спіраль;

Варіант 4 відповідає входженню залишку в 3/10 альфа-спіраль;

Варіант 2 відповідає входженню залишку в класичний бета-шар;

Варіант 3 відповідає положенню другого залишку бета-повороту.

На прикладі альфа-Керотин з класичної альфа-структурою розглянемо роботу комп'ютерної програми, в основу якої покладена таблиця квазікомпозіціонного генетичного коду.

Кожен триплет нуклеотидной поледовательності білка перетворюється, згідно з таблицею в варіант композиції 1 ... 4.

Результат роботи програми перекодування генетичного коду в композиційний в типовому випадку одного з 30 альфа-Керотин:

111311411141143143111334141341111114131131111111111141111421141313114111311431311411314111

411141111314114431414131141113111111411411121131111311432113411111334141114111431111141111

Програма показує велику кількість кодів 1 і 4, відповідних 4/10 і 3/10 альфа-спіралями відповідно. Бета-кодів (2 і 3) в Керотин міститься 28/120 = 0.23, тобто менше 24%. Всі 30 різновидів Керотин, коди яких нам були доступні, програма зарахувала до альфа-структурних білків.

Тепер розглянемо результат перекодування кодів одного з 3 типових Фиброин з класичної бета-структурою [4].

13131341122341313323211333311332331313333223323332342313333233313433311223233331114132143

11311132133411123133333333333342233114212213211313231131333213223323313333431233323333334

У бета-структурному білку, відсоток бета кодів повинен перевищувати відсоток альфа кодів. В даному (типовому) випадку бета-кодів (2 і 3) міститься 63/118 = 0.53, тобто дійсно більше 50%. Всі доступні коди Фиброин програма зарахувала до бета-структурних білків.

Чи не є відмінність кодів випадковим збігом? Адже ми перевірили всього 30 альфа-структурних і 3 бета-структурних білка.

Для проведення кореляційного аналізу сформулюємо нульову гіпотезу: в алфа-спіральних ділянках (за даними з банку структур) ймовірність виявити бета-код (2 або 3 по ТКК) дорівнює середньому значенню по всій структурі білка.

На прикладі білка "Cholesterol oxidase" покажемо, як вихідна нуклеотидних послідовність цього білка з банку EMBL була перетворена в композиційний код, а потім проводилося зіставлення з даними з Брукхевенської банку структур.

18 GGC Gly GLY 1

19 AGT Ser SER 3

20 GGA Gly GLY 2

21 TAC Tyr TYR 1 HELIX

22 GGC Gly GLY 1 HELIX

23 GGT Gly GLY 3 HELIX

24 GCC Ala ALA 1 HELIX

25 GTC Val VAL 1 HELIX

26 GCC Ala ALA 1 HELIX

27 GCG Ala ALA 4 HELIX

28 CTG Leu LEU 4 HELIX

29 CGG Arg ARG 4 HELIX

30 CTG Leu LEU 4 HELIX

31 ACG Thr THR 4 HELIX

32 CAG Gln GLN 1 HELIX

33 GCC Ala ALA 1

34 GGT Gly GLY 3

35 ATC Ile VAL 1

номер

стовпчика

значення

1 номер амінокислотного залишку

2 триплет нуклеотидів, що кодує даний залишок

3 назва амінокислотного залишку (за кодом)

4 назва амінокислотного залишку (з банку структур)

5 варіант композиції (по ТКК)

6 варіант композиції (з банку структур)

Кількість амінокислотних залишків: 502

Альфа-спіралей (% по рентгену) 24.10

Всі альфа-спіралние ділянки (по рентгену) містять 96.69% Альфа-кодів (по ТКК) і 3.31% бета-кодів відповідно. Ставлення процентного складу бета-кодів по всій довжині білка до процентному складу в альфа-спіральних ділянках (по рентгену) становить 2.289.

Ця цифра означає, що в альфа-спіралі (по рентгену) бета-кодів (по ТКК) приблизно вдвічі менше, ніж в середньому по білку. Детальний аналіз показує, що альфа-спіральні ділянки (по рентгену) бувають зрушені на один-два-три залишку вперед або назад, щодо тих же ділянок по ТКК. Цей зсув є похибкою рентгеноструктурного методу, а його величина, тобто похибка рентгена залежить від свіжості рентгеноструктурних даних. Чим більш пізні дослідження, тим менше похибка. Якщо кінці альфа-спіральних ділянок, які не визначаються рентгеном, не враховувати, то кореляція зростає.

Використовуємо критерій знаків (біноміальний).

При цьому методі спочатку підраховують число випадків, коли ефект має знак "+" (в нашому випадку число бета-кодів в середньому по білку перевищує число бета-кодів в альфа-спіралі (по рентгену), тобто. Їх ставлення більше 100% ), а потім порівнюють його з числом, яке можна було б очікувати на основі чистої випадковості (в нашому випадку вероятност випадкової події дорівнює 1/2). Далі визначають різницю між цими двома числами, щоб з'ясувати, наскільки вона достовірна.

При підрахунках результати, що свідчать про позитивну різницю, беруть зі знаком плюс, а про негативну - зі знаком мінус; випадки відсутності різниці не враховують.

Розрахунок ведеться за наступною формулою:

Z = ((X-0.5) -N / 2) / корінь з (N / 2), де

X - сума позитивних відхилень

N / 2 - число відхилень при чистій випадковості (один шанс з двох)

0.5 - поправочний коефіцієнт, який додають до X, якщо XN / 2.

У нашій вибірці з 15 маємо 14 позитивних і одне негативне відхилення (воно відноситься до прокариотический білку, який не зобов'язаний підкорятися нашій таблиці).

Z = ((14-0.5) -15/2) / корінь (15/2) = (13.5-5) / корінь (7.5) = 3.10

З таблиці значень Z можна дізнатися, що для рівня значущості 0.01 Z становить 2.33. Оскільки інформація, видобута нами величина виявилася вище табличній, нульову гіпотезу слід відкинути. Значить, існує корелляция між даними, отриманими шляхом перетворення нуклеотидноїпослідовності білків (по ТКК) і даними рентгеноструктурного аналізу цих білків. Якщо не враховувати дані по білках прокариот, то кореляція зросте.

Існує інший спосіб апробацію ТКК, незалежний від надійності і різної інтерпретації даних рентгеноструктурного аналізу. Він полягає в здатності програми, що використовує ТКК відрізняти одні типи білків від інших, тобто виявляти їх індивідуальність.

Чи може програма продемонструвати індивідуальність білків по їх нуклеотидної послідовності чи ні, наочно показує наступний експеримент.

Потрібно мати дуже вагомі аргументи, щоб не помітити ефективної роботи програми "Пікотехнологія". Заперечення повинні бути підкріплені якщо не статистичними, то хоча б одиночними даними, в іншому випадку вони будуть виглядати просто голослівними і непереконливими.

Обговорення результатів

Достовірність отриманих результатів можна збільшити, шляхом цілеспрямованого отримання кодів білків, з організмів чистих ліній. В цьому випадку експеримент буде максимально чистим. При цьому рентгеноструктурні дані теж повинні бути зроблені саме для білка цієї чистої лінії.

Трудомісткість цього завдання очевидна. Вирішити її без фінансування цієї теми важко, тому автори вважають за доцільне ознайомити з цією проблемою інших дослідників.

Для нас становлять великий інтерес навіть поодинокі приклади, які поставили б під сумнів відкриту нами закономірність, тому що істина завжди дорожче красивих ілюзій.

Розглянемо найбільш цікаві питання, пов'язані з ТКК.

1. У гомологічних білках для консервативних залишків, залучених у вторинні структури, використовуються всі чотири букви в третіх положеннях триплетів. Чи не виключає цей факт можливості композиційного кодування?

Якщо мікроструктура гомологів ідентична, то це вказує на імовірнісний характер ТКК, тобто не всі амінокислоти, згідно ТКК рибосома ставить "правильно". Однак такі "відхилення" коду від "норми" призводять лише до зниження ефективності біосинтезу і не так критичні, як порушення функції білка.

2. Чи не виключає існування організмів з різним вмістом G + C-підстав можливість композиційного кодування?

Виключає, але тільки в тому випадку, якщо вміст G + C або збільшується до 100%, або зменшується до 0.

3. Відомо, що по амінокислотної послідовності поліпептиду (а не по нуклеотидної) можна передбачити його вторинну структуру. Яким чином це вдавалося досі без залучення квазікомпозіціонного коду?

Квазікомпозіціонний код лише дублює физикохимические взаємодії. Його можна, не брати до уваги, однак, по ТКК структуру білка можна визначити миттєво, хоча 100% -ва достовірність не гарантовано.

4. Різні організми характеризуються різним G + C складом ДНК, при високому вмісті G + C деякі кодони практично не використовуються. Однак білки, що виконують одну і ту ж функцію у різних організмів, мають високу гомологією і формують подібні вторинні і третинні структури. Чи можна застосувати ТКК для аналізу послідовностей ДНК в цьому випадку?

Маючи під рукою лише ТКК це питання можна вирішити тільки формально. Гомологічні білки з однаковою микроструктурой (такі гомологи існують) мають однаковий композиційний код. Як приклад можна привести гомологічні ділянки нейротоксинов скорпіона (їх вторинні структури представлені під номерами 9 і 10). Більш того, за допомогою зіставлення таких гомологів нам вдалося виправити чотири коду ТКК з 64 отриманих іншим методом.

Неформально вирішити питання про збереження функцій гомологічними учаска, в яких замінені одні залишки на інші, допоможе детальний розгляд методики, яка допомогла скласти ТКК.

Необхідно відзначити, що нашу методику не вдається аппробіровать на простих молекулах, тому що існуючі експериментальні методи, що застосовуються для дослідження простих молекул не дозволяють розрізнити яка модель краще: загальноприйнята або наша. Моделі невиразні на рівні фізичних і хімічних експериментів. Простота і наочність наших класичних моделей не переконує рецензентів, які вважають, що необхідно почекати до тих пір, поки прямі експерименти підтвердять або спростують наші моделі. Це може статися, коли в мікроскоп можна буде побачити форму окремого електрона. Однак ми вважаємо, що апробацію наших моделей можна провести іншим способом, отримавши слідства, наприклад в області біології, які перевіряються експериментально. ТКК як раз і є такий наслідок.

Історія складання ТКК незвичайна. Причиною цього дослідження було наше дослідження в суміжній області, яку можна назвати "формоутворення в мікросвіті". Першопричиною дослідження є створення нами кільцевої моделі електрона, що дозволило застосувати для "некласичних" об'єктів закони класичної фізики, зокрема створити масштабні геометричні моделі електронних оболонок атомів і молекул. Ця робота відзначена в 1989 р срібною медаллю ВДНГ СРСР.

У наших класичних моделях мікрооб'єктів, електрони представлені кільцевими магнітами. Ця модель аналогічна розглянутої в [1]. Для спрощення подальших міркувань зазначимо, що розгляд внутрішньої структури електрона, залежно радіуса електрона-кільця від напруженості поля ядра і інші фізичні нюанси кільцевої моделі електрона виходять за рамки нашого обговорення. Вони обговорюються в монографії "Форми, механізми, енергія наносвіту", яка готується до публікації.

Метод дослідження, який допоміг скласти ТКК, полягав у проведенні модельних експериментів з кільцевими магнітами, які зображують електрони. Число кільцевих магнітів відповідало числу валентних електронів молекули.

В експериментах використовувалися додаткові поверхні, що імітують компенсацію електростатичного впливу на електрони з боку ядер атомів і інших електронів молекули. Деякі моделі були виготовлені методом симетричного розміщення заданої кількості кілець, з урахуванням всіляких властивостей реальних електронів. Використовувалися методи перебору варіантів, аналогії, оптимізації, систематизації та ін.

Перший експериментальний результат був отриманий в модельному експерименті з кільцевими магнітами, який проводився з метою перевірки гіпотези: "Кільця-електрони утворюють електронну оболонку-багатогранник". Дійсно, 8 кільцевих магнітів підтримують форму восьмигранника з кілець, покладених на сферу електростатичного рівноваги електронів (рис. 1). Більш темним кольором позначені звернені назовні південні полюси електронів. Ця модель електронної оболонки відповідає фермі-поверхні, виявленої експериментально [2].

Заміщення чотирьох кілець-електронів недобудованими восьмигранником (без одного кільця) перетворює форму фосьмігранного атома в знайому нам форму тетраедричних молекули (рис. 2). Таку форму мають електронні поверхні молекул тетрахлорида вуглецю і фосфорної кислоти.

Наочна демонстрація форм молекул в модельному експерименті захопила нас, і ми побудували понад 1 500 кільцевих моделей різних хімічних сполук (постійна експозиція у павільйоні "Центральний" ВВЦ (ст. М. ВДНХ).

Особливий клас хімічних сполук - пов'язані системи. Модельний експеримент показав, що взаємовплив углеродоподобних атомів є причиною перебудови електронної структури молекули з багатогранною в багатошарову, що призводить до формування "плоскою" пов'язаною системи, наприклад, молекули бензолу (рис. 3).

Композиція багатогранних і багатошарових атомів і молекул дозволила нам скласти кольцегранную структуру нуклеотидів ДНК (рис. 4). Структура нашої моделі ДНК в загальних рисах який суперечить загальноприйнятій моделі [3].

Як перевірити, чи збігаються форми моделей з кілець з формами реальних молекул? Це не так просто, як може здатися на перший погляд. Справа в тому, що не тільки електрони, а й багато атоми на електронних фотографіях молекул невиразні. Загальний контур молекули добре помітний лише для великих білків, які налічують тисячі і більше атомів [4].

Ми вирішили побудувати кільцеві моделі декількох відомих білкових молекул. Одна з них troponin-C, яка налічує близько 8 000 поверхневих електронів, представлена ​​на рис. 5. Вона побудована не за результатами рентгеноструктурного аналізу, а за генетичним кодом цієї молекули. Розглянемо, як це було зроблено.

В даний час вважається, що білкові молекули народжуються в розгорнутому вигляді, а потім самі згортаються під дією міжатомних сил [4]. Однак в пробірці цього може і не статися. Чому?

Ми побудували модель групи CCON (рис. 6) (а) - електронна поверхню, (в) - спрощене зображення.

Гіпотеза: трикутник DEF кожної групи CCON поєднується рибосомою з трикутником АBC попередньої групи CCON відповідно до ТКГК.

Перевірку гіпотези ми почали з того, що виготовили модель полімеру, в якому точки D трикутників DEF суміщені з точками A трикутників ABC (варіант 1). В отриманій структурі на один виток спіралі довелося 3,65 моделей амінокислотних залишків. Це значення відповідає структурі альфа-спіралі.

Поєднавши точки D трикутників DEF з точками C трикутників ABC (варіант 2) ми отримали більш витягнуту спіраль. Коефіцієнт подовження склав 1.3, що, згідно з експериментальними даними відрізняє бета-структуру від альфа-структури.

Третій варіант з'єднання моделей залишків дав ліву спіраль, яку ми не знайшли експериментального відповідності, однак чергування варіантів 1-3-1 призвело до повороту бета-структури на 180 градусів, причому групи CO розташувалися навпроти груп NH.

Трикутник DEF в разі утворення 3/10 і 4/10 альфа-спіралей кілька повернуть щодо ABC за рахунок утворення додаткової водневого зв'язку.

Таким чином, варіант 1 розщеплюється на три.

Наступний крок - перевірка, чи однакові коди одного і того ж амінокислотного залишку, якщо він, відповідно до рентгеноструктурньїм даними входить до складу альфа-спіралі?

Аналіз кодів міоглобіну і тропоніну-С підтвердив це припущення. Ділянки альфа-спіралей містили переважно одні й ті ж коди. Зокрема Gly в альфа спіралі кодується тріпретамі GGC і GGG.

Наступний крок - спроба побудови кільцевих моделей білків з відомою структурою, зокрема, міоглобіну, інсуліну, тропоніну, окситоцину. Перебір допоміг вибрати варіанти з'єднання моделей груп CCON, що дають форми цих білків.

При цьому виявилося, що, наприклад, амінокислота гліцин Giy кодується кодом GGC, якщо входить до складу 4/10-альфа-спіралі, кодом GGA, якщо входить до складу бета-шару, кодом GGG, якщо входить до складу 3/10-альфа -Спіралі, де воднева зв'язок встановлена ​​не з четвертим, а з третім амінокислотним залишком і, нарешті кодом GGT, якщо є другим амінокислотним залишком бета-повороту.

А. Кушелев склав ТКК, в якій кожному з 64 кодів відповідає варіант композиції. Вперше ця таблиця була опублікована в газеті "Економіка сьогодні і завтра" №1 (4) 1993р. З цього моменту почалася перевірка ТКК різними групами фахівців з МДУ і ін-ту молекулярної біології. Офіційних відповідей ми не отримали.

Авторам видався цікавим обговорити питання про можливі застосування відкритої закономірності, представленої у вигляді ТКК.

Таблиця квазікомпозіціонного коду допомагає отримати відомості про структури великого класу білків без проведення дорогого рентгеноструктурного аналізу. Це дозволяє організувати надбудову банку EMBL, яка, займаючи 12 кілобайт (!) Оперативної пам'яті комп'ютера зможе інтерпретувати код білка (з урахуванням перерахованих вище обмежень) як структуру, причому в масштабі реального часу доступу до банку нуклеотиднихпослідовностей. Версія 2.0 програми продемонстрована в цій статті. В упакованому вигляді вона займає 5 кілобайт. Версію 2.0 (визначення вторинної структури) можна отримати безкоштовно.

Миттєвість отримання структурних даних ставить ТКК поза конкуренцією з рентгеном та іншими методами. 100% достовірність, згідно з нашою гіпотезою може бути отримана в разі врахування ТКК і фізико-хімічних взаємодій між окремими амінокислотними залишками, окремими атомами і окремими елктронамі, класична модель яких створена в лабораторії "Наносвіт".

Автор: Ю.А. Кушелев, Д.Н. Кожевников, В.В. Яким, С.С. Марковський, В.В. Бєляєв

За матеріалами сайту "sciteclibrary.ru"

Інші статті по темі:

Резюме: пропонується метод передбачення вторинної і третинної структур білків еукаріот по нуклеотидної послідовності відповідних генів β-АДРЕНОБЛОКАТОРИ: ПРИНЦИПИ ТЕРАПІЇ З ПОЗИЦІЙ ДОКАЗОВОЇ МЕДИЦИНИ
ВСТУП В квантової фонон БІОЛОГІЮ. АЛКОГОЛЬ ТА ІНШІ ОРГАНІЧНІ РОЗЧИННИКИ.
ГЕНЕТИЧНЕ МАЙБУТНЄ ЛЮДСТВА
Побудова масштабних моделей ПРОСТОРОВОЇ СТРУКТУРИ БІЛКА ПО ЙОГО НУКЛЕОТИДНОЇ ПОСЛІДОВНОСТІ
ПСИХОЛОГІЯ І ЗДОРОВ'Я. ДУШЕВНІ ЛІКИ.

Додати коментар:

Чи не є відмінність кодів випадковим збігом?
Чи не виключає цей факт можливості композиційного кодування?
2. Чи не виключає існування організмів з різним вмістом G + C-підстав можливість композиційного кодування?
Яким чином це вдавалося досі без залучення квазікомпозіціонного коду?
Чи можна застосувати ТКК для аналізу послідовностей ДНК в цьому випадку?
Як перевірити, чи збігаються форми моделей з кілець з формами реальних молекул?
Чому?
Наступний крок - перевірка, чи однакові коди одного і того ж амінокислотного залишку, якщо він, відповідно до рентгеноструктурньїм даними входить до складу альфа-спіралі?