В микрофлоре человека нашли 2 500 000 неизвестных белков


Ученые из Греции и США подсчитали гены, кодирующие маленькие белки в клетках микрофлоры человека. Они рассчитывали найти несколько сотен таких генов, но обнаружили два с половиной миллиона, из четырех тысяч разных семейств. Эти гены, предположительно, кодируют как необходимые для повседневной жизни клеток белки, так и те, которые могут стать основой для новых антибиотиков. Об этом пишет Chrdk.


В поисках бактериальных белков исследователи обычно ориентируются на крупные молекулы, а мелкие игнорируют. Это происходит из-за высокого риска ложноположительных результатов: белки ищут по кодирующим их генам, а последовательности генов собирают по кусочкам после секвенирования (прочитывания генома). При этом велик шанс, что какой-нибудь участок потеряется и ген окажется слишком коротким. Чтобы избежать ошибки, исследователи ищут в геномах бактерий кодирующие последовательности не короче определенной длины, а на небольшие гены не обращают внимания.


Группа ученых из США и Греции решила исправить эту несправедливость и прошерстить геномы человеческой микрофлоры в поисках коротких белок-кодирующих участков. По словам авторов работы, они ожидали найти несколько сотен коротких белков, но перевыполнили план на несколько порядков. Изучив геномы микробиоты, населяющей ротовую полость, кишечник, кожу и влагалище 263 доноров, исследователи нашли целых 2 514 099 последовательностей, кодирующих белки размером до 50 аминокислот (для сравнения: в белковых частях гемоглобина более 140 аминокислот).


Чтобы убедиться в том, что перед ними именно белки, а не случайные ошибки секвенирования, ученые воспользовались алгоритмом RNAcode, который ищет похожие последовательности у разных видов бактерий. Алгоритм подтвердил, что многие из белков действительно родственны друг другу и потому не могут быть случайными осколками чего-то еще, и разделил всех найденных малышей на 4539 семейств.


Как правило, функцию белка определяют по набору доменов — участков последовательности, принимающих характерную форму. Однако в 96% новых белков исследователям не удалось обнаружить никаких знакомых доменов, поэтому о функциях, которые они выполняют, можно пока судить лишь по косвенным признакам. Например, 14 семейств белков встречаются особенно часто — более чем у 100 видов бактерий с разных участков тела. Авторы работы предположили, что они задействованы в «домашнем хозяйстве», обеспечении основных внутриклеточных процессов: экспрессии генов, синтеза белков и обмена веществ. Еще около трети семейств, судя по всему, участвуют в межклеточной коммуникации, потому что составляющие их белки либо расположены на поверхности клеток, либо выделяются из них наружу.


Малые белки привлекают особенное внимание ученых, потому что могут стать основой для лекарств: их несложно синтезировать в лаборатории, они легко распространяются по организму и проникают в ткани, а структура их стабильна, потому что образована лишь одним доменом. Исследователи полагают, что открытые ими белки тоже могут представлять медицинский интерес. Например, они обнаружили 39 семейств молекул с антимикробной активностью, а значит, среди них можно дальше искать новые антибиотики.