Израильские ученые сообщили о серьезном прогрессе в разработке технологии хранения данных в молекуле ДНК. Она уже самой природой создана как очень сложный и емкий носитель информации. По текущим представлениям, вполне реально достичь плотности записи в 10 петабайт на 1 грамм ДНК. Это значит, что весь колоссальный объем видео на сервисе YouTube можно было бы уместить в одной чайной ложке.
Для кодирования информации в ДНК нужно сначала перевести бинарные последовательности в комбинации из четырех нуклеотидов A, C, G и T. Затем во время процесса синтеза нуклеотиды выстраиваются в длинные цепочки – так и записывается произвольный объем данных. Чтобы прочесть их, нужно применить процедуру секвенирования, разделив цельную ДНК на фрагменты из нуклеотидов.
Израильским ученым из Техниона удалось совершить прорыв по трем направлениям. Во-первых, они расширили «алфавит», добавив новые значения для кодировки, помимо четырех базовых нуклеотидов. Во-вторых, сократили количество раундов синтеза на единицу информации на 20 %. В-третьих, они существенно улучшили механизм исправления ошибок.
Текущие методы синтеза и секвенирования по своей сути избыточны, потому что природа старается создавать много резервных копий — каждая молекула ДНК воспроизводится в больших количествах. Изменить это сложно, поэтому ученые пошли иным путем и при помощи математических методов применили избыточность для расширения количества «букв» для перевода бинарного кода. В перспективе они надеются снизить продолжительность синтеза при кодировке на 75 %. И это – реальный путь к хранению гигантских объемов данных в ДНК.