Araştırmacılar, Datayı DNA’da Depolamak Üzerine Çalışıyor

ahmetbeyler · 6 Mar 2022

Son birkaç yılda insanlık, tüm tarih boyunca toplanan datanın toplamından daha fazla bilgi üretti ve görünüşe bakacak olursak bu, daha da katlanarak büyümeye devam edecek. Olağan hal bu biçimde olunca da bir noktada her insanın aklına tek bir soru geliyor: Bu kadar bilgiyi nerede saklayacağız?

Her ne kadar bilim insanları, insanlığa ilişkin dataları saklamak ismine sabit disk boyutlarını devamlı olarak artırsa ve hatta kimileri bunun sonsuza kadar yapılabileceğine insansa da, üstün data üretme suratımızın yanında bu gayretlerin yetersiz kalacağına inanan bir kısım bulunuyor. Bu telaşa karşılık olarak bilim adamları artık de ‘eşsiz’ bir tahlil üretmeye çalışıyor: Belgeleri, fotoğrafları ve dokümanları tabiatın kendine has bilgi tabanında, yani DNA’da depolamak.

Birkaç petabayt bilgiyi depolamak için yalnızca bir gram DNA kâfi

Geçtiğimiz ay Nano Letters isimli bilim mecmuasında yayımlanan çalışmanın, DNA bilgi depolama konseptini büyük boyutlara taşıyabilme potansiyeli bulunduruyor. Aslında bakacak olursanız çalışmanın gerisindeki takım, devasa depolama kapasitelerine imkan sağlayabilecek ve pek çok seviyede dijital data barındırabilecek DNA alfabesini yapay olarak genişleten birinci takım olma özelliğini taşıyor.

Hiper küçük alanlarda akıl almaz ölçüde bilgi içerecek kadar geniş ve ağır olan DNA’da bulunan çift sarmal ipliklerin, sırf 10 mikrometre genişliğindeki hücre çekirdeğinin içine sıkışmış bulunmasına karşın bedenimizin tüm verisini saklaması ve tabiatta bol bol bulunan DNA’nın üstün şiddetli şartlara bile güçlü olması, bilginin korunması için aslında DNA’nın mükemmelbir bellek olduğu manasına geliyor. Bu bahse dair konuşan çalışmanın ortak muharrirlerinden Beckman İleri Bilimler ve Teknoloji Enstitüsü’nden araştırmacı Kasra Tabatabaei, “İnternette her gün birkaç petabayt data üretiliyor. Bu bilgileri depolamak için sadece bir gram DNA kâfi olacaktır. DNA bir depolama ortamı olarak bu kadar ağırdır.” halinde kaydediyor.

DNA, yalnızca dört ‘harf’ kullanarak bütün canlıların genetik ayrıntılarını kodluyor

Pekala, biyolojik açıdan bakacak olursak, DNA’nın bilgi toplaması süreci nasıl işliyor? Şöyle ki DNA, genetik bilgiyi nükeotid ismi verilen, adenin (A), guanin (G), sitozin (S) ve timin (T) olmak üzere dört farklı molekül yardımıyla kodluyor. Bir bakıma DNA’nın bu dört molekülü temsil eden harflerden oluşan 4 harflik bir alfabesi olduğu ve farklı harf kombinasyonlarının farklı bilgi bitlerini temsil ettiği söylenebilir. Bu da demek oluyor tabiat, yalnızca bu dört harfi kullanarak dünya üstündeki bütün canlıların genetik bilgisini kodluyor. Teknik olarak düşünürsek bu, DNA’daki harfler aracılığıyla bizim de bir ton dijital data depolayabilmemiz gerektiği manasına geliyor.

Pekala, ya bu alfabe dört değil de daha fazla harften oluşsaydı? Bunun olması durumunda bilgi depolama kapasitesi epeyce, epeyce daha büyük olurdu ki, çalışma grubunun yapmaya çalıştığı şeyin de aslında tam olarak bu olduğu söylenebilir.

Bu durumu yazı yazmak için kullandığımız alfabeden yola çıkarak açıklayan ve şayet elimizde yalnızca 4 harf olsaydı üretebileceğimiz sözlerin sayısının pek kısıtlı olacağını belirten Tabatabei, “Alfabenin tamamı olursa, sınırsız söz kombinasyonu üretebilirsiniz. DNA’da da tıpkı şey. Sıfırları ve birleri A, G, C ve T’ye dönüştürmek yerine, sıfırları ve birleri A, G, C, T’ye ve depolama alfabesindeki yedi yeni harfe dönüştürebiliriz.” sözlerini kullanıyor.

Grup, DNA tarafınca kodlanan bilginin algılanmasını ve geri aktarılmasını sağlayan bir düzenek da geliştirdi

Buna ek olarak araştırmacılar, bu 11 harfle kodlanan ayrıntıların talep üzerine geri aktarılmasını sağlayan, sentetik DNA’nın datalarını tam olarak geri okuyan yeni bir sistem da geliştirdiler. DNA’nın harf kombinasyonlarının son derece net bir biçimde okunmasını sağlayan düzeneğin, insan imali DNA harfleri ile doğal olanları ayırt etmek ve her şeyi birbirinden ayırmak için derin öğrenme algoritmaları ve yapay zeka kullandığı bildiriliyor.

Çalışmanın ortak müelliflerinden Illinois Urbana-Champaign Üniversitesi’nden yüksek lisans öğrencisi Chao Pan ise, sisteme ait olarak “11 nükleotidin 77 farklı kombinasyonunu denedik ve tekniğimiz her birini kusursuz bir biçimde ayırt edebildi” diyor ve “Farklı nükleotidleri belirleme tekniğimizin bir modülü olan derin öğrenme çerçevesi kozmiktir, bu da yaklaşımımızın öbür biroldukca uygulamaya genelleştirilebilirliğini sağlar.” diye de kelamlarına ekliyor.

Araştırmacılar, Datayı DNA’da Depolamak Üzerine Çalışıyor

ahmetbeyler

New member