Obsah:
Klinická genomika je fascinující téma, kde lidé pracují na špičkových technologiích pro zpracování rychlých a přesných výsledků. Na trhu je k dispozici mnoho genomových sekvencerů, které produkují petabajty sekvenčních dat a růst v sekvenování povede v blízké budoucnosti k exabytům dat. Hadoop je zde perfektní platforma pro zpracování složitých pracovních postupů genomiky. Hadoop umí ukládat a třídit obrovské množství informací a může také provádět smysluplnou analýzu. (Chcete-li získat představu o tom, kolik dat to ve skutečnosti znamená, přečtěte si článek Porozumění bitům, bajtům a jejich násobkům.)
Současnost a budoucnost genomiky
Dnes genomové mapování dosáhlo svého vrcholu vývoje. Mnoho lidí spojených s genomickým odvětvím se zajímá o zvědavost a protože se objevují nové příležitosti, lepší technologie vyžaduje hodinu. Sekvenování genomu je velmi opakující se a náročná na zdroje. Jen v roce 2013 bylo vyrobeno asi 15 petabajtů dat a pouze 2 000 sekvencerů. Toto množství čelistí zahrnovalo 300 KB sekvenovaných dat lidského genomu. Při této rychlosti produkce dat lze odhadnout, že do roku 2018 bude vytvořeno asi jeden exabyte dat. Důvodem bude růst sekvencerů, které budou produkovat stále více dat za běh. Dalším důvodem je příchod extrémně výkonných a levných strojů pro sekvenování genomu. Od roku 2008 cena těchto strojů neustále klesá. Je to kvůli výkonným strojům nové generace, které vstoupily na trh.
Potřeby průmyslu mapování genomu
Komplexní algoritmy se používají pro zpracování dat, která jsou shromažďována z lidského genomu. Poté je třeba tyto informace uložit. Může být v budoucnu přezkoumán pro porovnání s původními údaji. Úloha zpracování a ukládání 100 GB dat není příliš obtížná, zejména když to děláte s výkonnými stroji zaměstnanými v sekvenčních centrech. Studie ukazují, že toto množství dat lze zpracovat za pouhých 1 000 hodin CPU, takže je to velmi snadné. Při této rychlosti technického pokroku je zřejmé, že průmysl genomu brzy zpracuje tisíce gigabajtů během několika sekund.
