» »

Hitrejše določanje zaporedja DNK z grafičnimi procesorji

Hitrejše določanje zaporedja DNK z grafičnimi procesorji

Sekvenca 250 baznih parov DNK. Celoten človeški genom jih vsebuje približno tri milijone, kar ustreza ravno količini podatkov na eni zgoščenki.

vir: Wired News
Wired News - Grafični procesorji, ki so jih dolga leta v popolnost izkoriščali le strogo namensko, torej za izračun in prikazovanje slike, so v zadnjih letih pridobili mnogotera mesta uporabe. Izkazalo se je namreč, da so pri operacijah s števili s plavajočo vejico neprimerno hitrejši in varčnejši od centralnih procesorjev, zato so zasedli nepogrešljiva mesta v superračunalnikih in tudi v manj velikopoteznih aplikacijah prek Nvidine CUDE oziroma AMD-jevega Streama. Tipičen primer je razbijanje kriptografskih gesel, ki na grafičnih procesorjih poteka za več kot velikostni razred hitreje.

Uporaba grafičnih procesorjev za splošno računanje ima tudi raznovrstno uporabo v znanosti. Kitajski biokemijski laboratorij BGI v Šendženu s pridom izrablja GPU-je za urejanje podatkov pri sekvenciranju DNK (iskanju nukleotidnega zaporedja baz). Čas za računalniško obdelavo se je po vgradnji Nvidiinih grafičnih procesorjev v strežnike skrčil s štirih dni na vsega nekaj ur.

Za uspešno poganjanje aplikacij na grafičnih procesorjih z opaznim prihrankom časa, je potrebno kodo programov in algoritme prepisati v ustrezen jezik. Najuspešnejši je prenos v primerih, ko algoritem sestojih iz več neodvisnih korakov, ki jih je mogoče učinkovito paralelizirati. Laboratoriju BGI je v sodelovanju z Nvidiio uspelo prenesti orodja za analizo genoma v okolje, ki deluje na GPU-jih, kar ni zanemarljiv dosežek. Odprtokodne skupnosti delajo na podobnem primeru že nekaj časa, a rešitev še niso objavile.

S tem je BGI napadel pomembno ozko grlo pri določevanju genoma. Cena sekvenciranja se je v zadnjem času eksponentno nižala, medtem ko ji cena analize ni sledila. Slednja je namreč računsko zelo zahtevna. Pri tako imenovanem hitrem sekvenciranju (shotgun sequencing) se DNK z encimi naključno razreže v več koncev različnih dolžin (več istih molekul DNK, a vsaka se razreže drugače), ki se jim potem določi nukleotidno zaporedje baz. To je potrebno storiti, ker ni mogoče sekvencirati večmilijonskih verig DNK. Pridobljene podatke pa je potem potrebno zložiti nazaj v pravo zaporedje, pri čemer si pomagamo s prekrivanjem istoležnih segmentov. Zmešnjavo rešijo računalniki.

Kljub temu pa odkritje še ne bo revolucionarno predrugačilo sekvenciranja genoma. Genski zapis bo resda mogoče pridobiti ceneje in hitreje, a določanje zapisa zavoljo zapisa samega ni cilj raziskav. Še bolj prominentno ozko grlo od računske moči je namreč poznavanje genov, saj je treba v sekvencirani DNK še vedno poiskati posamezne gene in operone. In tudi poznavanje več tisoč genov in vseh njihovih modifikacij še ni dovolj, saj je potrebno ugotoviti, kateri so medicinsko pomembni.

18 komentarjev

T-h-o-r ::

koliko pa stane dandanes, če želiš da preberejo tvoj genom? enkrat sem nekje zasledil ceno 1000 €, a je to že šlo kaj dol? :)
Why have a civilization anymore
if we no longer are interested in being civilized?

Pyr0Beast ::

A ni cena 5k€ za branje + analizo in podajanje morebitnega vzroka bolezenskega stanja ?
Some nanoparticles are more equal than others

Good work: Any notion of sanity and critical thought is off-topic in this place

T-h-o-r ::

enkrat sem bral članek, da lahko kar prek interneta pošlješ vzorec in ti nardijo za 1000 e


sam ne vem kako podrobno pa to :)
Why have a civilization anymore
if we no longer are interested in being civilized?

pietro ::

Danes je okrog 2-3000$. Gre pa se kar hitro navzdol, sploh z vsemi novimi tehnologijami, ki prihajajo ven.

Deneb ::

Ko bo stvar dovolj poceni, bodo Coca-Cola, Apple in podobni zaceli nadomescati nekodantne sekvence z njihovo reklamo.

MercuryEye ::

Sam sem si teste uredil @ http://lifegenetics.eu/

kljukusa ::

Glede na to, da vas zanima koliko stane sekvenciranje človeškega genoma si poglejte tole. Pa še press release

Torej manj kot en dan in okoli 1000 USD.

P.S.: LifeGenetics ti ne posekvencirajo genoma ampak ampak imajo tarčne genetske analize...

Zgodovina sprememb…

  • spremenil: kljukusa ()

jurez ::

cena sekveniranja celotnega genoma je še vedno okrog 100.000 usd - za prvega človeka je stala nekaj milijard in je potekala več let, sedaj pa to naredijo v kakem tednu..

je pa vprašanje uporabnosti, saj se trenutno lahko interpretira rezultate le nekaj 100 mest v genih, kar pomeni, imaš goro neuporabnih podatkov. smiselnost analize celotnega genoma je zato trenutno le za raziskovalne namene, saj se trenutno ne splača. bolj se splača testirati tam, kjer gledajo samo gene, ki jih tudi interpretirajo in so zato tudi cene analize precej nižje. lifegenetics je sigurno eden takih..

kljukusa ::

jurez je izjavil:

cena sekveniranja celotnega genoma je še vedno okrog 100.000 usd - za prvega človeka je stala nekaj milijard in je potekala več let, sedaj pa to naredijo v kakem tednu..

OK ni čisto res. Dandanašnji je to že relativno poceni, med 10k in 40k USD (odvisno od ponudnika in želja)

Vir: Wikipedia

carota ::

Rezultati teh testiranj ne povedo ali se bo določen gen izrazil ali ne. Zato jih ni za jemat za svete.

jurez ::

kljukusa je izjavil:

jurez je izjavil:

cena sekveniranja celotnega genoma je še vedno okrog 100.000 usd - za prvega človeka je stala nekaj milijard in je potekala več let, sedaj pa to naredijo v kakem tednu..

OK ni čisto res. Dandanašnji je to že relativno poceni, med 10k in 40k USD (odvisno od ponudnika in želja)

Vir: Wikipedia


imaš prav, dejansko se je očitno v enem letu pocenilo iz 100 na 10k...je pa seveda vprašanje uporabe tehnologije in njene zanesljivosti. pred kratkim so zelo promovirali IonTorrent (tudi v lasti Lifetechnologies), ki naj bi cel genom ponujal za tam okrog 1000usd, je pa še vedno daleč od tega, vendar na dobri poti. imajo pa te nove naprave tudi določen odstotek napak pri branju rezultatov, ki se meri kar v odstotkih - kaj to za koga pomeni je odvisno od tega kako resne zadeve želi proučevati...

Rokm ::

MercuryEye je izjavil:

Sam sem si teste uredil @ http://lifegenetics.eu/


Tile so pa še kar dragi.
Verjetno najboljše in največje podjetje, ki se s tem ukvarja je na https://www.23andme.com/. So cenejši, glede na izkušnje pa imajo tudi dosti večji porfolij stvari za katere analizirajo kot konkurenca.

HardFu ::

Nimam se za neumnega ali nerazgledanega, ampak drugi tel tele novice se mi zdi kot da bi kitajsko bral :)
http://codeable.io

oracle ::

HardFu je izjavil:

Nimam se za neumnega ali nerazgledanega, ampak drugi tel tele novice se mi zdi kot da bi kitajsko bral :)

Nič posebnega. Pač določevanje celotnega genoma potega v grobem v dveh korakih. Najprej določitev zaporedja kratkih segmentov (ne kaj dosti več od 500 ali 1000 mest), potem pa sestava teh segmentov v ENO zaporedje (genom). Zadeva je povsem analogna sestavljanju puzzlov. In celoten point te novice je, da so grafični procesorji (GPU) bolj učinkoviti od centralnih (CPU) pri sestavljanju teh puzzlov. Ko maš sestavljanko z miljon kosi ali več, potrebuješ res kar precej procesorske moči.

bMozart ::

Morda je čas da spremeniš svoje mnenje in zatem narediš kaj v tej smeri... ;)
I NEED The Point of View Gun effectible on girls too! And then...

MercuryEye ::

Je res kljukusa.

Tole sem še našel - click (Entire DNA sequence now available for less than ?700).

antonija ::

HardFu je izjavil:

Nimam se za neumnega ali nerazgledanega, ampak drugi tel tele novice se mi zdi kot da bi kitajsko bral :)
Izolirana DNA izgleda kot en glorified smrkelj (to za cemer brskas po nosu). Ta blob potem zmesas z encimi ki razsekajo molekuje DNA (ja, v blobu jih je precej, so pa vse enake) na random-ish kose, katerim potem dolocis zaporedje (ne ves pa katera molekula je bila kje presekana). In iz te gore podatkov zaporedij random kosov zacetnih molekul DNA je potem treba sestavit skupaj vse konce, ki se prekrivajo. In to delajo GPUji mnogo bolje kot CPUji. Tko na hitro in zelo poenostavljeno. :)

Ponavadi si kdo napacno predstavlja da vzames "en DNA", ga razsekas in analiziras zaporedje, samo da tisti "en DNA" je precej istih molekul DNA na kupu
Statistically 3 out of 4 involved usually enjoy gang-bang experience.

Rokm ::

V bistvu v originalni novici nikjer točno ne piše katerega izmed postopkov sestavljanja genoma so uspeli pospešiti. Obstajata dva postopka: eden je zgoraj omenjeni "De novo sequencing assembly", kjer se koščke DNA zapisa sestavlja skupaj skoraj kot puzzle. Obstaja pa še drugi "Mapping assembly", kjer koščke DNA primerjamo z referenčnim genomov ter poskušamo ugotoviti lokacijo v genomu na katero se dovolj dobro prilegajo.

Sam bi pričakoval, da jim je uspelo grafične kartice sprogramirati za drugi postopek (Mapping assembly), saj ga je bolj enostavno paralelizirati, že zaradi narave algoritmov za to. Prav tako pa se ta postopek tudi več uporablja, saj ni smisla vedno delati de novo assembly, ko že imamo za neko vrsto ustvarjen referenčni genom. Lahko pa se seveda motim.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Računalniški virus v biološki DNK

Oddelek: Novice / Znanost in tehnologija
228399 (6787) DamijanD
»

Določeno gensko zaporedje konoplje (strani: 1 2 )

Oddelek: Novice / Znanost in tehnologija
8529671 (26374) antonija
»

Razvoj tehnologije v 10 letih pocenil branje DNK za več tisočkrat

Oddelek: Novice / Znanost in tehnologija
217081 (5679) Okapi
»

Kaj pomeni ustvariti umetno celico?

Oddelek: Novice / Znanost in tehnologija
3116850 (15363) Seto

Več podobnih tem