Neurónová veda o dátach: ako a prečo

Hrubý sprievodca vypracovaním údajov o neurónoch

Mozog, ktorý vedie údaje. Kredit: Mozog od Matta Wassera z Projektu podstatné meno

Ticho, tajne sa začína formovať nový typ neurovedca. Zvnútra nespočetných radov teoretikov vyvstali tímy neurovedcov, ktorí robia vedu s údajmi o neurálnej aktivite, o riedkych zväzkoch stoviek neurónov. Nie vytvorenie metód na analýzu údajov, aj keď všetky to robia tiež. Zhromažďovanie týchto údajov si nevyžaduje ďalší, impozantný súbor zručností. Neurovedci však na základe týchto údajov využívajú celú škálu moderných výpočtových techník na zodpovedanie vedeckých otázok o mozgu. Objavila sa veda o neuronálnych údajoch.

Ukázalo sa, že som jedným z nich, týmto klanom vedcov v oblasti neurónových dát. Náhodne. Pokiaľ viem, takto sa rodia všetky vedecké oblasti: náhodou. Vedci sledujú svoje nosy, začínajú robiť nové veci a zrazu zistia, že je ich malý dav v kuchyni na večierkoch (pretože tam sú nápoje, v chladničke - vedci sú inteligentní). Takže tu je malý manifest pre vedu o neuronálnych údajoch: prečo sa objavuje a ako by sme sa mohli pustiť do toho.

Dôvod je rovnaký ako všetky vedecké oblasti, ktoré vynechali vedu o údajoch: množstvo údajov sa vymklo z rúk. Pokiaľ ide o vedu o zaznamenávaní množstva neurónov, má táto záplava údajov vedecké odôvodnenie rôznych druhov. Mozgy fungujú tak, že odovzdávajú správy medzi neurónmi. Väčšina z týchto správ má formu malých impulzov elektriny: hroty, nazývame ich. Takže mnohým sa zdá logické, že ak chceme pochopiť, ako mozgy fungujú (a keď nefungujú), musíme zachytiť všetky správy odovzdávané medzi všetkými neurónmi. A to znamená zaznamenávať čo najviac hrotov z čo najväčšieho počtu neurónov.

Mozog dojčaťa má asi 130 000 neurónov a medzi nimi je najmenej 1 milión spojení; mozog čmeliaka má asi milión neurónov. Môžete vidieť, ako by sa to rýchlo vymklo z rúk. Práve teraz zaznamenávame niekde medzi desiatkami až niekoľkými stovkami neurónov pomocou štandardnej súpravy. Na hranici sú ľudia, ktorí zaznamenávajú niekoľko tisíc a dokonca niekoľko z nich získava desiatky tisíc (aj keď tieto záznamy zachytávajú aktivitu neurónov rýchlosťou oveľa pomalšou, ako by mohli neuróny posielať svoje hroty).

Nazývame tento systém šialenstva neurovedy: neurovedy, pre štúdium neurónov; systémy na odvážne nahrávať z viac ako jedného neurónu naraz. A údaje sú ohromne zložité. Máme desiatky až tisíce súčasne zaznamenaných časových radov, pričom každý z nich predstavuje prúd spikulových udalostí (skutočných špičiek alebo ich nepriamych meraní) z jedného neurónu. Podľa definície nie sú stacionárne, ich štatistiky sa časom menia. Miera ich aktivity sa rozprestierala na mnohých rádoch, od pokojných rozjímaní mníchov až po „súpravu bubnov vo veternom tuneli“. A ich vzorce činnosti siahajú od pravidelných hodín, cez koktanie a štiepanie, po striedanie medzi záchvatmi mánie a záchvatmi vyčerpania.

Teraz si vezmite, že k správaniu zvieraťa ste zaznamenali neuróny. Toto správanie predstavuje stovky pokusov o výber; alebo pohyby paží; alebo trasy vedené prostredím. Alebo pohyb zmyslového orgánu alebo celé držanie svalstva. Opakujte pre viac zvierat. Pravdepodobne viac oblastí mozgu. A niekedy celé mozgy.

Nemáme žiadnu pravdu. Neexistuje správna odpoveď; okrem údajov týkajúcich sa správania nie sú k dispozícii žiadne školiace štítky. Nevieme, ako mozgy kódujú správanie. Takže môžeme robiť veci so značkami správania, ale takmer vždy vieme, že to nie je odpoveď. Sú iba vodítka k „odpovedi“.

Systémová neuroveda je potom bohatým detským ihriskom pre tých, ktorí si môžu vziať svoje znalosti neurovedy so svojím know-how na analýzu údajov. Narodila sa veda o neuronálnych údajoch.

Ako sa to dá - alebo by sa mohlo dosiahnuť -? Tu je hrubý sprievodca. Raison d'etre z vedca neurónových údajov má klásť vedecké otázky o údajoch zo systémovej neurovedy; opýtať sa: Ako všetky tieto neuróny spolupracujú pri svojej činnosti?

Na túto otázku môžeme odpovedať zhruba tromi spôsobmi. Tieto tri spôsoby vidíme na základe korešpondencie medzi zavedenými triedami problémov strojového učenia a výpočtovými výzvami v systémovej neurovede. Začnime tým, s čím musíme pracovať.

Máme nejaké údaje z neurónov, ktoré sme zhromaždili v priebehu času. Zhromaždíme ich do matice, ktorú nazývame X - toľko stĺpcov ako neurónov a toľko riadkov, koľko času sme zaznamenali (kde je len na nás, ako dlho bude „časový bod“: mohli by sme skráťte ho a stačí mať každý záznam 1 pre bodec a inak 0. Alebo by sme to mohli skrátiť a každý záznam zaznamená počet špičiek počas uplynutého času). Za ten čas sa vo svete deje niečo - vrátane toho, čo telo robí. Vráťme to všetko do matice, ktorú nazývame S - toľko stĺpcov, koľko je vo svete prvkov, na ktorých nám záleží, a toľko riadkov, koľko bodov sme zaznamenali pre tieto funkcie.

Strojové učenie tradične zahŕňa budovanie troch tried modelov o stave sveta a dostupných údajov: generatívne, diskriminačné a hustoty. Ako hrubý sprievodca táto tabuľka ukazuje, ako každá trieda zodpovedá základnej otázke v systémovej neurovede:

1 / Modely hustoty P (X): je v hrotoch štruktúra? Znie to nudne. V skutočnosti je to však kľúč k veľkým vzorkám neurovedeckého výskumu, v ktorom chceme poznať účinok niečoho (droga, správanie, spánok) na mozog; v ktorej sa pýtame: ako sa zmenila štruktúra nervovej aktivity?

Zaznamenaním kopy neurónov môžeme na to odpovedať tromi spôsobmi.

Najprv je možné kvantifikovať sled špičky každého neurónu pomocou merania štatistík každého stĺpca X, ako je rýchlosť stúpania. A potom sa opýtajte: Aký je model P (X) pre tieto štatistiky? Tieto štatistiky môžeme zoskupiť, aby sme našli „typy“ neurónov; alebo jednoducho prispôsobiť modely celej ich spoločnej distribúcii. Či tak alebo onak, máme nejaký model štruktúry údajov na granularite jednotlivých neurónov.

Po druhé, môžeme vytvoriť generatívne modely aktivity celej populácie pomocou riadkov X - vektorov momentálnej aktivity celej populácie. Cieľom týchto modelov je obvykle pochopiť, koľko zo štruktúry X je možné vytvoriť z niekoľkých obmedzení, či už ide o rozdelenie počtu vektorov, koľko hrotov; alebo párové korelácie medzi neurónmi; alebo ich kombinácie. Tieto sú užitočné najmä na vypracovanie špeciálnej omáčky v populačnej aktivite, ak je to niečo viac ako kolektívna aktivita súboru nezávislých alebo nudne jednoduchých neurónov.

Po tretie, môžeme zaujať stanovisko, že neurónová aktivita v X je nejaká vysoko dimenzionálna realizácia nízko rozmerného priestoru, kde počet dimenzií D << n. Typicky to myslíme takto: niektoré neuróny v X sú v korelácii, takže nepotrebujeme celé X na pochopenie populácie - namiesto toho ich môžeme nahradiť oveľa jednoduchšou reprezentáciou. Mohli by sme priamo zoskupiť časové rady, takže X možno rozložiť na skupinu N menších matíc X_1 na X_N, z ktorých každá má (relatívne) silné korelácie, a preto sa s nimi dá zaobchádzať nezávisle. Alebo by sme mohli použiť nejaký prístup k zmenšeniu rozmerov, ako je Analýza hlavných komponentov, aby sme získali malú množinu časových radov, z ktorých každá popisuje jednu dominantnú formu variácie aktivity populácie v priebehu času.

Môžeme urobiť viac ako toto. Vyššie uvedené predpokladá, že chceme použiť zmenšovanie rozmerov na zrútenie neurónov - že použijeme redukciu na stĺpce X. Ale rovnako ľahko môžeme zbaliť čas tým, že použijeme zmenšovanie rozmerov na riadky X. Skôr než sa opýtať, či je neurónová aktivita nadbytočná. , pýta sa, či rôzne momenty majú podobné vzorce neurálnej aktivity. Ak je ich len niekoľko, dynamika zaznamenaných neurónov je jednoznačne veľmi jednoduchá.

Aj tu môžeme vrhať prístupy dynamických systémov. Tu sa snažíme prispôsobiť jednoduché modely zmenám v X v priebehu času (tj mapovanie z jedného riadku do nasledujúceho) a pomocou týchto modelov kvantifikovať typy dynamiky, ktorú X obsahuje - pomocou výrazov ako „atraktor“, „separatrix“, „ sedlový uzol “,„ rozdvojenie vidle “a„ kolaps Arsenalu “(iba jeden z nich nie je skutočná vec). Dalo by sa tvrdiť, že takto namontované dynamické modely sú všetky modely hustoty P (X), pretože opisujú štruktúru údajov.

Do pekla, mohli by sme sa dokonca pokúsiť prispôsobiť celý dynamický model nervového obvodu, kopu diferenciálnych rovníc popisujúcich každý neurón, do X, takže náš model P (X) sa potom vzorkuje zakaždým, keď spustíme model z rôznych počiatočných podmienok. ,

S týmito hustotnými modelmi ich môžeme prispôsobiť osobitne nervovej aktivite, ktorú sme zaznamenali v skupine rôznych stavov (S1, S2,…, Sm), a odpovedať na otázky ako: ako sa mení štruktúra populácie neurónov medzi spánkom a prebudení? Alebo počas vývoja zvieraťa? Alebo v priebehu učenia sa úlohy (kde S1 môže byť pokus 1 a S2 pokus 2; alebo S1 je relácia 1 a S2 relácia 2; alebo mnoho ich kombinácií). Môžeme sa tiež opýtať: Koľko rozmerov zahŕňa neurónová aktivita? Líšia sa rozmery medzi rôznymi oblasťami kôry? A videl niekto moje kľúče?

2 / Generatívne modely P (X | S): Čo spôsobuje bodec? Teraz hovoríme. Veci ako lineárne a nelineárne modely alebo zovšeobecnené lineárne modely. Typicky sa tieto modely aplikujú na jednotlivé neuróny, na každý stĺpec X. S nimi prispôsobujeme model, ktorý používa stav sveta S ako vstup, a vypláva sériu neurónovej aktivity, ktorá čo možno najbližšie zodpovedá aktivite neurónu. Potom, keď skontrolujeme váhu danú každému znaku S pri reprodukcii neurónovej aktivity, môžeme zistiť, o čom sa zdá, že ten neurón spôsobuje prekliatie.

Možno by sme chceli zvoliť model, ktorý má určitú flexibilitu v tom, čo sa považuje za „stav sveta“. Môžeme zahrnúť minulú aktivitu neurónu ako prvok a uvidíme, či sa zaujíma o to, čo sa stalo v minulosti. Pre niektoré typy neurónov je odpoveďou áno. Prasknutie môže mať veľa z neurónu, a musí si ľahnúť na odpočinok, kým to môže ísť znova. Môžeme tiež uvažovať širšie a zahrnúť zvyšok populácie - zvyšok X - ako súčasť stavu sveta S, zatiaľ čo sa vystrelí neurón. Koniec koncov, neuróny príležitostne ovplyvňujú palbu druhých, alebo tak som presvedčený. Existuje teda malá šanca, že odozva neurónu vo vizuálnej kôre nie je poháňaná iba orientáciou okraja vo vonkajšom svete, ale môže tiež závisieť od toho, čo robí 10000 kortikálnych neurónov, ktoré sa k nemu pripájajú. To, čo sa potom naučíme, sú približne najvplyvnejšie neuróny v populácii.

Tieto generatívne modely nemusíme uplatňovať na jednotlivé neuróny. Môžeme ich rovnako uplatniť na naše modely hustoty; môžeme sa opýtať, čo každý klaster alebo dimenzia kóduje o svete. Alebo, ako tu niektorí ľudia robia, môžeme použiť samotný model hustoty ako stav sveta a opýtať sa, o čom vlastnosti tohto modelu po neurónoch vedú zatraceně.

Typy otázok, na ktoré môžeme odpovedať pomocou týchto generatívnych modelov, sú celkom zrejmé: Aká kombinácia funkcií najlepšie predpovedá odpoveď neurónov? Existujú neuróny selektívne len pre jednu vec? Ako sa neuróny vzájomne ovplyvňujú?

3 / Diskriminačné modely P (S | X): Aké informácie nesú hroty? Toto je hlavná otázka v systémovej neurovede, pretože je to výzva, ktorej čelia všetky neuróny, ktoré sú po prúde od našej zaznamenanej populácie - všetky neuróny, ktoré prijímajú vstupy od neurónov, z ktorých sme zaznamenali a ktoré boli vyplnené do našej matice X. Pre tie neuróny, ktoré po prúde nasledujú, musia odvodiť, čo Potrebujú vedieť o vonkajšom svete založenom výlučne na špičkách.

Tu môžeme použiť štandardné klasifikátory, ktoré mapujú vstupy na označené výstupy. Môžeme použiť riadky X ako vstup, každý snímku aktivity populácie, a pokúsiť sa predpovedať jeden, niektoré alebo všetky funkcie v zodpovedajúcich riadkoch S. Prípadne s určitým časovým oneskorením, takže použijeme riadok X_t na predpovedať stav S_t-n, ktorý bol v minulosti n krokmi, ak nás zaujíma, ako stavové kódy populácií vstupujú do mozgu; alebo môžeme použiť riadok X_t na predpovedanie stavu S_t + n, čo je v budúcnosti n krokov, ak sa zaujímame o to, ako populácie kódujú určitý vplyv mozgu na svet. Rovnako ako činnosť v motorickej kôre, ktorá sa deje predtým, ako napíšem každé písmeno práve teraz.

V každom prípade berieme niekoľko (ale nie všetky, pretože nepreplývame) riadky X a trénujeme klasifikátor, aby našiel najlepšie možné mapovanie X na zodpovedajúci kúsok S. Potom tester testujeme, ako dobre to môže predpovedajte zvyšok S od zodpovedajúceho zvyšku X. Ak máte mimoriadne šťastie, vaše X a S môžu byť také dlhé, že ich dokážete rozdeliť do vlaku, testovať a overovať. Posledné uchovajte v uzamknutej krabici.

Samozrejme by sme mohli použiť taký silný klasifikátor, aký sa nám páči. Od logistickej regresie, cez bayesovské prístupy, až po použitie 23-vrstvovej neurónovej siete. Závisí to skôr od toho, čo chcete z odpovede, a od kompromisu medzi interpretovateľnosťou a silou, s ktorou ste spokojní. Moje spisy inde objasnili, na ktorej strane tohto kompromisu mám sklon uprednostňovať. Ale som šťastný, že sa mi ukázalo zle.

Kódujúce modely neurónov sú dômyselné, ale dotýkajú sa niektorých starých a hlbokých filozofických quandárov. Testovacie kódovanie pomocou diskriminačného modelu predpokladá, že niečo v smere toku sa snaží dekódovať S z neurálnej aktivity. S tým sú spojené dva problémy. Neuróny sa nedekódujú; neuróny prijímajú hroty ako vstup a výstup svojich vlastných hrotov. Skôr znovu kódujú z jednej sady hrotov na inú sadu hrotov: možno menej alebo pomalšie; možno viac alebo rýchlejšie; možno zo stabilného prúdu do kmitania. Diskriminačné modely sa teda presnejšie pýtajú, aké informácie naše neuróny opätovne kódujú. Ale aj keď sa pozrieme na tento názor, je tu hlbší problém.

Až na niekoľko málo výnimiek neexistuje nič také ako „downstream“ neurón. Neuróny, ktoré sme zaznamenali v X, sú súčasťou zložito zapojeného mozgu, plného nekonečných slučiek; ich výstup ovplyvňuje ich vlastný vstup. Horšie je, že niektoré z neurónov v X sú downstream od ostatných: niektoré z nich vstupujú priamo do ostatných. Pretože, ako je uvedené vyššie, neuróny sa vzájomne ovplyvňujú.

Hrubý, možno užitočný manifest pre vedu o neuronoch. Je neúplný; nepochybne je niečo vyššie nesprávne (odpovede na pohľadnici na obvyklú adresu). Vyššie uvedené je pokus o syntézu práce skupiny laboratórií s veľmi rozdielnymi záujmami, ale spoločnou snahou o použitie týchto druhov modelov na veľkých súboroch neurálnych údajov na zodpovedanie hlbokých otázok o tom, ako mozgy fungujú. Mnohé z nich sú dátové laboratóriá, tímy, ktoré analyzujú experimentálne údaje, aby zodpovedali na svoje vlastné otázky; aby sme vymenovali aspoň niektoré - Johnathan Pillow; Christian Machens; Konrad Kording; Kanaka Rajan; John Cunningham; Adrienne Fairhall; Philip Berens; Cian O'Donnell; Il Memming Park; Jakob Macke; Gasper Tkacik; Oliver Marre. Hm, ja. Ďalšími sú experimentálne laboratóriá so silným sklonom k ​​vedám o údajoch: Anne Churchland; Mark Churchland; Nicole Rust; Krishna Shenoy; Carlos Brody; veľa ďalších sa ospravedlňujem za to, že ich nepomenovali.

Existujú konferencie, na ktorých je takáto práca vítaná, dokonca nie je povzbudivá. Časopis pre vedu o neuronoch je na ceste. Niečo sa stavia. No tak, dáta sú krásne *.

* Áno, musel som hovoriť o údajoch ako o jednotnom čísle, aby som vedel, že ten svinsky vtip bude fungovať. Skutočnosť, že píšem túto poznámku pod čiarou, aby som to vysvetlil, vám dá nejakú predstavu o náročnej pozornosti, ktorú vedci očakávajú od podrobností.

Chcieť viac? Nasledujte nás v The Spike

Twitter: @markdhumphries