Nowy typ sieci neuronowej przychodzi z pomocą wielkiej fizyce

0
108

Graham próbował zmodyfikować podejście CNN, tak aby jądro było umieszczane tylko na fragmentach obrazu o wymiarach 3 na 3, które zawierają co najmniej jeden piksel o wartości niezerowej (i nie jest po prostu pusty). W ten sposób udało mu się stworzyć system, który mógł skutecznie identyfikować chiński odręcznie pisany. Wygrał konkurs w 2013 roku, identyfikując poszczególne postacie ze wskaźnikiem błędu wynoszącym zaledwie 2,61 procent. (Ludzie uzyskali średnio 4,81 procent). Następnie zwrócił uwagę na jeszcze większy problem: rozpoznawanie obiektów trójwymiarowych.

Do 2017 roku Graham przeniósł się do Facebook AI Research i dalej udoskonalił swoją technikę oraz opublikował szczegóły pierwszego SCNN, w którym jądro było wyśrodkowane tylko na pikselach o wartości niezerowej (zamiast umieszczania jądra na jakimkolwiek 3 na 3 sekcja, która miała co najmniej jeden „niezerowy” piksel). To była ogólna idea, którą Terao wniósł do świata fizyki cząstek elementarnych.

Strzały z podziemia

Terao jest zaangażowany w eksperymenty w Fermi National Accelerator Laboratory, które badają naturę neutrin, należących do najbardziej nieuchwytnych znanych cząstek elementarnych. Są to również najobficiej występujące cząstki we wszechświecie o masie (choć niewiele), ale rzadko pojawiają się w detektorze. W rezultacie większość danych do eksperymentów z neutrinami jest skąpa, a Terao nieustannie poszukiwał lepszych podejść do analizy danych. Znalazł jeden w SCNN.

W 2019 roku zastosował SCNN do symulacji danych oczekiwanych z Deep Underground Neutrino Experiment lub DUNE, który będzie największym na świecie eksperymentem fizyki neutrin, gdy zostanie udostępniony online w 2026 roku. Projekt będzie strzelał neutrinami z Fermilab, niedaleko Chicago, przez 800 mil ziemi do podziemnego laboratorium w Południowej Dakocie. Po drodze cząstki będą „oscylować” między trzema znanymi typami neutrin, a te oscylacje mogą ujawnić szczegółowe właściwości neutrin.

SCNN analizowały symulowane dane szybciej niż zwykłymi metodami i wymagały przy tym znacznie mniejszej mocy obliczeniowej. Obiecujące wyniki oznaczają, że sieci SCNN będą prawdopodobnie wykorzystywane podczas rzeczywistego przebiegu eksperymentu.

Tymczasem w 2021 roku Terao pomógł dodać SCNN do innego eksperymentu z neutrinami w Fermilab, znanego jako MicroBooNE. Tutaj naukowcy przyglądają się następstwom zderzeń neutrin z jądrami atomów argonu. Badając ślady utworzone przez te interakcje, naukowcy mogą wywnioskować szczegóły dotyczące oryginalnych neutrin. Aby to zrobić, potrzebują algorytmu, który może spojrzeć na piksele (lub technicznie ich trójwymiarowe odpowiedniki zwane wokselami) w trójwymiarowej reprezentacji detektora, a następnie określić, które piksele są powiązane z trajektoriami cząstek.

Ponieważ dane są tak rzadkie — niewielka liczba małych linii w dużym detektorze (około 170 ton ciekłego argonu) — sieci SCNN są prawie idealne do tego zadania. W przypadku standardowego CNN obraz musiałby zostać podzielony na 50 części ze względu na wszystkie obliczenia do wykonania, powiedział Terao. „Dzięki rzadkiemu CNN analizujemy cały obraz naraz – i robimy to znacznie szybciej”.

Terminowe wyzwalacze

Jednym z badaczy, którzy pracowali nad MicroBooNE, był stażysta Felix Yu. Będąc pod wrażeniem mocy i wydajności SCNN, zabrał ze sobą narzędzia do swojego następnego miejsca pracy jako absolwent laboratorium badawczego na Harvardzie formalnie powiązanego z IceCube Neutrino Observatory na biegunie południowym.

Jednym z kluczowych celów obserwatorium jest przechwytywanie najbardziej energetycznych neutrin we wszechświecie i śledzenie ich z powrotem do ich źródeł, z których większość znajduje się poza naszą galaktyką. Detektor składa się z 5160 czujników optycznych zakopanych w lodzie Antarktydy, z których tylko niewielka część zapala się w danym momencie. Reszta tablicy pozostaje ciemna i nie jest szczególnie pouczająca. Co gorsza, wiele „zdarzeń” rejestrowanych przez detektory to fałszywe alarmy i nieprzydatne do polowania na neutrina. Tylko tak zwane zdarzenia na poziomie wyzwalacza nadają się do dalszej analizy i należy natychmiast podjąć decyzje, które z nich są godne tego oznaczenia, a które będą trwale ignorowane.

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj