Project Discovery – steigt zu neuen Höhen auf!
Hallo Kapselpiloten,
es ist an der Zeit, eure Leistungen in Project Discovery auf ein noch höheres Level zu bringen, denn die kommenden Daten werden komplexer sein, wodurch die resultierenden Erkenntnisse für die Wissenschaft noch aussagekräftiger werden! Als unsterbliche Pioniere New Edens habt ihr bereits jetzt selbst die höchsten Erwartungen für dieses Projekt übertroffen. Diese hohen Erwartungen waren ein Resultat eurer ausgezeichneten Arbeit in vorherigen Erscheinungen von Project Discovery.
„Wir arbeiten seit fünf Jahren an Project Discovery und es ist unglaublich zu sehen, wie die Spieler der EVE-Community selbst nach all dieser Zeit immer noch unermüdlich an den Forschungsarbeiten teilnehmen. Gerade in diesen schwierigen Zeiten ist diese Zusammenarbeit besonders wichtig und kostbar. Ich danke euch allen!“ – MMOS-CEO und -Co-Gründer Attila Szantner
Während des Designprozesses und der Implementierung der neusten Version von Project Discovery haben wir viel über Durchflusszytometrie und Zellenpopulationen gelernt. Es war uns möglich, Inhalte ansprechend zu gestalten und unseren Wissenschaftlern gleichzeitig genaue Resultate zu liefern. In Anbetracht der 39,6 Millionen Einsendungen seit Beginn des Projekts können wir guten Gewissens behaupten, dass die Spieler von EVE Online ihren Teil im Kampf gegen COVID-19 beigetragen haben.
„Die Menge und Qualität der Daten, die von der EVE-Community erhoben wurden, sind wirklich erstaunlich und übersteigen all unsere Erwartungen. Wir freuen uns, diese einzigartige Quelle an Informationen als direkten Beitrag zur biomedizinischen Forschung zu nutzen.“ – Jérôme Waldispühl, Dozent der School of Computer Science, McGill University
Mit 466.000 bestätigten Datenerhebungen, die bereits jetzt für die Wissenschaft genutzt werden können, können wir außerdem behaupten, dass eine solche Anzahl an Datensätzen mit diesem Grad an Genauigkeit ohne die Anstrengungen von EVEs engagierten Spielern weltweit nicht möglich gewesen wäre. Doch in Anbetracht der noch immer hohen Anzahl an Datensätzen, die wir stetig erhalten, ist es an der Zeit, die Genauigkeit der Daten weiter zu erhöhen.
Als wir das Projekt starteten, war das Ziel, euch zu zeigen, wie man spezielle Populationen in Durchflusszytometrie-Graphen kennzeichnet, und die resultierenden analysierten Graphen an CCPs Partner von UNIMORE, MMOS, McGill und der University of British Columbia zu senden. Unsere Partner konnten diese Daten dann nutzen, um ein besseres Verständnis von COVID-19 zu erlangen. In diesem Bereich der Forschung wurden bereits grundlegende Fortschritte gemacht. Wenn ihr gerne mehr über dieses Thema erfahren wollt, hört gerne in diesen Podcast rein oder besucht McGills Webseite zu diesem Projekt. Allerdings war uns immer bewusst, dass wir irgendwann unsere Herangehensweise verfeinern müssten, und diese Zeit ist jetzt gekommen.
„Die Spieler von EVE Online leisten herausragende Arbeit. Die Genauigkeit ihrer Analysen ist überaus hoch, was von einem überragenden Einsatz für dieses Projekt zeugt, das in Wahrheit nicht einfach nur Teil eines Spiels, sondern Teil des echten Kampfs gegen COVID ist. Spieler von überall auf der Welt haben bewiesen, dass die Zusammenarbeit mit Wissenschaftlern überaus erfolgreich ist und dass wir in solch einer schwierigen und unsicheren Zeit zusammen viel erreichen können.“ – Dr. Andrea Cossarizza, Professor der Pathologie und Immunologie an der University of Modena und Reggio Emilia School of Medicine in Italien
Die Teilnehmer von Project Discovery haben in den letzten drei Monaten unschätzbare Durchflusszytometrie-Daten erhoben. Unsere wissenschaftlichen Partner haben basierend auf ihrer jahrelangen Laborerfahrung nach der Zusammenstellung und Überprüfung der Daten jedoch eine weitere Herausforderungen für euch. Versucht, noch genauere Graphen zu produzieren. Um dies zu erreichen, müsst ihr noch mehr über Durchflusszytometrie und die genutzten Diagramme und deren Verbesserungspotenzial erfahren.
Die erhobenen Daten der meisten von Kapselpiloten analysierten Diagramme sind die bestmöglichen ihrer Art. Alle Graphen, die wie die folgenden aussehen, werden bereits fachgerecht analysiert. Ändert eure Herangehensweise bei diesen Graphen nicht.
Wir erhoffen uns, das Clustering in Diagrammen zu verbessern, die wie diese zwei aussehen. Solche Graphen sind schwerer zu analysieren. Dies liegt an den Eigenarten bei der Übertragung von echten Blut- und Zellproben in zweidimensionale Graphen.
Fangen wir am besten damit an, was Proben vom Typ A so besonders macht: ihr markanter Schweif. Diesen Schweif bezeichnet man in der Durchflusszytometrie als „Smear“ – das dünne Band von Zellen an den Seiten des dichten Clusters, das wichtige Informationen über die Auswirkungen von COVID-19 auf Zellen beinhaltet. Das Vorhandensein von Smears bedeutet, das Zellen langsam altern und dass es viele Zellen zwischen den Stadien ‚neu‘ und ‚reif‘ gibt. Kurz gesagt sind dort viele Zelltypen zu finden, auch wenn nicht so viele Punkte im Diagramm auftauchen. Herauszufinden, wo die Populationen sind, das heißt, wo die „Cluster“ von Zellen sind, ist äußerst wichtig, um zu verstehen, wie Virusinfektionen Zellenpopulationen beeinflussen. Diese Arten von Diagrammen sind überaus wichtig und obwohl es auf den ersten Blick nicht so scheint, kann man aus ihnen viele Informationen über Zellen herauslesen.
Proben von Typ A sind außerdem aufgrund einer Entscheidung bezüglich der Visualisierung, die von CCP zusammen mit MMOS und den Wissenschaftlern getroffen wurde, schwer zu interpretieren. Es wurde entschieden, auf die Intervallmarkierungen auf beiden Seiten des Diagrammes zu verzichten. Wir entschieden uns für das Entfernen der Beschriftung dieser Graphen zum einen, um Botting vorzubeugen, und zum anderen, um den Prozess benutzerfreundlicher zu gestalten. Dabei wurden außerdem die Skalenstriche entfernt, was wichtig ist, da alle Graphen, die wir erhalten haben, auf logarithmische Achsen projiziert wurden. Dies bedeutet, dass mit dem Erhöhen der Zahl auf den Intervallmarkierungen exponentiell mehr Proteine in diesem Teil der Zelle sind. Ein Punkt wird zu 1000 Proteinen, wenn er in Proben vom Typ A beim Skalenstrich „3“ liegt. Das bedeutet also, dass ein Punkt in der oberen rechten Ecke eines Diagramms gleichwertig mit tausenden Punkten der unteren linken Ecke ist.
Wie beeinflusst das also jetzt das Clustering durch Kapselpiloten? Einfach gesagt ist es wichtig, Smears von dichten Clustern zu trennen. Anstatt Diagramme zu erstellen, die so aussehen, …
… müssen wir Diagramme erstellen, die so aussehen:
Dies ist relativ einfach bei Diagrammen wie dem obigen, bei dem die Ausrichtung des seitlichen Smears mit der des dichten Clusters übereinstimmt. In diesem Fall müsst ihr lediglich den unteren Smear abgrenzen, indem ihr euer Polygon nach dem unteren Ende des entgegengesetzten Smears ausrichtet. Versucht, eure Cluster zu spiegeln. Bei Proben wie der folgenden wird es allerdings etwas komplizierter:
Hier ist der linke seitliche Smear wesentlich kleiner als der andere und würde beim Spiegeln in den dichten Cluster ragen. Das solltet ihr nicht tun. Stellt euch diese Proben stattdessen wie Kometen vor, bei denen ihr Körper und Schweif voneinander trennen wollt. Dies wird zu noch aussagekräftigeren Daten über diese besonderen Zellenpopulationen führen.
Neben Kometendiagrammen ist es auch wichtig, auf Diagramme vom Typ B und deren bessere Cluster-Möglichkeiten hinzuweisen. Wie oben zu sehen ist, wirken diese Zytometriediagramme wie eine Verschmelzung verschiedener Zellpopulationen. Bis jetzt haben Kapselpiloten beim Abgrenzen der linken und rechten Seite sowie der Mitte von Graphen des Typs B fantastische Arbeit geleistet. Allerdings gibt es, wie ihr sehen könnt, einen Cluster von Datenpunkten, der aus dem Bereich mit hohem Clustering herauszurutschen scheint. Stellt euch diese Zellen wie rebellische Zellen vor, die darum bemüht sind, aus dem größeren Cluster auszubrechen. Sie müssen darum als komplett eigenständige Gruppe kategorisiert werden.
Um dies zu tun, müsst ihr lediglich das Polygon an der dünnsten Stelle zwischen den beiden Clustern markieren. Wenn sich dies als schwierig erweist, versucht beide Cluster übereinander zu spiegeln und zieht dann eine Trennlinie durch die Mitte des Spiegelbilds.
Nach diesen Erläuterungen sei erneut gesagt, dass es einfach erstaunlich ist, wie viele gute Proben die Spieler von EVE Online bereits eingereicht haben. Es besteht kein Zweifel, dass ihr auch der Herausforderung gewachsen seid, selbst die komplexesten Datensätze von Project Discovery genau aufzubereiten.
„Dieses Projekt hat meine Erwartungen weit übertroffen und die Spieler zeigen weiterhin reges Interesse an unserer Arbeit. Sie lassen uns weiterhin große Mengen qualitativ hochwertiger Daten für unsere Forschung zukommen. Ihre Bemühungen werden nicht nur dazu beitragen, COVID-19 besser zu verstehen, ihre gesammelten Daten werden außerdem der gesamten wissenschaftlichen Gemeinschaft zur Verfügung gestellt. Es besteht großes Interesse daran, ihre Daten auch zur Entwicklung von Algorithmen für maschinelles Lernen zu verwenden. Es gibt da draußen ganz einfach keine vergleichbare Quelle, die bezüglich Datengewinnung auch nur ansatzweise an diese heranreicht.“ – Dr. Ryan Brinkman, Professor der medizinischen Genetik, University of British Columbia, anerkannter Wissenschaftler bei BC Cancer