Finale Studentenprojekte - Data Science Bootcamp #12

von Badru Stanicki

Data Science Projektpräsentationen
Eines der grössten Highlights unseres 12-wöchigen Data Science Immersive Programms ist die abschliessende Projektphase! Während dieser Zeit haben unsere Studenten die einzigartige Gelegenheit, praktische datenwissenschaftliche Probleme zu lösen, die von Unternehmen und Forschungsinstituten in der ganzen Schweiz zur Verfügung gestellt werden. Dies ist ein sehr wichtiger Teil unseres Lehrplans, denn an der Constructor Academy liegt uns sehr viel daran, den Studenten die spezifischen Fähigkeiten zu vermitteln, die derzeit in der Industrie gefordert werden und die für die Lösung sinnvoller Probleme unerlässlich sind. In den letzten 3,5 Wochen erlebten unsere Studenten den gesamten datenwissenschaftlichen Prozess von der Definition des Geschäftsproblems ihres Kunden, über die Untersuchung der Daten zur Anwendung geeigneter maschineller Lerntechniken, bis hin zur Lieferung eines funktionsfähigen Prototyps an das Unternehmen. Der Höhepunkt all der harten Arbeit, welcher in diesen Meilensteinprojekten steckt, ist die finale Präsentation vor Familie, Freunden, Unternehmen, Studenten und jedem, der daran teilnehmen möchte. Du kannst dich ganz einfach über Meetup für die nächsten Präsentationen registrieren.

Um eine Vorstellung davon zu geben, wie diese Projekte aussehen können, möchten wir in diesem Beitrag eine kurze Beschreibung der Projekte geben, die von unseren Studenten abgeschlossen wurden (Batch 12: 31. August - 20. November 2020). 
 

Aison Technologies - ML-basierte Segmentierung von Weichteilgewebe aus Ultraschallbildern

Studenten: Leticia Fernandez Moguel, Nicolas Bernath, Roman Grisch

Studentenprojekt Aison Technologies

Ultraschall (US) ist in allen Bereichen der Medizin zu einem immer beliebteren Instrument zur Darstellung von Weichgewebe geworden. Die Aufgabe, Gewebe wie Fett, Muskeln, Sehnen, Bänder im Ultraschallbild zu identifizieren, erfordert jedoch einen ausgebildeten Spezialisten und ist in der Regel zu interpretieren. In diesem Projekt haben Roman Grisch, Nicolas Bernath und Leticia Fernandez Moguel ein tiefgehendes Lernmodell mit einer UNET-Architektur verwendet, um ein Werkzeug zu entwickeln, das den Gewebetyp aus Ultraschallbildern identifiziert. Der beabsichtigte Zweck dieser Modellvorhersagen wird es sein, Gesundheitsdienstleistern zu helfen, Körperteile in den US zu identifizieren, wobei gleichzeitig auch erwähnt wird, dass die medizinische Diagnose weiterhin in den Händen der Ärzte bleibt.

Thomson Reuters - Extraktion von Fakten aus Rechtsdokumenten

Studentin: Namrata Gurung

Studentenprojekt Thomson Reuters

Ziel des Projekts war die Unterstützung des laufenden Projekts von Thomson Reuters Labs, das NLP-Tiefenlernmodelle verwendet, um automatisch relevante Metadatenfelder (wie Gerichtsname, Anmeldedatum, Namen von Klägern und Beklagten usw.) aus Rechtsdokumenten zu extrahieren. Zu diesem Zweck führte Namrata Gurung mehrere NLP-Tiefenlernexperimente durch. Das erste bestand darin zu experimentieren, ob mehrere existierende Zeiger-Generator-Modelle zu einem einzigen kombiniert werden können, und das zweite sollte feststellen, ob das Training an Transformator-Modellen zu einer Verbesserung führt. Das zweite Experiment ist noch nicht abgeschlossen. Die vorläufigen Ergebnisse aus dem ersten Experiment sehen jedoch vielversprechend aus, und wenn das neue Modell die bisherige Modellarchitektur übertrifft, gibt es Möglichkeiten für seinen Einsatz im Rahmen des Projekts der Thomson Reuters Labs.
 

ETH Library Lab - Automatisierte Kennzeichnung von Pflanzenexemplaren

Studenten: Lindsey Parkinson, Matteo Jucker Riva

Studentenprojekt ETH Library Lab

Schweizer Botaniker sammeln und trocknen seit über zweihundert Jahren Pflanzen mit intakten Blüten und Früchten. Heute sind viele dieser Pflanzen eine hervorragende wissenschaftliche Ressource, die in den gemeinsamen Herbarien der ETH und der Universität Zürich aufbewahrt werden. Es ist unpraktisch, jedes einzelne der zehntausenden Exemplare von Hand zu überprüfen. Lindsey und Matteo schufen ein Modell, um 1) festzustellen, ob ein Pflanzenexemplar aus der Familie der Brassicacea Blüten oder Früchte hatte, und 2) die Anzahl der Blüten oder Früchte zu zählen. Mit diesen Informationen und dem Datum, an dem die Pflanze gesammelt wurde, können moderne Botaniker messen, wie sich die Blütezeiten seit den frühen 1800er Jahren verändert haben.
  

CrystalsFirst - Proteinkristall-Erkennung

Studenten: Claudio CunhaLinda Wymann

Studentenprojekt CrystalsFirst

Die CrystalsFirst GmbH ist ein biopharmazeutisches Start-up-Unternehmen, das Machine Learning mit ihrer firmeneigenen Labortechnologie kombiniert, um neue Medikamente zu entwickeln. Neue Medikamente werden geschaffen, indem neue Proteinstrukturen gefunden werden, die wiederum durch die Kristallisation dieser Proteine erreicht werden können. Gegenwärtig durchsucht ein Kristallograph der CrystalsFirst GmbH manuell Tausende von Well-Bildern, um genau diese Kristalle zu finden. Sie kommen selten vor, und die Arbeit ist mühsam und zeitaufwendig. Das Ziel von Linda Wymann und Claudio Cunhia war es, ein tiefes neuronales Netzwerk zu trainieren, um zu lernen, zwischen Kristall- und Nicht-Kristallbildern zu unterscheiden und dadurch die manuelle Arbeit in der Firma zu verringern. Das endgültige Modell war in der Lage, 9 von 10 Bildern korrekt als Kristalle vorherzusagen und interpretierte die nicht-kristallinen Bilder auf dem Testsatz immer korrekt. Das Modell wird in die Google Cloud AI-Plattform implementiert werden und die Arbeitseffizienz im Unternehmen verbessern. Die CrystalsFirst GmbH wird in der Lage sein, das Modell weiter zu verbessern und zu trainieren, indem sie den ihr zur Verfügung gestellten Code verwendet.

Yamo - Eltern und Babies glücklich machen

Studenten: Gianluca BadjanMatthias Weber

Studentenprojekt Yamo

Die Vorhersage der Kundenabwanderung ist der Schlüssel zur Verbesserung der Kundenbindung und der Einnahmen, während gleichzeitig die Gesamtkosten für die Kundenakquisition niedrig gehalten werden.

Yamo ist ein Startup-Unternehmen, das gesunde Bio-Nahrung für Babys und Kleinkinder, die zu Hause entbunden werden, durch Abonnements (Food-as-a-Service) oder Einzelkäufe anbietet. Matthias Weber und Gianluca Badjan standen vor der Herausforderung, die Kundenabwanderung durch die Anwendung des maschinellen Lernens auf Verkaufsdaten vorherzusagen und gleichzeitig Erkenntnisse darüber zu gewinnen, was die Kundenabwanderung vorantreibt. Die erstellten Modelle müssen weiter entwickelt werden, insbesondere hinsichtlich der Integration neuer Datenquellen und alternativer Ansätze, damit Yamo in der Lage ist, Kunde für Kunde Massnahmen zu ergreifen.
 

Universität Freiburg - I-dental-fication: Wie fragt man einen Körper, wie alt er ist?

Studenten: Thomas OliverTomasz Siczek

Studentenprojekt University of Freiburg

Die Universität Freiburg arbeitet an der Verbesserung des Verfahrens der Annullierung von Zahnzement, oder auch Tooth Cementum Annulation (TCA) genannt, einer Methode zur Berechnung des Alters eines Individuums ähnlich der Jahrringzählung. Bei dem derzeitigen Verfahren werden schwer erkennbare Zahnringe manuell gezählt, ein Prozess, der Stunden dauert und eine Kreuzvalidierung erfordert. Die Universität beauftragte Thomas Oliver und Tomek Siczek, zu prüfen, ob der Prozess durch den Aufbau eines Deep Learning Modells verbessert werden könnte. Dieses Modell würde aus den Bildern lernen und schneller ein Ergebnis liefern, als es ein Mensch könnte. Obwohl das Modell nicht besser sein konnte als ein menschliches Zählwerk, waren die Studenten in der Lage, einen Prozess zu entwickeln, um Bilder nur mit dem Zahnzement mit einer Genauigkeit von 91% zu erstellen. Mit besseren Bildern sind die beiden zuversichtlich, dass der Einsatz von Deep Learning für die TCA ein erreichbares Ziel ist.

Ein grosses Dankeschön geht an alle Partnerfirmen und Institute, welche uns spannende Projektideen geliefert haben und natürlich an all unsere Studenten für die tolle Zusammenarbeit in den letzten drei Monaten. Im Namen von Constructor Academy gratulieren wir zu den ausgezeichneten Endergebnissen der Projekte.

Möchtest du mehr über die Constructor Academy und technikbezogene Themen lesen? Dann finde hier weitere spannende Blogbeiträge.

Mehr Infos
Blog