Eines der grössten Highlights unseres 12-wöchigen
Data Science Immersive Programms ist die Capstone-Projektphase! Während dieser Zeit haben unsere Studenten die einzigartige Gelegenheit, praktische Data Science-Probleme zu lösen, die von Unternehmen und Forschungsinstituten in der ganzen Schweiz zur Verfügung gestellt werden. Dies ist ein grundlegender Teil unseres Lehrplans, da es uns bei der Constructor Academy sehr am Herzen liegt, den Studenten die spezifischen Fähigkeiten zu vermitteln, die derzeit in der Industrie gefragt sind und die für die Lösung sinnvoller Probleme unerlässlich sind. In den letzten 3,5 Wochen erlebten unsere Studenten den kompletten Data Science-Prozess, von der Definition des Geschäftsproblems ihres Kunden über die Untersuchung der Daten zur Anwendung geeigneter Machine Learning-Techniken bis hin zur Lieferung eines funktionalen Prototyps an das Unternehmen. Der Höhepunkt all der harten Arbeit, die in diesen Capstone-Projekten steckt, ist eine öffentliche Präsentation vor Familienmitgliedern, Freunden, Unternehmen, Studenten und allen, die dabei sein wollen. Du kannst dich für die nächsten Präsentationen einfach über die Constructor Academy Meetup-Seite anmelden.
Constructor Academy's Data Science Batch #13 (9. November 2020 - 12. Februar 2021) arbeitete an sechs Projekten, die von unseren Industriepartnern, wie Swiss Data Alliance, Pipra, ecoinvent und Syngenta, zur Verfügung gestellt wurden. Lies unten mehr über die einzelnen Projekte.
Data Innovation Alliance - Web-Scraping und Visualisierung für DataInnovation
Die Data Innovation Alliance ist eine Organisation, die Innovation und Zusammenarbeit innerhalb des Datensektors fördert. Dazu veranstaltet sie Workshops und Konferenzen und bringt Organisationen und Universitäten mit ähnlichen Interessen zusammen, um neue datenzentrierte Produkte zu entwickeln.
In diesem Projekt entwarf Tiffany interaktive Visualisierungen für die Webseite der Alliance. Sie sammelte Informationen durch Web Scraping mit Python, wendete natürliche Sprachverarbeitung an, um die Informationen zu klassifizieren, und visualisierte ihre Ergebnisse mit D3.js.
1) Dies ist ein kräfteorientierter Graph; er zeigt die Beziehungen zwischen allen Projekten und den beteiligten Organisationen.
2) Diese Visualisierung ist ein Kreis-Packing-Diagramm, das die 13 datenbezogenen Expertengruppen als grosse Blasen darstellt. Jede dieser Blasen enthält mehrere kleinere Blasen, die verschiedene Projekte darstellen, die mit dieser Expertengruppe verbunden sind. Es wurde ein NLP-Modell entwickelt, um die Zuordnung jedes Projekts zu einer bestimmten Expertengruppe vorherzusagen.
PIPRA - Präzisionsmedizin: Vorhersage des postoperativen Deliriums (pod) mit ML-Modellen
Mehr als 40% der Patienten über 60 Jahre sind von der kognitiven Störung Postoperatives Delirium (POD) betroffen. Patienten, die unter dieser kognitiven Störung leiden, können Desorientierung, Sprachschwierigkeiten und sogar Gedächtnisverlust erleben, was oft zu längeren Krankenhausaufenthalten, höheren Krankenhauskosten und geringerer Lebensqualität führt.
Um Ärzte bei ihren medizinischen Entscheidungen zu unterstützen, entwickelten Elena, Daniel und Zana eine auf maschinellem Lernen basierende Lösung, um das Risiko eines Patienten, eine POD zu entwickeln, vor einer Operation zu bewerten. Sie verwendeten ein Entscheidungsbaummodell in Kombination mit dem KI-Erklärbarkeitsmodell SHAP, das die spezifischen Merkmale der medizinischen Daten des Patienten identifiziert, die zur endgültigen Vorhersage beitragen. Mit diesem Wissen haben Ärzte die Möglichkeit, eine alternative Präventivmassnahme für einen Patienten zu wählen, bevor sie mit der Operation fortfahren.
ecoinvent - Automatisierte Datenvisualisierung
Unternehmen sind zunehmend daran interessiert, die Auswirkungen eines Produkts auf die Umwelt von Anfang bis Ende zu verstehen. Zu diesem Zweck stellt
ecoinvent Tausenden von Unternehmen wie Toyota, Lego und Procter & Gamble sowie Regierungsorganisationen und Universitäten eine umfassende Ökobilanzdatenbank zur Verfügung. Obwohl die Datensätze für sich genommen verständlich sind, können die zugrundeliegenden Berechnungen und Methoden, die zur Abschätzung der Umweltauswirkungen verwendet werden, komplex und für die meisten Menschen überwältigend zu verstehen sein.
In diesem Projekt halfen Angela und Sarah ecoinvent dabei, ihre ganzheitlichen Berichte benutzerfreundlicher zu gestalten, indem sie Datenvisualisierungen hinzufügten, die die Auswirkungen und die Netzwerkstruktur von Produktionsketten darstellen. Die grösste Herausforderung bestand darin, diese Visualisierungen für ca. 60’000 verschiedene Datensätze einheitlich zu gestalten und dabei die wichtigsten Informationen hervorzuheben. Das in diesem Projekt erstellte Python-Skript wird in den automatischen PDF-Generator von ecoinvent integriert und erreicht damit tausende von Kunden.
Constructor Academy - Empfehlungen für Marketingkampagnen unter Verwendung der Online-Verkehrsdaten von Constructor Academy
In den gängigsten Suchmaschinen auf den vorderen Plätzen zu ranken, ist für die meisten Unternehmen eine einflussreiche Online-Marketing-Strategie. In diesem Projekt für die Constructor Academy identifizierte Pawinee systematisch Keywords, die mit Suchmaschinenanfragen von potenziellen Kunden übereinstimmen. Sie begann mit einer umfassenden Analyse der Keywords, die für das Kursangebot von Constructor Academy (Englisch & Deutsch) relevant sind, um die besten Keywords zu identifizieren, und nutzte dann ein Suchmaschinenoptimierungs-Tool (SEMrush), um neue Keywords von Wettbewerbern zu identifizieren. Das Ergebnis von Pawinees Arbeit war die Identifizierung von Keyword-Gruppen, die ein grosses Potenzial haben, zu hohen Klickraten zu führen und gleichzeitig die Kosten moderat zu halten, was zu einer wertvollen Lead-Generierung für das Unternehmen führt.