Data Science-Abschlussprojekte batch #27

von Ekaterina Butyugina

eine Frau, die codiert
Wir möchten einen Moment innehalten, um all die grossartigen Studierenden zu feiern, die im September bei uns gestartet sind und mit vollem Einsatz den Kurs und ihre Capstone-Projekte abgeschlossen haben.

In nur drei kurzen Monaten haben die talentierten Data-Science-Enthusiast:innen aus Batch #27 in Zürich gemeinsam mit der erfolgreichen 6. Kohorte aus München eine beeindruckende Vielfalt ambitionierter Projekte umgesetzt. Ihre aussergewöhnlichen Fähigkeiten, ihre Leidenschaft und ihr Engagement waren in jeder Phase des Projekts sichtbar.

Unser besonderer Dank gilt HP für die unschätzbare Unterstützung mit hochmodernen Z by HP Workstatiossssgeblich zu fördern.

Diese spannende Reise möchten wir mit euch teilen – erlebt, wie unsere Studierenden die Grenzen der Datenwissenschaft erweitern, kraftvolle Erkenntnisse gewinnen und bedeutende Impulse setzen.

Optimierung der Verpackung mit Machine Learning

Studierende: Simon Püschel, Anahy Santiago

Best Secret, ein führender Name im Bereich des Luxusmodehandels, hat ein Projekt initiiert, um den Verpackungsprozess durch prädiktive Modellierung zu optimieren. Ziel ist es, Verpacker:innen dabei zu unterstützen, die optimale Kartongrösse schnell und präzise auszuwählen, was sowohl die Geschwindigkeit als auch die Konsistenz der Verpackungsvorgänge steigert.

Derzeit basiert der Auswahlprozess für Verpackungen bei Best Secret auf erfahrenen Verpacker:innen, die die Kartongrösse anhand der Art und Menge der Artikel in jeder Bestellung bestimmen. Diese Vorgehensweise ist jedoch zeitaufwändig, insbesondere für Saisonarbeiter:innen, die weniger Erfahrung mitbringen.

Simon Püschel und Anahy Santiago haben daran gearbeitet, ein Machine-Learning-Modell zu entwickeln, das die optimale Kartongrösse für jede Bestellung schnell und zuverlässig vorhersagen kann und so den Prozess effizienter gestaltet. Die Herausforderung bestand in der Handhabung von 11 stark unausgeglichenen Klassen, die oft ähnliche Grössen hatten, was das Problem zusätzlich erschwerte.

Da keine genauen Volumen- und Gewichtsangaben für einzelne Artikel vorlagen, entwickelte das Team Methoden, um diese Werte zu approximieren. Durch die Analyse von Bestellungen mit nur einem Artikel konnten sie durchschnittliche Volumina für verschiedene Produktkategorien berechnen, um dem Modell wichtige Schätzwerte zu liefern. Für die Gewichtsschätzung nutzten sie Durchschnittswerte pro Kategorie, die als Referenzpunkte dienten, um die Vorhersagen der optimalen Kartongrösse zu verbessern.

Um die Flexibilität von Artikeln zu berücksichtigen, die die Verpackungsentscheidung beeinflussen kann, führte das Team ein einfaches Klassifikationssystem ein. Artikel mit klaren Eigenschaften wurden als „weich“ oder „hart“ gekennzeichnet. Für weniger eindeutige Fälle analysierte ein Modell die Produktnamen, um Artikel basierend auf allgemeinen Mustern zu klassifizieren. Das Modell verwendete schliesslich zentrale Produktdaten wie Volumen, Gewicht und Menge, um die Vorhersagegenauigkeit der Kartongrösse zu verbessern.

Modellauswahl und Leistung: Das Team testete verschiedene Machine-Learning-Modelle, um den besten Ansatz für diese Aufgabe zu finden. Gradient-Boosting-Algorithmen erreichten mit 64 % die höchste Genauigkeit und übertrafen Modelle wie Random Forest und neuronale Netze. Um die Vorhersagen weiter zu verbessern, formulierte das Team das Problem neu als Regressionsaufgabe, setzte Ensemble-Learning-Techniken ein und testete eine Reihe von Regressionsmodellen.


Model Performance

Obwohl die ersten Ergebnisse vielversprechend sind, hat das Team einige Bereiche identifiziert, die noch weiter verbessert werden können. Eine detailliertere Produktkategorisierung könnte helfen, feine Unterschiede in den Produkteigenschaften besser abzubilden und so die Genauigkeit zu steigern. Die Integration der tatsächlichen Gewichte für jedes Produkt würde die Präzision des Modells weiter erhöhen, und Tests in einer echten Verpackungsumgebung könnten wertvolle Einblicke für Anpassungen liefern. Dank der Unterstützung und Ressourcen von Best Secret hat das Team eine Grundlage für einen effizienteren Verpackungsprozess geschaffen. Mit weiteren Verbesserungen kann das Modell künftig eine wichtige Rolle bei der Optimierung der Verpackungsabläufe spielen.

AI Coach – Dein virtueller Assistent für das Selbstmanagement von Rückenschmerzen

Studenten: Bing Huang, Martin Itten, Srinivas Reddy Burigari

Leidest du unter Rückenschmerzen? Damit bist du nicht allein! Erstaunliche 46 % der Arbeitnehmer berichten von Rückenschmerzen, was zu 50 % mehr Krankheitstagen führt als bei schmerzfreien Kollegen. Rückenschmerzen sind nicht nur ein persönliches Problem – sie stellen eine weit verbreitete Herausforderung dar, die Produktivität und Wohlbefinden beeinträchtigt. Healactively hat es sich zur Aufgabe gemacht, der Rückenschmerz-Epidemie entgegenzuwirken – mit einem wissenschaftlich fundierten, personalisierten Programm aus rückenstärkenden Übungen und physiotherapeutischen Einblicken, alles zugänglich über eine benutzerfreundliche App.

Absolventen des Data-Science-Programms von Constructor Academy, Srinivas Reddy Burigari, Martin Itten und Bing Huang, stellen den Healactively AI Coach vor, der Nutzer auf ihrem Weg begleitet, Fragen beantwortet, emotionale Unterstützung bietet und gesunde Gewohnheiten für eine nachhaltige Rückengesundheit aufbaut.

Das Team nutzt modernste Technologien wie Retrieval-Augmented Generation (RAG) und die neuesten OpenAI-Modelle, um diese Herausforderung zu meistern. Da grosse Sprachmodelle (LLMs) wie ChatGPT kein Vorwissen über Physiotherapie oder die Übungsprogramme der Nutzer haben, überbrückt das Team mit RAG diese Lücke. Dieses Verfahren ruft relevante Informationen aus der Wissensdatenbank des Unternehmens ab und integriert sie in das LLM, sodass präzise, personalisierte Antworten bereitgestellt werden können. Zudem verwaltet das Team den Chatverlauf effektiv, um sicherzustellen, dass die Interaktionen der Nutzer kontextbezogen, nahtlos und durchweg hilfreich sind – für eine optimale Unterstützung auf dem Weg zu einer gesunden Rückengesundheit.

AI coach Architechture

Der AI Coach wird von vier spezialisierten Agenten unterstützt, die jeweils darauf ausgelegt sind, das Benutzererlebnis zu verbessern und umfassende Unterstützung zu bieten:

Agent 1: Kundensupport
Dieser Agent beantwortet allgemeine Anfragen von Nutzern zu Themen wie Abonnements, Mitgliedschaften, Übungsprogrammen und mehr. Egal ob B2B- oder B2C-Nutzer – die Antworten werden individuell auf die Bedürfnisse des Nutzers zugeschnitten. Zudem passt der Agent seinen Ton an die Persona des Nutzers an, um eine personalisierte und ansprechende Interaktion zu gewährleisten.

Agent 2: Virtueller Physiotherapie-Experte
Brauchen Sie physiotherapeutischen Rat? Der AI Coach steht bereit! Basierend auf Gesundheitsdaten und Schmerzleveln der Nutzer liefert dieser Agent personalisierte Empfehlungen, um die Genesung zu unterstützen und den Aufbau eines stärkeren, gesünderen Rückens zu fördern.

Agent 3: Gewohnheitsplaner
Der Gewohnheitsplaner hilft Nutzern dabei, nachhaltige Gewohnheiten rund um ihre Übungsroutinen zu entwickeln. Durch die Analyse personalisierter Trainingspläne identifiziert er geeignete Zeiten oder Auslöser, um Rückengesundheitsübungen nahtlos in den Alltag zu integrieren.

Agent 4: Interpret für Diagnoseschreiben
Schon mal beim Lesen eines medizinischen Berichts ratlos gewesen? Dieser Agent ist zur Stelle! Medizinische Berichte sind oft für Fachkräfte geschrieben und lassen Patienten mit wenig Klarheit über ihren Zustand zurück. Der AI Coach kann medizinische Berichte verarbeiten, zusammenfassen und in leicht verständlicher Sprache erklären.

Der AI Coach ist bereit, ein integraler Bestandteil der Healactively-App zu werden. Mit seiner personalisierten Unterstützung und seinen intelligenten Funktionen ist er darauf ausgelegt, Nutzer auf ihrem Weg zu einer besseren Rückengesundheit zu begleiten und nachhaltige Verbesserungen zu ermöglichen.
 

ImageInsight: KI-gestützte Bildmanagement-Lösung für die Architektur

Studenten: Siriwat Suwattanapreeda, Luofei Pan

Im Architekturbereich sind visuelle Daten entscheidend für die Projektdokumentation, Präsentationen und Planungen. Doch mit wachsendem Bildbestand stossen traditionelle Ordnersysteme an ihre Grenzen, wenn es um eine effiziente Bildverwaltung geht. Um diese Herausforderungen zu meistern, haben Siriwat und Luofei für die nts Ingenieurgesellschaft mbH ImageInsight entwickelt. Diese KI-gestützte Lösung nutzt intelligente Suchfunktionen, um eine effiziente Bildsuche und -verwaltung zu ermöglichen und damit den Zugang, die Genauigkeit sowie die Datensicherheit erheblich zu verbessern.
 
KI-Bildprozessor für automatisierte Kategorisierung und Datenschutzkonformität  
Das Herzstück von ImageInsight ist ein leistungsstarker KI-Bildprozessor, der die automatische Erstellung von Bild-Tags und -Beschreibungen für eine schnelle Auffindbarkeit ermöglicht und gleichzeitig die Datensicherheit gewährleistet. Dieser Prozessor erfüllt zwei Hauptfunktionen:  
  • Objekterkennung und Materialanalyse: Der Prozessor analysiert jedes Bild, um Objekte, Materialien, Farben und kontextuelle Details zu erkennen. Auf dieser Grundlage wird detaillierte Metadaten erstellt, die vielseitige Suchanfragen unterstützen, z. B. "Finde ein Bild mit einer Parkbank" oder "Zeige Bilder mit Glasmaterial."


Object Detection and Material Recognition
 
  • Entfernung sensibler Informationen: Um den Datenschutz zu gewährleisten, erkennt der Prozessor automatisch sensible Informationen wie Gesichter oder Kennzeichen und maskiert diese. Dadurch wird sichergestellt, dass die Bilddatenbank den Anforderungen der DSGVO sowie anderen Datenschutzbestimmungen entspricht.
Sensitive Information Removal

 
Skalierbare Bilddatenbank: ImageInsight ist mit einer robusten und skalierbaren Datenbank ausgestattet, die es ermöglicht, die wachsende Bildsammlung der nts Ingenieurgesellschaft effizient zu organisieren und zu verwalten.  

Benutzerfreundliche, mehrsprachige Website mit erweiterten Suchfunktionen: Die Website von ImageInsight zeichnet sich durch ein benutzerfreundliches Design und leistungsstarke, mehrsprachige Suchfunktionen aus. Die Plattform unterstützt Suchanfragen auf Französisch, Deutsch und Englisch, sodass Nutzer Schlüsselwörter in verschiedenen Sprachen eingeben können, um relevante Bilder zu finden. Mit dieser Funktion können Anwender schnell die gewünschten Bilder lokalisieren und anschliessend hochladen, herunterladen oder verwalten.  

ImageInsight bietet der nts Ingenieurgesellschaft mbH eine herausragende, KI-gestützte Lösung für die Bildverwaltung. Sie ermöglicht eine effiziente Handhabung visueller Ressourcen durch intelligente Suche, automatisierte Kategorisierung und Datenschutz. Mit ihrer skalierbaren Datenbank, den erweiterten mehrsprachigen Suchfunktionen und der benutzerfreundlichen Oberfläche erfüllt ImageInsight die besonderen Anforderungen der Architekturbranche und setzt neue Massstäbe für effiziente und datenschutzkonforme Bildverwaltung.

*Alle Bilder mit Personen und Autos in diesem Blogpost wurden KI-generiert.

Automatische Erkennung von Unterbrechungen bei Solarmodulen

Studenten: Kittiboon Taopittayathorn, Yvonne Creter, Kristjan Mark

Fluence Energy AG ist ein weltweit führendes Unternehmen für Energiespeicherprodukte und -services sowie cloudbasierte Softwarelösungen für erneuerbare Energien und Speicheranlagen. Die Abteilung in Zürich ist spezialisiert auf die Bereitstellung von Datenintelligenzdiensten für erneuerbare Energien weltweit.  

Herausforderung bei der Solarenergieproduktion
Die Effizienz der Solarenergieproduktion kann erheblich durch String-Unterbrechungen und die langfristige Degradation von Photovoltaik (PV)-Modulen beeinträchtigt werden. Diese Probleme bleiben oft unbemerkt, was zu einem Rückgang der Energieeffizienz und steigenden Wartungskosten für Solarenergieanbieter führt.  

Eine innovative Lösung für mehr Effizienz
 Vor diesem Hintergrund haben Kittiboon, Yvonne und Kristjan eine wegweisende Lösung entwickelt. Sie arbeiteten daran, Daten aus den Überwachungssystemen eines Solarparks zu integrieren, um Fehler und Degradationen in Echtzeit zu erkennen. Mithilfe einer Kombination aus regelbasierten Kennzeichnungsstrategien, maschinellen Lernmodellen und Deep Learning entwickelten sie ein System, das String-Unterbrechungen auf den Ebenen Eingang, Kombinierbox und Wechselrichter erkennt (siehe Abbildung).  
Diese Innovation verspricht nicht nur eine verbesserte Effizienz für Solarparks, sondern auch eine Reduzierung der Betriebskosten, indem Probleme frühzeitig identifiziert und behoben werden können.

Combiner box Inverter levels

Das System verarbeitet Eingabedaten wie elektrische Leistung, Stromstärke und Spannung der Solarmodule sowie Umweltdaten wie Temperatur und Sonneneinstrahlung. Durch das Training der Modelle mit mehr als drei Jahren an Daten konnte das Team präzise Vorhersagemodelle entwickeln. Diese erreichten eine beeindruckende Genauigkeit von 93 % bei der Erkennung von Unterbrechungen auf Eingangsebene und 82 % bei der Identifikation von Fehlern auf der Ebene der Kombinierbox.

82% accuracy for combiner box-level faults

Im Mittelpunkt dieser Lösung stehen drei zentrale Modelle:  
  • Input-Level-Modell: Erkennt partielle und vollständige Unterbrechungen in den Eingangsstrings der Solarmodule.  
  • Kombinierbox-Modell: Identifiziert Probleme in den Kombinierboxen, die mehrere Solarmodul-Strings verbinden.  
  • Wechselrichter-Modell: Überwacht die Leistung der Wechselrichter und stellt sicher, dass sie optimal arbeiten.  
Das Projekt geht über die reine Fehlererkennung hinaus und bietet den Betreibern ein benutzerfreundliches Web-Dashboard, das Live-Daten und maschinelle Lernvorhersagen anzeigt. Betreiber erhalten in Echtzeit Fehlermeldungen und Einblicke, die es ihnen ermöglichen, schnell zu erkennen, welcher Teil des Systems Aufmerksamkeit benötigt. Dies minimiert Ausfallzeiten und sorgt für eine optimale Energieproduktion.

Dashboard

Mit Unterstützung der Data Science Absolventen von Constructor Academy setzt Fluence neue Massstäbe im Bereich der Überwachung erneuerbarer Energien. Wir sind gespannt, wie sich diese innovative Lösung weiterentwickeln wird.  
 

Fazit  

Zum Abschluss dieser beeindruckenden Reise mit der Data Science Final Projects Group #27 möchten wir unseren herzlichen Dank an die Unternehmen aussprechen, die unseren Studierenden mit wertvollen Projekten zur Seite standen. Eure Zusammenarbeit hat das Lernerlebnis unserer Studierenden bereichert und zur Entwicklung innovativer Lösungen für reale Herausforderungen beigetragen.  

Ein grosses Lob gilt den Studierenden, die im September zu uns gestossen sind und sich mit vollem Einsatz der Kurs- und Projektarbeit gewidmet haben. Eure aussergewöhnlichen Leistungen, euer Können und eure Leidenschaft für Data Science haben wirklich beeindruckt. Wir wünschen euch alles Gute für eure berufliche Zukunft – mögt ihr weiterhin Grenzen überschreiten, innovativ sein und eine positive Wirkung in eurer Karriere erzielen.  

Für alle, die von diesen Geschichten inspiriert wurden und ihre eigene Reise in die Welt der Data Science antreten möchten, freuen wir uns, unseren nächsten Bootcamp-Termin anzukündigen. Erfahre mehr über unser Programm und entdecke, wie du Teil der nächsten Generation von Data Science Innovatoren an der Constructor Academy werden kannst.

Möchtest du mehr über die Constructor Academy und technikbezogene Themen lesen? Dann finde hier weitere spannende Blogbeiträge.

Mehr Infos
Blog