Data Science Abschlussprojekte Batch #21

von Ekaterina Butyugina

Studenten-arbeiten-an-einem-datenwissenschaftliche
Wir freuen uns sehr, die herausragenden Leistungen unserer talentierten Data Science-Studenten aus dem Batch #21 in Zürich und dem erfolgreichen zweiten Batch #2 in München in diesem exklusiven Blogbeitrag präsentieren zu können. In nur drei Monaten haben unsere Studenten erfolgreich eine Vielzahl anspruchsvoller Projekte bewältigt und damit ihre aussergewöhnlichen Fähigkeiten und Hingabe unter Beweis gestellt. Wir laden dich herzlich ein, dich mit den beeindruckenden Ergebnissen, die sie in so kurzer Zeit erzielt haben, näher zu befassen und ihren harten Einsatz und ihre herausragenden Leistungen zu würdigen.

Jedes Projekt ist ein Zeugnis ihrer Expertise, ihres Durchhaltevermögens und ihres unerschütterlichen Engagements für Exzellenz. Durch sorgfältige Analyse und innovative Techniken haben sie Lösungen entwickelt, die dich beeindrucken werden.

Wir ermutigen dich, dir die bemerkenswerten Arbeiten anzusehen, die unsere Studenten erarbeitet haben. Erlebe aus erster Hand die transformative Kraft der Datenwissenschaft, während sie Grenzen überschreiten, Erkenntnisse gewinnen und bedeutende Auswirkungen erzielen. Mit grosser Bewunderung und Respekt feiern wir ihre Leistungen und erkennen den immensen Wert an, den sie in diesem Bereich mitbringen.

Intents-Analyse und Kategorisierung in der Funkkommunikation

Studenten: Yeeun Kim, Adriano Persegani, Thi Tuyen Nguyen, Ibrahima Ba.

Constructor ist eine führende Plattform, die den Forschungslebenszyklus durch KI-basiertes Computermodellieren vereinfacht und beschleunigt. Unterstützt von einer robusten Infrastruktur und über 40 sicheren Partner-Rechenzentren weltweit verbessert Rolos signifikant die Qualität wissenschaftlicher Experimente und steigert die Produktivität von Forschungsteams in wissenschaftlichen und industriellen Bereichen.

Einer von Rolos' angesehenen Kunden ist NASCAR, die renommierte Autorennliga. Mit 45 Funkkanälen zur Kommunikation zwischen Fahrern und Ingenieuren ist die manuelle Überwachung und Analyse all dieser Kanäle eine mühsame und ressourcenintensive Aufgabe. Daher besteht ein dringender Bedarf an einem automatisierten Echtzeit-Funkanalyse-Service, der wertvolle Erkenntnisse liefert.

Um diese Herausforderung anzugehen, haben unsere Studenten Textnachrichten analysiert und ihre Absichten kategorisiert. Durch das Training von Vorhersagemodellen für eine vielfältige Palette von 29 vordefinierten Kategorien, einschliesslich Kraftstoff und Reifen, Bestätigung und mehr, konnten sie die Absichten dieser Nachrichten effektiv klassifizieren. Diese Klassifizierung ermöglicht es Ingenieuren, die Art der Nachricht schnell zu identifizieren und entsprechend zu reagieren, um die Sicherheit des Fahrers zu gewährleisten und das Auto während des Rennens in optimaler Verfassung zu halten.

Mit modernsten Techniken wie Natural Language Processing (NLP), maschinellem Lernen und Deep Learning-Modellen hat unsere Gruppe erfolgreich den Inhalt von unerkannten Daten vorhergesagt. Beachtlicherweise erreicht das bestes Modell eine beeindruckende Genauigkeitsrate von 87% bei der Kategorisierung von Nachrichten in den 29 vordefinierten Kategorien.

Mit Rolos' fortschrittlicher Technologie und Expertise ermöglichen sie Organisationen wie NASCAR, die Kraft von KI und datengetriebenen Erkenntnissen zu nutzen und ihre Abläufe zu revolutionieren, um beispiellose Effizienz und Leistung zu erreichen.

levels of efficiency and performance



Dank der guten Leistung der entwickelten Modelle können die NASCAR-Teams ihre Strategien optimieren und in Echtzeit Anpassungen vornehmen, was zu besseren Ergebnissen führen und das Risiko von Unfällen oder anderen Sicherheitsproblemen verringern kann.


Darüber hinaus hat das Team eine fesselnde Streamlit-Anwendung entwickelt, mit der Benutzer die Label-Klassifizierungs-App erkunden und bewerten können. Wir laden Sie herzlich ein, sich auf dieses spannende Abenteuer einzulassen, indem Sie radionascar.com besuchen und es selbst erleben.


successful-findings

 

Entschlüsselung der Unfruchtbarkeit: Vereinfachung der Analyse von Telomerlänge

Studenten: Raquel Riquelme Borja, Nefeli Dellepiane und Dora Köhalmi

Beyond Genomix ist ein schweizerisches Medizintechnikunternehmen in der klinischen Phase, dass sich der Entwicklung modernster Technologien für die Analyse von nicht-kodierender DNA widmet. Das Hauptaugenmerk liegt im Bereich der reproduktiven Gesundheitsdiagnostik. Basierend auf ihrer Expertise haben sie erfolgreich einen innovativen Fruchtbarkeitstest entwickelt, der auf der präzisen Messung der Telomerlänge beruht. Was den Test von Beyond Genomix auszeichnet, ist seine bemerkenswerte Einfachheit - er erfordert nur wenige Tropfen Blut für genaue Ergebnisse.


Comparing-measurement-of-telomere-length


Telomere, die sich an den Enden der Chromosomen befinden, spielen eine wichtige Rolle als Schutzkappen für die DNA. Die Telomerlänge kann je nach Faktoren wie Alter, Geschlecht, Ethnizität und Lebensstil variieren und erstreckt sich in der Regel über 8’000 bis 10’000 DNA-Basen. Kürzere Telomere wurden als potenzielle Biomarker für altersbedingte Krankheiten und Unfruchtbarkeit sowohl bei Männern als auch bei Frauen identifiziert. In Fällen, in denen andere Tests zu unklaren Ergebnissen führen, kann die Messung der Telomerlänge bei der Diagnose von Unfruchtbarkeit helfen.

Beyond Genomix nutzt patentierte Mikroskopietechnologie zur Messung der Telomerlänge und liefert die Ergebnisse in einem Textdateiformat. Diese Ergebnisse ermöglichen die Berechnung der durchschnittlichen Telomerlänge pro Zelle einer Person, die dann durch Grafiken visualisiert wird, um einen Vergleich mit gesunden Individuen zu ermöglichen. Ein umfassendes Dokument mit diesen informativen Grafiken wird dem Patienten zur Verfügung gestellt. Die manuelle Erstellung dieser Grafiken war jedoch ein zeitaufwändiger Prozess.

Beyond Genomixs Mikroskopietechnologie generiert auch Daten über den Zellkern, die wertvoll sein könnten, um Patienten von gesunden Individuen zu unterscheiden, jedoch noch unerschlossenes Terrain darstellen.

Mit dem Ziel, die Analyse und Visualisierung von Daten neuer getesteter Personen zu automatisieren, haben sich Raquel, Nefeli und Dora auf eine Mission begeben, die schnelle Erzeugung der für Patientenberichte erforderlichen Grafiken zu erleichtern. Darüber hinaus wollten sie unerschlossene Aspekte der Daten erkunden und herausfinden, wie sie zum Vorteil des Unternehmens genutzt werden können.

Um diese Ziele zu erreichen, hat das Team eine robuste Pipeline zur Verarbeitung, Bereinigung, Analyse und Visualisierung der vorhandenen Daten entwickelt. Sie haben diese Pipeline nahtlos in eine Streamlit-App integriert, um einen einfachen Zugriff auf die relevantesten Informationen in Form von Grafiken und Tabellen zu ermöglichen. Dadurch kann, wenn eine neue Person getestet wird, ihre Mikroskopiedaten automatisch analysiert werden und die erforderlichen Grafiken, ähnlich wie die unten dargestellte, können mit einem einzigen Klick für den Patientenbericht heruntergeladen werden.


Patient-report


Durch ihre innovativen Bemühungen haben Raquel, Nefeli und Dora die Effizienz der Datenanalyse und -visualisierung bei Beyond Genomix revolutioniert. Die Implementierung ihrer optimierten Pipeline und der benutzerfreundlichen App ermöglicht es dem Unternehmen, umfassende und visuell ansprechende Berichte zeitnah zu liefern und damit die Patientenerfahrung insgesamt zu verbessern.

Parallel zur Entwicklung der App haben unsere Studenten Schulungen absolviert, um verschiedene maschinelle Lernmodelle mit den Datensätzen des Unternehmens zu erstellen. Diese Modelle sollten vorhersagen, ob eine neu getestete Person eher zur Patienten- oder zur gesunden Klasse gehört. Um dies zu erreichen, wurden zuvor ungenutzte Daten verwendet. Insbesondere die besten Modelle waren die lineare Regression und der XGboost Decision Tree mit beeindruckenden Genauigkeitsraten von 97% bzw. 95%. Diese Modelle wurden nahtlos in die Streamlit-App integriert, so dass Benutzer den Status der getesteten Person schnell beurteilen können.

Zusätzlich wurde eine zusätzliche Seite in die Streamlit-App eingebunden, auf der wichtige Informationen und Visualisierungen der aktuellen Datensätze angezeigt werden. Diese wertvolle Ergänzung ermöglicht es dem Unternehmen, entscheidende Metriken in den Datensatzpopulationen zu überwachen, darunter Durchschnittsalter, Geschlechterverteilung und andere Metriken, die auf die Datenqualität hinweisen. Da Beyond Genomix bestrebt ist, seine Datensätze zu erweitern, dient diese Seite als wertvolles Werkzeug zur Beurteilung ihres Wachstums und zur Aufrechterhaltung der Datenintegrität.

Durch die Optimierung des gesamten Datenverarbeitungspfades, von der Textdatei zum Erzeugen von Visualisierungen für Patientenberichte, haben Raquel, Dora und Nefeli den Prozess erheblich vereinfacht und beschleunigt.
 

NEAR Social: Ein Empfehlungssystem für ein On-Chain soziales Netzwerk

Studenten: Christian Kühner, Daniel Herrmann, Agustin Rojo Serrano

Dieses Projekt wurde von Pagoda bereitgestellt, einem Unternehmen, das das Betriebssystem der NEAR-Blockchain entwickelt.

NEAR Social ist ein hochmodernes soziales Netzwerk, das auf der NEAR Blockchain basiert und bei dem die Nutzer über ihre NEAR-Wallet-Adresse auf die Plattform zugreifen. Jede Aktion des Nutzers, sei es das Posten, das Folgen anderer, das “Liken” von Inhalten oder das Aktualisieren seines Profils, wird akribisch als Blockchain-Transaktion aufgezeichnet und dauerhaft im öffentlichen Hauptbuch gespeichert. Dieser dezentralisierte Ansatz stellt sicher, dass die Nutzerdaten in den Händen der einzelnen Personen bleiben, während Entwickler die Freiheit haben, die Funktionalität der Plattform durch die Erstellung von Open-Source-Apps, sogenannten Widgets, weiterzuentwickeln, ohne dafür eine Genehmigung zu benötigen.


Architectural-overview


Das Hauptziel unserer Studenten war es, ein robustes Empfehlungssystem für Nutzer weiterzuentwickeln, das sinnvolle Verbindungen zwischen Gleichgesinnten ermöglicht und das Wachstum des Netzwerks fördert. Um dies zu erreichen, haben sie ein ausgeklügeltes System entwickelt, das die verschiedenen Daten der einzelnen Nutzer berücksichtigt. Auf der Grundlage dieser Daten haben die Studenten vier verschiedene Ansätze verfolgt, um personalisierte Empfehlungen auszusprechen:
  • Nutzer, die sich im Trend befinden, wurden anhand einer Trendmetrik identifiziert, die als Verhältnis zwischen Engagement und Aktivität in den letzten 30 Tagen definiert ist. Dieser Ansatz ermöglicht es, Nutzer zu empfehlen, die beständig fesselnde und hochwertige Inhalte produzieren.
  • Mit Hilfe von Techniken des unüberwachten Lernens wurde einen Algorithmus entwickelt, der Verbindungen zweiten Grades auswählt, bei denen die Wahrscheinlichkeit, dass sie mit einem bestimmten Nutzer verbunden sind, aufgrund ihrer gemeinsamen Freunde höher ist. Wenn zum Beispiel ein Nutzer alle unsere Verbindungen als Freunde hat, ist es sehr wahrscheinlich, dass dieser Nutzer ähnliche Interessen hat.
  • Um die Nutzererfahrung zu verbessern, wurden Profil-Tags eingeführt, die neben den Namen angezeigt werden können. Der Tag Similarity-Algorithmus schlägt auf intelligente Weise andere Nutzer vor, die ähnliche Tags haben, und fördert so die Verbindung zwischen Personen mit gemeinsamen Interessen.
  • Ausserdem wurde die Leistungsfähigkeit von Large Language Models genutzt, um einen Post Similarity-Algorithmus weiterzuentwickeln. Wenn ein Nutzer eine Nachricht in unserem sozialen Netzwerk veröffentlicht, sucht dieser Algorithmus den ähnlichsten Beitrag aus unserem umfangreichen Korpus früherer Beiträge heraus und empfiehlt schliesslich den Nutzer, der den vergleichbaren Beitrag verfasst hat.
  • Mit diesen innovativen Ansätzen soll die Interaktionen der Nutzer bereichert und das Gemeinschaftsgefühl auf der Plattform gefördert werden. Durch den Einsatz fortschrittlicher Algorithmen und intelligenter Empfehlungen soll allen Nutzern ein ansprechendes und personalisiertes Erlebnis im sozialen Netzwerk geboten werden.

Post-similarity


Dieses Empfehlungssystem wurde für ein wachsendes soziales Netzwerk entwickelt und implementiert, um die Nutzer zu binden. In naher Zukunft wird jedes Profil ein On-Chain-Widget haben.

Vielen Dank an alle für eine fantastische Partnerschaft und eine tolle Projektzeit! Wir von Constructor Academy wünschen unseren Data Science Absolventen viel Glück.

Constructor Academy ist sehr stolz darauf, mit solch aussergewöhnlichen Persönlichkeiten während dieser bemerkenswerten Projektzeit zusammengearbeitet zu haben. Zum Abschied wünschen wir unseren Data Science Absolventen Erfolg und Erfüllung in ihren zukünftigen Unternehmungen.


Beschleunige deine Karriere mit Constructor Academy's innovativem Data Science Bootcamp.


Bist du bereit, eine Karriere in der Welt der grenzenlosen Möglichkeiten in einer höchst anspruchsvollen und finanziell lohnenden Branche zu starten? Suche nicht weiter. Das Data Science Bootcamp von Constructor Academy bietet dir genau das Richtige.

Unser Bootcamp wurde entwickelt, um dir die essentiellen Techniken und Technologien zu vermitteln, die du brauchst, um die Macht der Daten zu nutzen. Wir bieten zwei Formate an: Vollzeit (12 Wochen) und Teilzeit (22 Wochen). Während dieser intensiven Erfahrung wirst du transformative Technologien wie maschinelles Lernen, natürliche Sprachverarbeitung (NLP), Python, Deep Learning und Datenvisualisierung erlernen. 

Aber das ist noch nicht alles! Starte deine Reise in die Datenwissenschaft mit unserer kostenlosen Einführung in die fesselnde Welt der Datenwissenschaft. Klick hier, um auf diese wertvolle Ressource zuzugreifen, und beginne noch heute mit deiner Entdeckungsreise.

Bereite dich auf eine Zukunft vor, die mit endlosen Möglichkeiten gefüllt ist. Constructor Academy hat es sich zur Aufgabe gemacht, aufstrebende Data Scientists wie dich zu befähigen, dein wahres Potential zu entfesseln und den Weg für unvergleichlichen Erfolg zu ebnen. Begleite uns auf diesem aufregenden Abenteuer und lass uns gemeinsam die Zukunft der Datenwissenschaft gestalten.

Möchtest du mehr über die Constructor Academy und technikbezogene Themen lesen? Dann finde hier weitere spannende Blogbeiträge.

Mehr Infos
Blog