Giter Site home page Giter Site logo

dma2022dataprojectb's Introduction

DMA2022DataProjectB

Brustkrebs ist eine der häufigsten Krebserkrankungen. Er macht 30 % aller Krebsfälle bei Frauen in Deutschland aus. In seltenen Fällen kann er auch Männer befallen (1 % aller Krebsfälle bei Männern).

Projektbeschreibung

Im Rahmen unseres Projektes analysieren wir einen Datensatz aus den USA der Informationen über demographische und medizinische Details von 1019 Brustkrebs Patienten aus den USA enthält. Die Daten werden zum beantworten unserer Forschungsfrage verwendet. In der Forschungsfrage gehen wir der Frage nach, ob Patienten, die an Brustkrebs erkrankt sind und vergleichbare Krankheitszustände vorweisen, auch die gleiche Behandlung bzw. Medikation erhalten.

Eine genaue Anleitung zum klonen der Daten und des Codes und deren Ausführung auf lokalen oder cloud bassierten Systemen findet sich in Systemumgebung.

Daten

Der genaue Aufbau der verwendeten Daten kann hier Datenbanktabellen betrachtet werden. Die von uns generierten Daten werden auf Google Drive zur Verfügung gestellt. Die Daten sind anonymisiert und erlauben somit keinerlei Rückschlüsse auf die Identität der Patienten, sie dienen jedoch dazu die von uns verwendeten Methoden vefifizierbar zu machen. Für genauere Details über die Verfügbarmachung unserer Daten siehe Data Sharing

Methodik

Bei der Bearbeitung der Daten wurde das Sternschema als Datenmodell genutzt. Dei bearbeiteten Daten wurden in SQL-Datenbanken geladen und auf Google Drive gespeichert. Zur Auswertung der Daten wurde das K-means-Verfahren genutzt. Ausführlichere Informationen finden sich in den Forschungsergebnissen und im Notebook Analysis.ipynb.

Konklusion

Die Forschungsfrage kann positiv beschieden werden. Nach Analyse der Medikamentengabe, wurde ersichtlich, dass Pateienten mit gleichem oder vergleichbarem Krankheitszustand tatsächlich die gleiche (bzw. relativ ähnliche) Medikation erhielten. Diese trifft zumindest auf Patienten mit Brustkrebserkrankungen zu.

Flowchart Flowchart

Projekt Video

Watch the video https://youtu.be/JhvHeFUmNb8

Disclaimer: In dem Projekt wurden synthetische Daten verwendet. Keine echten Patienten Data (siehe https://github.com/synthetichealth/synthea) image

dma2022dataprojectb's People

Contributors

mascharobota avatar shayan1375 avatar thunfischpirat avatar github-daf1 avatar fuenfgeld avatar

Stargazers

 avatar  avatar

Watchers

 avatar

dma2022dataprojectb's Issues

Datenqualität

Hier fehlt mir noch die Folgerung. Könnt ihr eure Analyse durchführen trotz den Qualitäts issues. Wie geht ihr damit um

Data Managment plan (Langzeitarchivierung)

B. Langzeitarchivierung
Wir möchten die Daten nach den FAIR Prinzipien auf lange Frist zugänglich machen. Die FAIR Prinzipien werden von den G20 Staaten und einer Reihe von renommierten Universitäten unterstützt. Die Prinzipien geben vor, dass man die gewünschten Daten innerhalb des Datensatzes leicht auffinden kann und diese dem Nutzer zugänglich sind, weiterhin sollen die Daten auf eine Art und Weise formatiert und beschrieben sein, welche deren Nutzung in Applikationen ohne große Hindernissen möglich machen. Die Daten müssen außerdem domänenspezifische Standards erfüllen die deren Wiederverwendung in anderen Projekten begünstigen.

Hier müsst ihr konkreter warden. Das is eine allgemeine Beschreibung vonm FAIR daten.

z.B „domänenspezifische Standards erfüllen“
ok welche Standrards wendet ihr denn an (das hab ihr ja schon dokumentiert)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.