Zum Inhalt

Datenmodell

HealthData.ai verwendet ein flexibles, metadatengesteuertes Datenmodell auf Basis des Entity–Attribute–Value (EAV)-Prinzips. Dadurch können Institutionen eigene Datenstrukturen definieren und erweitern, ohne Schema-Migrationen oder Software-Deployments durchführen zu müssen.

Systemarchitektur

HealthData.ai basiert auf einer modernen, modularen Webarchitektur. Die einzelnen Komponenten sind klar voneinander getrennt und können unabhängig weiterentwickelt werden.

Merkmale:

  • Multi-Tenant-Architektur
  • modulare Erweiterbarkeit
  • klare Trennung von Frontend und Backend

Technologiestack

Die Plattform verwendet bewährte Technologien:

  • Backend: Python mit Pyramid Framework
  • Datenbank: PostgreSQL
  • ORM: SQLAlchemy

Diese Technologien gewährleisten Stabilität, Wartbarkeit und hohe Performance.

Entity–Attribute–Value (EAV)

Das EAV-Prinzip trennt die Struktur der Daten von ihrem Inhalt. Anstelle fixer Spalten in einer relationalen Tabelle wird jeder Datenpunkt als Tripel gespeichert:

Komponente Beschreibung
Entity Das Subjekt der Daten, z. B. eine Patientin oder ein Patient, eine Konsultation oder eine Probe
Attribute Die Definition des Datenfeldes, inklusive Typ, Bezeichnung und Validierungsregeln
Value Der tatsächlich erfasste Wert für eine bestimmte Entity und ein bestimmtes Attribut

Dieser Ansatz erlaubt es, beliebig viele Attribute pro Entity-Typ zu definieren und neue Felder zur Laufzeit hinzuzufügen, ohne das zugrundeliegende Datenbankschema zu ändern.

Die hohe Flexibilität des EAV-Ansatzes ermöglicht dynamische Erweiterungen für komplexe medizinische Datenstrukturen, ohne die Kernanwendung anzupassen.

Feldtypen

Attribute lassen sich mit verschiedenen Feldtypen konfigurieren, um der Art der erfassten Daten gerecht zu werden:

  • Text — Freitexteingabe mit optionaler Längenbeschränkung
  • Zahl — Ganzzahl oder Dezimalwert mit optionaler Bereichsvalidierung
  • Datum / Datum+Zeit — mit konfigurierbarem Format und Plausibilitätsprüfungen
  • Boolean — Ja/Nein- oder Wahr/Falsch-Felder
  • Einfachauswahl — vordefinierte Optionsliste (kodierte Werte)
  • Mehrfachauswahl — mehrere Auswahlen aus einer vordefinierten Liste
  • Code — strukturierte Werte mit Systemreferenz, z. B. ICD, SNOMED CT, LOINC
  • Datei — Anhang-Upload mit Typ- und Grössenbeschränkungen

Versionierung und Nachvollziehbarkeit

Jede Änderung an einem Wert wird mit Zeitstempel, Benutzerreferenz und Änderungsgrund gespeichert. Damit entsteht ein vollständiger Audit-Trail, der klinischen und regulatorischen Anforderungen genügt.

Auch Attributdefinitionen werden versioniert, sodass Formulare und Fragebögen sich über die Zeit weiterentwickeln können, während historische Daten weiterhin korrekt interpretierbar bleiben — bezogen auf die zum Zeitpunkt der Erfassung aktive Definitionsversion.

Formulare und Fragebögen

Attribute werden in Formulare gruppiert, welche Struktur und Layout der Eingabemasken definieren. Formulare können in Abschnitte gegliedert werden, unterstützen bedingte Sichtbarkeitsregeln und können Vollständigkeitsanforderungen pro Rolle oder Workflow-Status durchsetzen.

Fragebögen folgen demselben zugrundeliegenden Modell und können direkt auf HL7 FHIR Questionnaire-Ressourcen abgebildet werden.

Kodierte Werte und Terminologien

Code-Felder referenzieren externe oder interne Terminologiesysteme. Unterstützte Referenzsysteme umfassen:

  • ICD-10 / ICD-11 — Diagnosekodierung
  • SNOMED CT — klinische Konzepte
  • LOINC — Labor- und klinische Beobachtungen
  • ATC — Medikamentenklassifikation
  • Eigene institutionelle Kodelisten

Mappings zwischen internen Codes und externen Systemen können unabhängig von der Formulardefinition gepflegt und versioniert werden.

Forschungsexport

Für Forschungszwecke werden EAV-Daten in eine flache, tabellarische Struktur überführt. Jedes Attribut wird zu einer Spalte, jede Entity zu einer Zeile. Die Transformation ist reproduzierbar und dokumentiert, sodass exportierte Datensätze auf die ursprünglichen Definitionen zurückgeführt werden können.

Vor dem Export wird eine Pseudonymisierung angewendet, bei der direkte Identifikatoren durch forschungsspezifische Pseudonyme ersetzt werden.

Skalierung und Performance

HealthData.ai ist für hohe Last und grosse Datenmengen optimiert.

Eigenschaften:

  • horizontale Skalierung über mehrere Anwendungsknoten
  • effiziente Datenverarbeitung für strukturierte und unstrukturierte Daten
  • optimierte Datenbankzugriffe für Erfassung, Suche und Export

Siehe auch: Klinische Dokumentation · Datenerhebung · Schnittstellen