Ursula Deriu

Tirsus

Bio

Ursula Deriu hatte nach ihrem Mathematik-Studium während ihrer bisherigen beruflichen Laufbahn viele verschiedene Rollen in der Software-Entwicklung sowie im Projekt- und Linien-Management inne. Sie ist spezialisiert auf die Themen Data Management und Data Science, die sie auch an verschiedenen Fachhochschulen unterrichtet. Sie arbeitet hauptberuflich bei Tirsus, ihrer eigenen Firma, erstellt online Kurse zu ihren Fachgebieten und beratet Unternehmen bei Data Management, Data Science bei E-Learning.

Twitter: @UrsulaDeriu
Web: tirsus.com

 

 

 

Realtime Big Data ist doch keine Kunst - wirklich?

Realtime Analysen resp. Stream Analytics wird immer populärer. Rund um die Uhr werden Datenströme aller Art in Echtzeit analysiert. Einerseits sollen die Systeme für grosse Datenmengen skalieren und andererseits sind die Verarbeitungen derart komplex, dass mehrere Tools zu einer Pipeline zusammengeschaltet werden. Beides führt zu einem verteilten System. Die APIs werden augenscheinlich immer einfacher. Um sie jedoch korrekt anzuwenden, ist ein vertieftes Verständnis für das unterliegende System unumgänglich.

Zwar sind die Systeme im Fehlerfall selbstheilend - die Konsequenzen eines Teilausfalls sind dennoch vielfältig. Anhand der Beispiele Apache Kafka und Apache Spark beleuchtet der Vortrag das Wesen verteilter Transaktionen und die Auswirkungen auf Durchsatz, Latenz und Genauigkeit der realtime Analysen.