Was macht ein Data Scientist?
Data Scientist: uneinheitliches Berufsbild
Der Bedarf an Daten-Scientists ist groß, wie eine Studie der Unternehmensberatung McKinsey Global belegt. In den USA können offene Stellen inzwischen nicht mehr durchweg besetzt werden. Eine Schwierigkeit besteht allerdings im uneinheitlichen Berufsbild. Es herrschen naturgemäß in einzelnen Branchen höchst unterschiedliche Anforderungen. Daraus resultieren auch verschiedene Ausbildungswege.
Die “Datenwissenschaft”, mit der diese Berufstätigen befasst sind, bündelt nämlich verschiedene Disziplinen wie Mathematik, Informatik, Betriebswirtschaftslehre und Statistik. Das Fachgebiet entstand aus den Bedürfnissen der Wirtschaft, das Berufsbild hat daher einen sehr hohen Praxisbezug.
Der einheitliche Konsens unabhängig von der Branche besteht darin, dass wissenschaftliche Methoden für die Datenanalyse angewendet werden. Dabei geht es nicht nur um die bloße Auswertung von Daten, sondern um ihren Bezug zu betrieblichen Erfordernissen. Betriebswirtschaft spielt dementsprechend eine große Rolle, auch müssen die Datenwissenschaftler ihre Ergebnisse im unternehmerischen Kontext kommunizieren können. Zunächst identifizieren sie aber geeignete Datenquellen für eine bestimmte betriebliche Problemstellung, extrahieren die Daten, analysieren diese und bringen sie dann in die gewünschten Relationen zueinander. So eine Problemstellung könnte lauten:
- Für welche unserer Produkte besteht aktuell am Markt der höchste Bedarf?
- Wie können wir mit einem entsprechenden Fokus auf solche Produkte den höchsten Gewinn erzielen?
- Können die Produkte besser und/oder günstiger in der Herstellung werden?
- Wie positioniert sich aktuell die Konkurrenz bei diesen Produkten?
Es spielen also mehrere höchst unterschiedliche Einflussgrößen beim Erfolg eines Produkts zusammen. Eine Aufgabenstellung lautet, das Gewicht einzelner Einflüsse zu bestimmen. So könnte sich eine in der Leistung leicht abgespeckte, aber sehr viel günstigere Produktversion besser verkaufen - oder umgekehrt (mehr Leistung bei höherem Preis, weil die Zielgruppe sehr leistungsfokussiert, aber wenig preissensitiv kauft). Die Ergebnisse solcher Datenanalysen und -verknüpfungen fließen in die Produktentwicklung und in das Marketing ein. Das bedeutet für die Data Scientists eine hohe Verantwortung. Sie fällen zwar keine Produktentwicklungs- und Marketingentscheidungen, aber sie müssen gewonnene Daten stets auf ihre Plausibilität, Korrektheit, Vollständigkeit und Relevanz überprüfen. Außerdem müssen sie neue Verknüpfungs- und Relationsmodelle - ausgerichtet an betriebswirtschaftlichen Erfordernissen - entwickeln und diese Modelle auch beständig hinterfragen.
Data Scientist: Ausbildung und Forschung
Das Thema Data Science gehört zur Forschung an den Universitäten, wobei die Forschungsgegenstände - dem Berufsbild entsprechend - universell angelegt sind. Datenanalysen und Schlüsse aus diesen Analysen, die sich sogar in mathematische Modelle gießen lassen, werden in allen Bereichen der Wirtschaft, aber auch in der Medizin, in den Geisteswissenschaften und in der Weltraumforschung benötigt. Entsprechend hoch ist das Niveau der Anforderungen, weshalb Data Scientists studiert haben sollten. Die Unternehmen kommunizieren in ihren Stellenanzeigen für Data Scientists, was sie sich für Studiengänge vorstellen, die ein Bewerber absolviert haben könnte. Im Jahr 2018 wünschen sich beim Wunschkandidaten für so eine Stelle
- 41 % der Unternehmen einen Informatiker,
- 21 % einen Mathematik- oder Statistikabsolventen,
- 18 % einen Wirtschaftswissenschaftler,
- 5 % einen Physiker sowie
- 4 % einen studierten Ingenieur, am liebsten einen Wirtschaftsingenieur.
Das restliche Prozent der Unternehmen äußert keine solchen Präferenzen. Mit dem Studium ist es oft nicht getan. Je nach Vorbildung müssen Data Scientists auch Kenntnisse in Machine Learning und SQL sowie Kommunikationsstärke mitbringen. Die Unternehmen schauen natürlich nicht nur auf das absolvierte Studium, sie verlangen häufiger Spezialkenntnisse. Genannt wurden dabei von der entsprechenden Zahl der befragten Unternehmen folgende Fähigkeiten:
- Programmiersprachen wie SQL (16.942 Nennungen), R (8.422), Python (6.587), Java (5.945) und Spark (2.356)
- Vor- oder Spezialwissen im Machine Learning (5.931), zur Datenvisualisierung (4.217), Cloud-Technologie (3.356), zur künstlichen Intelligenz (1.202) und Deep Learning
- Soft Skills wie Kommunikationsstärke, analytische Fähigkeiten, Kreativität, Teamfähigkeit und Eigeninitiative
Der Data Scientist im beruflichen Einsatz
Berufsfelder sind - unabhängig von der Branche - Werbung, Marketing, Produktmanagement, E-Commerce und weitere Bereiche. Besonders gefragt sind diese Fachleute dort, wo riesige Datenmengen entstehen. Das ist beispielsweise auch die Banken- und Versicherungswirtschaft. Die Nachfrage nach Data Scientists ist sehr hoch, in Deutschland gibt es saisonabhängig seit 2015 jährlich rund 50.000 bis 60.000 Vakanzen. Offene Stellen lassen sich auch nicht so schnell besetzen, nur Softwareentwickler sind noch schwerer zu finden.
Was verdient ein Data Scientist?
Die Jahresgehälter belaufen sich je nach Branche, Region, Spezialisierung und Berufserfahrung auf rund 52.000 bis 84.000 Euro jährlich. Das sind allerdings angesichts des hohen Akademisierungsniveaus übliche Gehälter, denn über 90 % aller Data Scientists haben einen Hochschulabschluss.