Das Deutsche Klimarechenzentrum (DKRZ) ist die zentrale Simulations- und Datenverarbeitungseinrichtung für die deutsche Klima- und Erdsystemmodellierungsgemeinschaft und gehört zu den führenden Einrichtungen in diesem Bereich. Das DKRZ betreibt nicht nur Supercomputer der höchsten Leistungsklasse und eines der größten Daten- und Archivsysteme weltweit, sondern beteiligt sich auch an vielen nationalen und internationalen Projekten zur Verbesserung der Software und Infrastruktur für die Klimamodellierung.

Informatiker/Forschungssoftware-Ingenieur für ein LLM-basiertes

Klimadaten-Analyse-System (m/w/d)

Die Abteilung Datenanalyse des DKRZ sucht einen Informatiker / Research Software Engineer (m/w/d) für die Arbeit an einem Chat-Based Geoscientific Research Transformer (chatGRT). Gemeinsam mit unserer Partnerinstitution, dem Helmholtz-Zentrum für Geoforschung Potsdam GFZ, bauen wir mit Unterstützung der VolkswagenStiftung "Pioniervorhaben" ein KI-gestütztes, chatbasiertes Tool, das Wissenschaftler von mühsamer Datenverarbeitung und Programmieraufgaben befreit und es ihnen ermöglicht, sich auf bahnbrechende Entdeckungen zu konzentrieren. Durch die nahtlose Verbindung von Top-Forschungswerkzeugen mit diversen Klimadaten übersetzt chatGRT Forschungsfragen in umsetzbare Skripte - und liefert auf Knopfdruck Antworten, Diagramme und Erkenntnisse

Das DKRZ beabsichtigt, einen Experten für die Softwareentwicklung rund um LLM und deren Anwendungen im Bereich der Klimadatenanalyse innerhalb der neuen Abteilung Datenanalyse (DA) einzustellen, der die KI/ML mit der Analyseplattform (Freva) von DA verbindet. In dieser Rolle spielen Sie eine Schlüsselrolle bei der Revolutionierung der Klimawissenschaft durch die Entwicklung und Feinabstimmung von chatGRT, einer KI-gestützten, Chat-basierten Schnittstelle zur Unterstützung von Erdsystemwissenschaftlern. Sie werden sowohl an experimentellen als auch an produktiven Aspekten arbeiten, von der Verfeinerung von GPT-basierten Prototypen bis hin zum Einsatz eines großen Open-Source-Sprachmodells auf einer High-Performance-Computing (HPC)-Infrastruktur. In enger Zusammenarbeit mit Fachwissenschaftlern und KI-Experten werden Sie sicherstellen, dass chatGRT nicht nur wissenschaftlich genau und effizient, sondern auch sicher, reproduzierbar und benutzerfreundlich ist.

Hauptverantwortlichkeiten: 

  • Experimentelle Entwicklung:
    • Feinabstimmung von GPT-basierten Prototypen zur Unterstützung geowissenschaftlicher Aufgaben, wie z. B. kommentiertes Plotten, statistische Analyse und Verarbeitung von Klimadaten. Entwicklung und Integration experimenteller geowissenschaftlicher Forschungsinstrumente unter Verwendung bestehender Modelle und Datensätze (z. B. ERA5) und Erleichterung des Hochladens von Nutzerdaten.
  • Bereitstellung und Integration:
    • Implementierung und Feinabstimmung von Open-Source-LLMs (z. B. DeepSeek, Llama, Gemma) für den Einsatz in der HPC-Infrastruktur des DKRZ. Sicherstellung der nahtlosen Integration mit DKRZ-Diensten, einschließlich Cloud-Speicher und HPC-Job-Scheduling über SLURM. Nahtlose Integration von chatGRT in die Freva-Analyseplattform am DKRZ als FrevaGPT, um die Benutzerfreundlichkeit zu erhöhen.
  • Benchmarking und Tests:
    • Zusammenarbeit mit Fachwissenschaftlern bei der Entwicklung von Benchmark-Tests für allgemeine Klimaaufgaben (z. B. Berechnung des ENSO-Index) und HPC-Job-Skriptformulierungen. Überwachung von Leistung, Geschwindigkeit und wissenschaftlicher Genauigkeit, um das System iterativ zu verfeinern.
  • Sicherheit und verantwortungsvolle KI:
    • Entwicklung eines sicheren, verantwortungsvollen KI-Rahmens, der die Antworten des Modells auf wissenschaftliche Abfragen einschränkt und böswillige Ratschläge verhindert. Einrichtung von Pipelines für die Verarbeitung von Nutzerfeedback und die Pflege des Systems durch regelmäßige Updates und Überwachung.
  • Dokumentation und Zusammenarbeit:
    • Beitrag zu einer umfassenden Dokumentation und Gewährleistung der Reproduzierbarkeit in verschiedenen Programmier- und virtuellen Umgebungen. Engagieren Sie sich mit der breiteren wissenschaftlichen Gemeinschaft, indem Sie Prototypen auf Plattformen wie GitHub teilen und Workshops einrichten.

Qualifikationen:

  • Sie verfügen über einen Masterabschluss in Informatik, Naturwissenschaften oder einer vergleichbaren Ausbildung mit Schwerpunkt Informationstechnologie. Ein Doktortitel ist ein Plus.
  • Erfahrung mit KI/ML, ihren Softwarekomponenten und großen Sprachmodellarchitekturen.
  • Erfahrung mit Hochleistungsrechnersystemen (HPC), Software-Engineering, Daten-Workflows und wissenschaftlichen Analysen.
  • Gute Programmierkenntnisse (Python), insbesondere in Umgebungen, die für die Datenverarbeitung relevant sind (CLI). Erfahrung mit wissenschaftlichen Gateway-Technologien ist ein Plus.
  • Ausgezeichnete Kommunikationsfähigkeiten in Englisch; Deutsch ist ein Plus.
  • Sie sind ein Teamplayer mit ausgezeichneten Problemlösungsfähigkeiten und haben ein großes Interesse daran, zur klimawissenschaftlichen Forschung beizutragen.

Wie wir und Sie arbeiten werden:

  • Anwendung agiler Methoden wie Scrum/Kanban, Pair Programming, Code Reviews und testgetriebene Entwicklung.
  • Zusammenarbeit in kleinen Teams, Einbindung in neue Technologien und Wissensaustausch mit Kollegen.
  • Flexible Arbeitszeiten mit der Möglichkeit zur Telearbeit oder in unserem modernen Büro im Herzen von Hamburg.

Dauer und Arbeitsplan:

Die Stelle ist in der Abteilung Datenanalyse des Deutschen Klimarechenzentrums (DKRZ) in Hamburg angesiedelt. Stellenantritt zum nächstmöglichen Zeitpunkt, Dauer 36 Monate. Die Bezahlung erfolgt in Anlehnung an den öffentlichen Dienst (TVöD-Bund entsprechend der Qualifikation), einschließlich umfangreicher Sozialversicherungspläne. Die Beschäftigungsbedingungen richten sich nach den Bestimmungen des deutschen öffentlichen Dienstes.

Bewerbungsprozess:

Um sich für diese Stelle zu bewerben, senden Sie bitte Ihren aktualisierten Lebenslauf, Ihr Anschreiben und alle relevanten Nachweise an YmV3ZXJidW5nZW5AZGtyei5kZQ== mit der Referenznummer DKRZ 01_2025. Bitte heben Sie in Ihrem Anschreiben Ihre Erfahrungen und Qualifikationen in Bezug auf Softwaremanagement, Datenkoordination und klimawissenschaftliche Forschung hervor.

Deadline für Bewerbungen:

Die Bewerbungen werden bis zum 6. April 2025 angenommen.

Arbeiten Sie mit uns am DKRZ zusammen, um die Effizienz und Effektivität der Klima- und Erdsystemmodellierung durch fortschrittliche Datenverarbeitung und Optimierungstechniken zu verbessern. Gemeinsam können wir die Wissenschaft des Klimawandels durch technologischen Fortschritt vorantreiben und so zu einer nachhaltigeren und widerstandsfähigeren Zukunft beitragen.

Für weitere Informationen wenden Sie sich bitte an Christopher Kadow (a2Fkb3dAZGtyei5kZQ== )