Wie macht man 30 Jahre an Daten zugänglich?

Im Gespräch mit Jonas Münch, der bei Bayer einen RAG-Chatbot entwickelt hat, der 30 Jahre interne Daten und klinische Ergebnisse an einem Ort vereint.
von
Bertram Weiss

Im Gespräch mit Jonas Münch, der bei Bayer einen RAG (Retrieval Augmented Generation) Chatbot entwickelt hat, der 30 Jahre interne Daten und klinische Ergebnisse an einem Ort vereint.

Bei unserem letzten Event hatten wir das Vergnügen, Jonas Münch zu begrüßen, der zusammen mit seinem Team PRINCE (Preclinical Information Center) entwickelt hat. PRINCE ist eine Datenplattform, die einen KI-gesteuerten Chatbot umfasst, der speziell für Bayer maßgeschneidert wurde. Er fungiert als Forscher, Schreiber und Reviewer und hat Zugriff auf rund drei Jahrzehnte interne Daten. Jonas sprach darüber, wie Bayer eine Vielzahl digitaler Assistenten nutzt, von maschinellen Lernwerkzeugen bis hin zu generativen KI-Lösungen. Er teilte spannende Einblicke in die Entwicklung des Chatbots, die Herausforderungen, denen er und sein Team begegneten, sowie die wichtigsten Lektionen, die sie gelernt haben. Für alle, die es verpasst haben, hier ein kurzes Interview, das die Höhepunkte seines Vortrags zusammenfasst.

Kannst du dich kurz vorstellen?
Als Leiter der Abteilung IT für Pharmakologie & Sicherheit bei Bayer bin ich verantwortlich für die Digitalisierung des präklinischen Bereichs innerhalb unserer Pharmasparte. Ich führe ein Team aus internen und externen Softwareentwicklern und Produktmanagern, das hochspezialisierte Softwareprodukte entwickelt, um die tägliche Arbeit unserer Wissenschaftler zu verbessern.

Mit welchen typischen Herausforderungen bist du in deiner Arbeit konfrontiert?
Eine häufige Herausforderung, der wir begegnen, ist der Zugang zu und die Verfügbarkeit unserer internen Daten. In der Pharmaindustrie investieren wir Milliarden von Euro in die Erzeugung von Forschungsdaten; allerdings sind wir noch nicht gut darin, diese wertvollen Informationen über den ursprünglichen Anwendungszweck hinaus wiederzuverwenden, um neue Erkenntnisse zu gewinnen.

Wie bist du dieses Problem mit KI im Vergleich zu anderen Lösungsansätzen angegangen?
In unserem aktuellen Vorhaben, die Auffindbarkeit und Zugänglichkeit von Daten zu verbessern, indem wir Datensilos aufbrechen und eine neue Datenplattform schaffen, stießen wir bald auf das Problem, Erkenntnisse aus älteren, unstrukturierten Daten zu extrahieren. Das Hauptproblem besteht darin, dass viele ältere Studienberichte wichtige Annotationen fehlen und oft nur als gescannte PDF-Dokumente vorliegen. Durch den Einsatz automatisierter Inhaltsextraktion und großer Sprachmodelle können wir nun alle unsere Daten für jeden im Unternehmen zugänglich machen – etwas, das mit herkömmlichen Suchalgorithmen zuvor schwer zu erreichen war.

Wie sieht die Lösung aus und welche Auswirkungen hat sie?
Mit unserer Lösung stellen wir unseren Wissenschaftlern eine intuitive Benutzeroberfläche zur Verfügung, mit der sie auf die Daten der letzten 30 Jahre zugreifen können. Ähnlich wie ein Chatbot können die Nutzer nicht nur vorhandene Informationen abrufen, sondern auch unsere Wissensmaschine Ergebnisse interpretieren lassen und komplexe Vergleiche sowie Integrationen direkt in einer benutzerfreundlichen Oberfläche durchführen.

Was haben Sie bei der Entwicklung dieser KI-gesteuerten Lösung gelernt?
Wir haben festgestellt, dass der Aufbau eines funktionierenden RAG-basierten Prototyps relativ einfach und schnell zu realisieren ist. Allerdings ist es eine Herausforderung, den Prototyp so zu optimieren, dass er konsistent genaue und verlässliche Ergebnisse liefert. Dies erfordert umfangreiche Anpassungen, bei denen die Endnutzer kontinuierlich eingebunden sind. Konsistenz und ständige Verbesserungen sind entscheidend, um das Vertrauen der Benutzer aufzubauen, was eine Grundvoraussetzung für den Erfolg unserer präklinischen Wissensmaschine ist.

Welches ist die nächste Herausforderung, die Sie mit KI angehen wollen?
Unser nächstes Ziel ist es, nicht nur Daten abzufragen, sondern etwas Neues zu generieren. In unserer Vision für die nächste Entwicklungsstufe des Systems wollen wir einen Schreibassistenten für standardisierte Dokumente entwickeln. Dies würde unseren Nutzern erheblich Zeit sparen und letztendlich die Qualität verbessern. Wir haben bereits einen funktionierenden Prototypen für ein compliance-relevantes Dokument und arbeiten derzeit mit unseren Nutzern zusammen, um es für den täglichen Gebrauch praktisch zu machen.

Fazit 

Dieses Beispiel aus der Praxis zeigt den enormen Wert, den die Nutzung bestehender Daten zur Erschließung neuer Potenziale bietet. Durch die effektive Integration von KI-Lösungen in den Arbeitsalltag können Unternehmen ihre Produktivität und Effizienz erheblich steigern. Unsere wichtigsten Erkenntnisse:

  1. Datenzugänglichkeit ist entscheidend: Eine der größten Herausforderungen bei Bayer bestand darin, 30 Jahre unstrukturierte, oft schwer zugängliche Daten nutzbar zu machen. Durch automatisierte Inhaltsextraktion und den Einsatz großer Sprachmodelle hat Bayer diese Daten zu einer wertvollen Ressource für seine Wissenschaftler gemacht.
  2. KI steigert die Produktivität: Durch die Entwicklung von PRINCE, einem KI-gesteuerten Chatbot, hat Bayer seinen Wissenschaftlern die Möglichkeit gegeben, interne Daten einfach abzufragen, Ergebnisse zu interpretieren und sogar komplexe Analysen in einer benutzerfreundlichen Oberfläche durchzuführen, was ihre Forschungsprozesse erheblich beschleunigt.
  3. Anpassung und Nutzerbeteiligung sind unerlässlich: Der Bau eines funktionierenden RAG-Chatbots war nur der Anfang. Ständige Anpassungen und die Einbindung der Endnutzer waren entscheidend, um sicherzustellen, dass das Tool genaue, verlässliche Ergebnisse liefert und das Vertrauen der Nutzer gewinnt.

Jetzt im Merantix Momentum Newsletter anmelden.

Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.

Weitere Artikel

Die neuesten Branchennachrichten, Interviews, Technologien und Ressourcen.

Von Datenchaos zu Durchbrüchen

Die Rolle von Künstlicher Intelligenz bei der Identifizierung von Wirkstoffzielen und ungedeckten medizinischen Bedürfnissen.

AI Readiness in the Industrial Sector - Do’s and Don’ts

Zu unserer ersten Ausgabe der Reihe "The AI Interview" zum Thema AI Readiness in the Industrial Sector.

Building Better Medicines: Exploring AI-Driven Compound Optimization

Ein Experteninterview zur Forschung von KI-gesteuerter Wirkstoffoptimierung.

Von Datenchaos zu Durchbrüchen

Die Rolle von Künstlicher Intelligenz bei der Identifizierung von Wirkstoffzielen und ungedeckten medizinischen Bedürfnissen.

Verlässliche und krisenresistente Bestandsoptimierung

Revolutionierung der Lieferkettenoptimierung.

Wie macht man 30 Jahre an Daten zugänglich?

Im Gespräch mit Jonas Münch, der bei Bayer einen RAG (Retrieval Augmented Generation) Chatbot entwickelt hat, der 30 Jahre interne Daten und klinische Ergebnisse an einem Ort vereint.

Bei unserem letzten Event hatten wir das Vergnügen, Jonas Münch zu begrüßen, der zusammen mit seinem Team PRINCE (Preclinical Information Center) entwickelt hat. PRINCE ist eine Datenplattform, die einen KI-gesteuerten Chatbot umfasst, der speziell für Bayer maßgeschneidert wurde. Er fungiert als Forscher, Schreiber und Reviewer und hat Zugriff auf rund drei Jahrzehnte interne Daten. Jonas sprach darüber, wie Bayer eine Vielzahl digitaler Assistenten nutzt, von maschinellen Lernwerkzeugen bis hin zu generativen KI-Lösungen. Er teilte spannende Einblicke in die Entwicklung des Chatbots, die Herausforderungen, denen er und sein Team begegneten, sowie die wichtigsten Lektionen, die sie gelernt haben. Für alle, die es verpasst haben, hier ein kurzes Interview, das die Höhepunkte seines Vortrags zusammenfasst.

Kannst du dich kurz vorstellen?
Als Leiter der Abteilung IT für Pharmakologie & Sicherheit bei Bayer bin ich verantwortlich für die Digitalisierung des präklinischen Bereichs innerhalb unserer Pharmasparte. Ich führe ein Team aus internen und externen Softwareentwicklern und Produktmanagern, das hochspezialisierte Softwareprodukte entwickelt, um die tägliche Arbeit unserer Wissenschaftler zu verbessern.

Mit welchen typischen Herausforderungen bist du in deiner Arbeit konfrontiert?
Eine häufige Herausforderung, der wir begegnen, ist der Zugang zu und die Verfügbarkeit unserer internen Daten. In der Pharmaindustrie investieren wir Milliarden von Euro in die Erzeugung von Forschungsdaten; allerdings sind wir noch nicht gut darin, diese wertvollen Informationen über den ursprünglichen Anwendungszweck hinaus wiederzuverwenden, um neue Erkenntnisse zu gewinnen.

Wie bist du dieses Problem mit KI im Vergleich zu anderen Lösungsansätzen angegangen?
In unserem aktuellen Vorhaben, die Auffindbarkeit und Zugänglichkeit von Daten zu verbessern, indem wir Datensilos aufbrechen und eine neue Datenplattform schaffen, stießen wir bald auf das Problem, Erkenntnisse aus älteren, unstrukturierten Daten zu extrahieren. Das Hauptproblem besteht darin, dass viele ältere Studienberichte wichtige Annotationen fehlen und oft nur als gescannte PDF-Dokumente vorliegen. Durch den Einsatz automatisierter Inhaltsextraktion und großer Sprachmodelle können wir nun alle unsere Daten für jeden im Unternehmen zugänglich machen – etwas, das mit herkömmlichen Suchalgorithmen zuvor schwer zu erreichen war.

Wie sieht die Lösung aus und welche Auswirkungen hat sie?
Mit unserer Lösung stellen wir unseren Wissenschaftlern eine intuitive Benutzeroberfläche zur Verfügung, mit der sie auf die Daten der letzten 30 Jahre zugreifen können. Ähnlich wie ein Chatbot können die Nutzer nicht nur vorhandene Informationen abrufen, sondern auch unsere Wissensmaschine Ergebnisse interpretieren lassen und komplexe Vergleiche sowie Integrationen direkt in einer benutzerfreundlichen Oberfläche durchführen.

Was haben Sie bei der Entwicklung dieser KI-gesteuerten Lösung gelernt?
Wir haben festgestellt, dass der Aufbau eines funktionierenden RAG-basierten Prototyps relativ einfach und schnell zu realisieren ist. Allerdings ist es eine Herausforderung, den Prototyp so zu optimieren, dass er konsistent genaue und verlässliche Ergebnisse liefert. Dies erfordert umfangreiche Anpassungen, bei denen die Endnutzer kontinuierlich eingebunden sind. Konsistenz und ständige Verbesserungen sind entscheidend, um das Vertrauen der Benutzer aufzubauen, was eine Grundvoraussetzung für den Erfolg unserer präklinischen Wissensmaschine ist.

Welches ist die nächste Herausforderung, die Sie mit KI angehen wollen?
Unser nächstes Ziel ist es, nicht nur Daten abzufragen, sondern etwas Neues zu generieren. In unserer Vision für die nächste Entwicklungsstufe des Systems wollen wir einen Schreibassistenten für standardisierte Dokumente entwickeln. Dies würde unseren Nutzern erheblich Zeit sparen und letztendlich die Qualität verbessern. Wir haben bereits einen funktionierenden Prototypen für ein compliance-relevantes Dokument und arbeiten derzeit mit unseren Nutzern zusammen, um es für den täglichen Gebrauch praktisch zu machen.

Fazit 

Dieses Beispiel aus der Praxis zeigt den enormen Wert, den die Nutzung bestehender Daten zur Erschließung neuer Potenziale bietet. Durch die effektive Integration von KI-Lösungen in den Arbeitsalltag können Unternehmen ihre Produktivität und Effizienz erheblich steigern. Unsere wichtigsten Erkenntnisse:

  1. Datenzugänglichkeit ist entscheidend: Eine der größten Herausforderungen bei Bayer bestand darin, 30 Jahre unstrukturierte, oft schwer zugängliche Daten nutzbar zu machen. Durch automatisierte Inhaltsextraktion und den Einsatz großer Sprachmodelle hat Bayer diese Daten zu einer wertvollen Ressource für seine Wissenschaftler gemacht.
  2. KI steigert die Produktivität: Durch die Entwicklung von PRINCE, einem KI-gesteuerten Chatbot, hat Bayer seinen Wissenschaftlern die Möglichkeit gegeben, interne Daten einfach abzufragen, Ergebnisse zu interpretieren und sogar komplexe Analysen in einer benutzerfreundlichen Oberfläche durchzuführen, was ihre Forschungsprozesse erheblich beschleunigt.
  3. Anpassung und Nutzerbeteiligung sind unerlässlich: Der Bau eines funktionierenden RAG-Chatbots war nur der Anfang. Ständige Anpassungen und die Einbindung der Endnutzer waren entscheidend, um sicherzustellen, dass das Tool genaue, verlässliche Ergebnisse liefert und das Vertrauen der Nutzer gewinnt.
Oops! Da ist etwas schiefgelaufen.
Oops! Da ist etwas schiefgelaufen.
Oops! Da ist etwas schiefgelaufen.
Oops! Da ist etwas schiefgelaufen.

Mehr Whitepaper entdecken

Towards Tabular Foundation Models

Über den Status Quo, Herausforderungen und Chancen

Der AI Canvas: Unser Tool zur Projektevaluation

Entdecken Sie den AI Canvas!

Datengetrieben zum Medikament von Morgen

Chancen und Hindernisse der KI in einer GxP Welt.

Der AI Canvas: Unser Tool zur Projektevaluation

Entdecken Sie den AI Canvas!

Towards Tabular Foundation Models

Über den Status Quo, Herausforderungen und Chancen

Datengetrieben zum Medikament von Morgen

Chancen und Hindernisse der KI in einer GxP Welt.
Wir möchten Sie kennenlernen!

Jetzt Ihre KI-Reise mit uns starten

Jetzt im Merantix Momentum Newsletter anmelden.

Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.