GI-Logo
GI-Regionalgruppe Südbaden


Die GI-Regionalgruppe Südbaden lädt ein zum Vortrag:

Bioinformatik-Softwareentwicklung bei Roche Basel

Dipl. Inform. Detlef Wolf

Mittwoch, 24. November 1999, 20:15 Uhr
Universität Freiburg, Hörsaal 3117
Universitätszentrum, Kollegiengebäude I

Abstract

Ziel der Bioinformatik bei F.Hoffmann-La Roche in Basel ist die Unterstuetzung des Wirkstoffentdeckungsprozesses durch in-silico Modelle von Molekuelen, Molekuelkomplexen, Erbinformationen, sowie Stoffwechsel- und Signaluebertragungspfaden. Die berechneten Vorhersagen helfen bei der Versuchsplanung und -auswertung. Bioinformatik erfordert hauptsaechlich Kenntnisse in den Disziplinen Biochemie, Genetik, Statistik und Informatik.

Bioinformatik-Software wird bei der Gewinnung von Erbinformation (DNA sequence assembly), bei der funktionalen Interpretation der DNA-Sequenz (z.B. durch Aehnlichkeitssuche und genetische Karten) und neuerdings bei der Erforschung zellulaerer Regelungsmechanism (durch Gruppierung und Visualisierung von Messungen der Genaktivitaet) eingesetzt. Diese Software wird soweit in ausreichender Qualitaet vorhanden aus der Public Domain bezogen (z.B. BLAST, Hidden Markow Modelle) oder am Markt eingekauft (z.B. GCG, MineSet). Da dies nur teilweise moeglich ist, werden Algorithmen auch im Hause entwickelt und/oder re-implementiert. Darueber hinaus wird die Integrationsarbeit vollstaendig intern geleistet.

Wir verwenden als primaere Benutzeroberflaeche WWW/HTML/CGI. Fuer die Persistenz sorgen Oracle und das Filesystem. Datenverteilung ueber Roche-Forschungszentren hinweg geschieht ueber Skripts und SQL/Net. Fuer die "Business Objects", d.h. die biologischen Hauptobjekte, haben wir die Klassen "SequenceObject" und "AlignmentObject", sowie Container fuer Instanzen dieser Klassen entwickelt. Diese Klassen besitzen u.a. Funktionen zur Serialisierung/De-serialiserung. Das SequenceObject erlaubt darueber hinaus die sinnvolle Ueberlagerung von Daten aus verschiedenen Quellen (z.B. aus automatischen Genvorhersagen und manuell erstellten Korrekturen), wodurch den Biologen eine Gesamtsicht der textuellen Information zu z.B. einem Gen moeglicht wird.

Ein auf TCP/IP basierendes Kommunikationsmodul ermoeglicht uns die Erstellung von Applikationsservern (zum Beispiel fuer genomische Karten), die anwendungsspezifisches Caching durchfuehren um die Antwortzeit zu verringern.

Aus Gruenden der Skalierbarkeit, Wiederverwendbarkeit und Portabilitaet entwickeln wir in C und realisieren Instanzierung ueber typedef/malloc sowie Vererbung und virtuelle Funktionen ueber Funktionspointer. Die entwickelten Klassen werden in einer Bibilothek verwaltet. Wir achten darauf, das der "wer-benutzt-wen-Graph" auf jeder Ebene (Modul, Library, Subsystem) zyklenfrei ist. Die "Trace Assertion Method" (deren Urspruenge auf D.L.Parnas, 1978, zurueckgehen) wird zum vollstaendigen und redunanzarmen Abfassen von Modulbeschreibungen verwendet. Wir benutzen einige der "Design Patterns" von Erich Gamma et. al. . Einfache selbstgeschriebene Werkzeuge nehmen Regressionstests vor, extrahieren Dokumentationen aus dem Programmcode und listen Verwendungsstellen einer Funktion auf.

Die Veranstaltungen der Regionalgruppe sind offen für alle Interessierten!


GI-Regionalgruppe Südbaden / Herbert Damker / 22.11.1999