Σύστημα τεχνητής νοημοσύνης που αναπτύχθηκε από την DeepMind, θυγατρική της Google με έδρα το Λονδίνο, κατάφερε αυτό που οι βιολόγοι προσπαθούν να πετύχουν εδώ και μισό αιώνα.
Η AI της DeepMind μπόρεσε να υπολογίσει το τρισδιάστατο σχήμα μιας ποικιλίας πρωτεϊνών γνωρίζοντας μόνο την αλληλουχία των αμινοξέων από τα οποία αποτελούνται οι πρωτεΐνες.
Το θεαματικό επίτευγμα αναμένεται να φέρει επανάσταση στις βιοϊατρικές επιστήμες, καθώς μεταξύ άλλων αναμένεται να επιταχύνει τον σχεδιασμό φαρμάκων.
Το επίτευγμα «αλλάζει τους κανόνες του παιχνιδιού» σχολιάζει στο περιοδικό Nature ο Άντρεϊ Λούπας, βιολόγος του Ινστιτούτου Αναπτυξιακής Βιολογίας «Μαξ Πλανκ» στη Γερμανία, ο οποίος συμμετείχε ως κριτής στον μεγάλο, διεθνή διαγωνισμό που κέρδισε η DeepMind.
«Θα αλλάξει την ιατρική. Θα αλλάξει την έρευνα. Θα αλλάξει την εμβιομηχανική. Θα αλλάξει τα πάντα» προέβλεψε ενθουσιασμένος.
H πρόβλεψη της τεχνητής νοημοσύνης (μπλε) ταιριάζει σχεδόν απόλυτα με τα πειραματικά δεδομένα (Πηγή: DeepMind)
Η DeepMind ανακηρύχθηκε νικητής στον διεθνή διαγωνισμό CASP (Critical Assessment of Protein Structure Prediction), στον οποίο οι διαγωνιζόμενοι καλούνται να προσδιορίσουν την τρισδιάστατη δομή μιας σειράς πρωτεϊνών. Η τεχνητή νοημοσύνη της εταιρείας πέτυχε σκορ 92 στα 100, επίδοση που σημαίνει ότι οι προβλέψεις της ταιριάζουν σχεδόν απόλυτα με τα πειραματικά δεδομένα.
Το σύστημα χρειάστηκε μόλις μερικές ημέρες για κάθε πρόβλεψη, η οποία θα απαιτούσε μήνες ή και χρόνια προσπαθειών στο εργαστήριο. Εδώ και δεκαετίες, τα κύρια εργαλεία για τον προσδιορισμό της τρισδιάστατης δομής πρωτεϊνών ήταν η κρυσταλλογραφία ακτίνων Χ και η κρυοηλεκτρονική μικροσκοπία, απαιτητικές τεχνικές που δεν δίνουν πάντα αποτέλεσμα.
Μέχρι σήμερα οι επιστήμονες έχουν προσδιορίσει τη δομή μόλις 170.000 πρωτεϊνών, από τις συνολικά 200 εκατομμύρια πρωτεΐνες που έχουν αναγνωριστεί ως σήμερα.
Τι είναι οι πρωτεΐνες;
Τα γονίδια περιέχουν πληροφορίες για τη συναρμολόγηση πρωτεϊνών, μεγάλων μορίων που αποτελούνται από δεκάδες ή εκατοντάδες αμινοξέα ενωμένα στη σειρά. Παρόλο που παράγονται ως γραμμικά μόρια, οι πρωτεΐνες αναδιπλώνονται αμέσως μετά τη σύνθεσή τους και αποκτούν περίπλοκες τρισδιάστατες δομές, από τις οποίες εξαρτάται και η λειτουργία τους.
Για παράδειγμα, η τρισδιάστατη δομή της λεγόμενης «πρωτεΐνης-ακίδας» επιτρέπει στον κοροναϊό SARS-CoV-2 να συνδέεται σε έναν συγκεκριμένο υποδοχέα των κυττάρων, όπως ταιριάζει ένα κλειδί στην κλειδαριά. Χωρίς τη γνώση της τρισδιάστατης δομής της ακίδας, οι προσπάθειες ανάπτυξης φαρμάκων δεν θα είχαν πού να βασιστούν.
Μοντέλο της πρωτεΐνης-ακίδας του κοροναϊού. Το σχήμα της τής επιτρέπει να συνδέεται στα ανθρώπινα κύτταρα όπως το κλειδί στην κλειδαριά (US NIAID)
Οι πρωτεΐνες χρησιμεύουν ως δομικά στοιχεία των κυττάρων, ως ένζυμα για την κατάλυση χημικών αντιδράσεων, ως ορμόνες ή ως αντισώματα. Καμία λειτουργία των κυττάρων δεν θα ήταν εφικτή χωρίς αυτά τα πολυμήχανα βιομόρια.
Τη δεκαετία του 1960, οι βιολόγοι συνειδητοποίησαν ότι θεωρητικά θα μπορούσε κανείς να προσδιορίσει την τρισδιάστατη δομή πρωτεϊνών απλά εξετάζοντας την αλληλουχία αμινοξέων. Η εφαρμογή της ιδέας στην πράξη αποδείχθηκε όμως δύσκολη υπόθεση.
«Το πρόβλημα έχει ηλικία 50 ετών» επισήμανε στο περιοδικό Science ο Τζον Μάουλτ, βιολόγος του Πανεπιστημίου του Μέριλαντ.
«Ποτέ δεν περίμενα ότι θα έβλεπα τη λύση όσο ζω» είπε.
AlphaFold
Το 1994, ο Μάουλτ και οι συνεργάτες του διοργάνωσαν τον πρώτο διαγωνισμό CASP, ο οποίος επαναλαμβάνεται έκτοτε κάθε δύο χρόνια. Μέχρι το 2016, οι επιδόσεις των διαγωνιζόμενων δεν υπερέβαιναν τους 40 πόντους στους 100, κάτι που σημαίνει ότι οι προβλέψεις τους ήταν σχεδόν άχρηστες στην πράξη.
Μια σημαντική εξέλιξη ήρθε το 2018, όταν η τεχνητή νοημοσύνη της DeepMind, με την ονομασία AlphaFold, πέτυχε μέση βαθμολογία 60 τοις εκατό και ανακηρύχθηκε νικητής του διαγωνισμού εκείνο το έτος.
Το σύστημα βασίζεται στην τεχνική της «μηχανικής μάθησης», δηλαδή τη μάθηση μέσα από παραδείγματα. Η ΑΙ τροφοδοτήθηκε με τις αμινοξικές αλληλουχίες των 170.000 πρωτεϊνών που έχουν λυθεί ως σήμερα, μαζί με τις τρισδιάστατες δομές τους, προκειμένου να μάθει να προσδιορίσει τη δομή άγνωστων πρωτεϊνών.
Φέτος, η τεχνητή νοημοσύνη συμμετείχε στον διαγωνισμό αναβαθμισμένη. Η DeepMind συνδύασε την μηχανική μάθηση με έναν αλγόριθμο, ο οποίος κατά κάποιον τρόπο μιμείται την τακτική που θα εφάρμοζε ένας άνθρωπος για να λύσει ένα μεγάλο παζλ: πρώτα συνδυάζει κομμάτια μιας μικρής περιοχής του παζλ (τμήματα της αμινοξικής αλληλουχίας στη συγκεκριμένη περίπτωση) και μετά προσπαθεί να ενώσει τις επιμέρους περιοχές σε μια ενιαία εικόνα.
Η αναβάθμιση του συστήματος απέδωσε καρπούς, καθώς στον φετινό διαγωνισμό η βαθμολογία της AI εκτινάχθηκε στο 92,4 στα 100 κατά μέσο όρο. Ο αλγόριθμος κατάφερε να προσδιορίσει τη δομή ακόμα και πρωτεϊνών που βρίσκονται πάνω και μέσα στην κυτταρική μεμβράνη, οι οποίες θεωρούνται ιδιαίτερα δύσκολες περιπτώσεις.
Οι επιδόσεις ήταν τόσο θεαματικές ώστε οι διοργανωτές του διαγωνιασμού άρχισαν να υποψιάζονται ότι η DeepMind έκλεβε με κάποιον τρόπο. Ο Άντρεϊ Λούπας του Ινστιτούτου «Μαξ Πλανκ» παρουσίασε τότε μια νέα πρόκληση, μια βακτηριακή πρωτεΐνη της οποίας τη δομή προσπαθούσε μάταια να προσδιορίσει εδώ και δέκα χρόνια.
Το AlphaFold βρήκε σύντομα τη λύση. Το λεπτομερές μοντέλο της AI επέτρεψε στον Λούπας να ερμηνεύσει τα πειραματικά δεδομένα και να βεβαιωθεί ότι η πρόβλεψη της DeepMind ήταν ορθή.
«Είναι σχεδόν τέλεια. Δεν θα ήταν δυνατόν να έχουν κλέψει. Δεν γνωρίζω πώς το κάνουν» λέει ο Λούπας στο Science.
Η τεχνητή νοημοσύνη είναι εντυπωσιακά καλή, όχι όμως τέλεια. Απέτυχε μεταξύ άλλων να βρει τη δομή μιας πρωτεΐνης που αποτελείται από 52 επαναλαμβανόμενα τμήματα, τα οποία επηρεάζουν το ένα το σχήμα του άλλου.
H DeepMind σκοπεύει πάντως να εκπαιδεύσει το σύστημα ώστε να λύνει τέτοιες πρωτεΐνες, καθώς και να προσδιορίζει τις δομές πρωτεϊνών που ενώνονται σε σύμπλοκα.
Η εταιρεία δεσμεύεται επίσης από τους όρους του διαγωνισμού να αποκαλύψει λεπτομέρειες για τον τρόπο λειτουργίας του συστήματος, κάτι που σημαίνει ότι επιστήμονες σε όλο τον κόσμο θα μπορέσουν να αξιοποιήσουν τη μελέτη.
«Μόλις τώρα αρχίζουμε να καταλαβαίνουμε τι χρειάζονται οι βιολόγοι» λέει ο Ντέμις Χασάμπις, ο βρετανοκύπριος ιδρυτής και διευθύνων σύμβουλος της DeepMind.
«Πιστεύω ότι είναι το πιο σημαντικό επίτευγμά μας όσον αφορά τις συνέπειες στον πραγματικό κόσμο» λέει.
Στον φετινό διαγωνισμό CASP συμμετείχαν επίσης η Microsoft και ο κινεζικός γίγαντας της τεχνολογίας Tencent, έζησαν όμως μια ντροπιαστική ήττα από τη λονδρέζικη εταιρεία του Χασάμπις.
TAGS