Μια νέα μελέτη που δημοσιεύθηκε στο περιοδικό Science και προέρχεται από ερευνητική ομάδα της Ιατρικής Σχολής του Harvard Medical School και του Beth Israel Deaconess Medical Center επαναφέρει στο προσκήνιο τη συζήτηση για τον ρόλο της τεχνητής νοημοσύνης στην κλινική ιατρική, ιδιαίτερα στα τμήματα επειγόντων περιστατικών.
Η έρευνα αξιολόγησε την απόδοση μεγάλων γλωσσικών μοντέλων της OpenAI, όπως τα o1 και 4o, σε πραγματικά ιατρικά περιστατικά, συγκρίνοντάς τα με διαγνώσεις δύο έμπειρων γιατρών εσωτερικής παθολογίας. Συνολικά εξετάστηκαν 76 ασθενείς που προσήλθαν στο τμήμα επειγόντων του Beth Israel Deaconess Medical Center, με τις διαγνώσεις να αξιολογούνται από ανεξάρτητους γιατρούς που δεν γνώριζαν την προέλευσή τους.
Σύμφωνα με τα αποτελέσματα, το μοντέλο o1 παρουσίασε ακρίβεια «ίσης ή και καλύτερης» από τους γιατρούς σε κάθε στάδιο της διαγνωστικής διαδικασίας, με τη μεγαλύτερη διαφορά να καταγράφεται στο αρχικό στάδιο της διαλογής, όπου οι διαθέσιμες πληροφορίες είναι περιορισμένες και ο χρόνος κρίσιμος. Σε αυτό το στάδιο, το AI πέτυχε σωστή ή σχεδόν σωστή διάγνωση στο 67% των περιπτώσεων, έναντι 55% και 50% για τους δύο γιατρούς.

Οι ερευνητές διευκρίνισαν ότι τα μοντέλα δεν εκπαιδεύτηκαν ειδικά για τη μελέτη, αλλά τροφοδοτήθηκαν με τα ίδια δεδομένα που είχαν στη διάθεσή τους οι γιατροί μέσω των ηλεκτρονικών ιατρικών φακέλων, χωρίς επιπλέον επεξεργασία ή προσαρμογή.
Ο Arjun Manrai, ένας από τους επικεφαλής ερευνητές, χαρακτήρισε τα αποτελέσματα ενδεικτικά της ταχείας προόδου των μοντέλων, σημειώνοντας ότι σε πολλαπλά σενάρια το AI ξεπέρασε ή ισοφάρισε τις ανθρώπινες επιδόσεις.
Ωστόσο, οι ίδιοι οι ερευνητές και ανεξάρτητοι σχολιαστές τονίζουν ότι τα ευρήματα δεν σημαίνουν πως η τεχνητή νοημοσύνη είναι έτοιμη να αναλάβει κλινικές αποφάσεις. Ο Adam Rodman από το Beth Israel προειδοποίησε ότι απουσιάζει ακόμη ένα σαφές πλαίσιο λογοδοσίας, ενώ άλλοι ειδικοί επισήμαναν ότι η μελέτη δεν έγινε σε πραγματικούς γιατρούς επειγόντων περιστατικών, κάτι που περιορίζει τη γενίκευση των αποτελεσμάτων.

Όπως αναφέρει το techcrunch.com, υπογραμμίζεται ότι η ανάλυση βασίστηκε αποκλειστικά σε δεδομένα κειμένου, ενώ στην κλινική πράξη η ιατρική διάγνωση απαιτεί συνδυασμό εικόνων, εξετάσεων και φυσικής εξέτασης.
Η μελέτη, παρότι εντυπωσιακή, δεν επιχειρεί να αντικαταστήσει τον ανθρώπινο παράγοντα. Αντίθετα, όπως σημειώνουν οι συγγραφείς της, αναδεικνύει την ανάγκη για αυστηρές δοκιμές σε πραγματικές συνθήκες πριν η τεχνητή νοημοσύνη ενταχθεί ουσιαστικά στο σύστημα υγείας.