Η τεχνητή νοημοσύνη αποτυγχάνει ως ιατρικός σύμβουλος

Νέα έρευνα που δημοσιεύτηκε στο επιστημονικό περιοδικό Nature Medicine αμφισβητεί τη χρήση της τεχνητής νοημοσύνης ως ιατρικής συμβουλής για τον μέσο πολίτη. Η μελέτη διεξήχθη στο Ηνωμένο Βασίλειο με 1.298 συμμετέχοντες, οι οποίοι αξιολόγησαν δέκα ιατρικά σενάρια σχεδιασμένα από ειδικούς γιατρούς. Τα αποτελέσματα αποκαλύπτουν ένα ανησυχητικό χάσμα ανάμεσα στις ικανότητες που επιδεικνύουν τα γλωσσικά μοντέλα σε συνθήκες εργαστηρίου και στην πραγματική τους αξία όταν τα χρησιμοποιούν άνθρωποι χωρίς ιατρικές γνώσεις. Το ουσιαστικό ερώτημα δεν ήταν αν η τεχνητή νοημοσύνη γνωρίζει ιατρική, αλλά αν μπορεί να βοηθήσει έναν ανήσυχο πολίτη να πάρει σωστές αποφάσεις.

Διαβάστε επίσης: Η τεχνητή νοημοσύνη αναζητά φιλοσόφους στη Silicon Valley

Τα ευρήματα της μελέτης στο Nature Medicine

Η έρευνα εξέτασε τρία από τα πιο διαδεδομένα γλωσσικά μοντέλα: το GPT-4o, το Llama 3 και το Command R+. Οι 1.298 συμμετέχοντες χωρίστηκαν σε ομάδες — κάποιοι χρησιμοποίησαν ένα από τα τρία μοντέλα, ενώ η ομάδα ελέγχου αξιοποίησε παραδοσιακές πηγές, όπως αναζήτηση στο διαδίκτυο ή επίσημες ιστοσελίδες υπηρεσιών υγείας. Κάθε συμμετέχων έπρεπε να εκτελέσει δύο βήματα: να αναγνωρίσει ποιες παθήσεις σχετίζονται με τα δοθέντα συμπτώματα και να αποφασίσει ποια ενέργεια χρειάζεται — παραμονή στο σπίτι, επίσκεψη σε γιατρό, προσέλευση στα επείγοντα ή κλήση ασθενοφόρου. Τα σενάρια είχαν σχεδιαστεί από γιατρούς ώστε να αντανακλούν αληθινές, καθημερινές ιατρικές καταστάσεις.

Τα αποτελέσματα ήταν αποκαλυπτικά. Τα γλωσσικά μοντέλα, όταν λειτουργούσαν αυτόνομα με πλήρη και σαφή δεδομένα, εντόπισαν σχετικές παθήσεις στο 94,9% των περιπτώσεων. Ωστόσο, όταν έπρεπε να προτείνουν τη σωστή ενέργεια — δηλαδή να απαντήσουν στο κρίσιμο ερώτημα «τι κάνω τώρα;» — η ακρίβεια έπεφτε δραματικά στο 56,3%. Η διαφορά αυτή αποδεικνύει ότι η γνώση μιας ασθένειας και η ικανότητα καθοδήγησης ενός ασθενούς είναι δύο διαφορετικά πράγματα. Στο δεύτερο, τα μοντέλα αποδείχθηκαν πολύ λιγότερο αξιόπιστα.

Ακόμα πιο ανησυχητικά ήταν τα ευρήματα όταν τα μοντέλα χρησιμοποιήθηκαν από πραγματικούς χρήστες. Οι συμμετέχοντες που αξιοποίησαν τα γλωσσικά μοντέλα δεν κατέγραψαν καλύτερες επιδόσεις από την ομάδα ελέγχου. Μάλιστα, στην αναγνώριση πιθανών παθήσεων είχαν χειρότερα αποτελέσματα από εκείνους που χρησιμοποίησαν παραδοσιακές πηγές πληροφόρησης. Στο κρίσιμο ερώτημα «τι πρέπει να κάνω τώρα;», δεν καταγράφηκε καμία στατιστικά σημαντική βελτίωση σε σύγκριση με την ομάδα ελέγχου.

Γιατί η τεχνητή νοημοσύνη αποτυγχάνει ως ιατρική συμβουλή

Το βασικό συμπέρασμα της έρευνας είναι ότι το πρόβλημα δεν εντοπίζεται αποκλειστικά στις δυνατότητες της τεχνητής νοημοσύνης, αλλά στην ίδια τη φύση της αλληλεπίδρασης ανθρώπου-μηχανής. Ο μέσος χρήστης χωρίς ιατρικές γνώσεις δεν γνωρίζει αναγκαστικά ποια συμπτώματα να αναφέρει, πόσο λεπτομερής να είναι ή πώς να αξιολογήσει κριτικά την απάντηση που λαμβάνει. Το σύστημα λαμβάνει ελλιπείς ή ανακριβείς πληροφορίες και οδηγεί τον χρήστη σε αποφάσεις που μπορεί να αποδειχτούν λανθασμένες — ιδίως σε καταστάσεις που απαιτούν άμεση ιατρική παρέμβαση. Πρόκειται για μια αλυσίδα πιθανών αποτυχιών που ξεκινάει από τον άνθρωπο και ενισχύεται από τη μηχανή.

Η δημοσίευση αυτή στο Nature Medicine έρχεται σε μια στιγμή που η χρήση chatbot για ιατρικές ερωτήσεις αυξάνεται ταχύτατα παγκοσμίως. Τα μεγάλα γλωσσικά μοντέλα όπως το GPT-4o πετυχαίνουν εντυπωσιακές επιδόσεις σε ιατρικές εξετάσεις και παράγουν πειστικές απαντήσεις που δίνουν την αίσθηση βαθιάς κατανόησης. Αυτή ακριβώς η πειστικότητα ενδέχεται να είναι επικίνδυνη: ενισχύει την εμπιστοσύνη του χρήστη χωρίς να εγγυάται την ορθότητα της καθοδήγησης. Πολλοί πολίτες στρέφονται ήδη στην τεχνητή νοημοσύνη αντί για γιατρό, θεωρώντας ότι λαμβάνουν αξιόπιστη ιατρική συμβουλή.

Η ίδια η έρευνα τονίζει ότι η προβληματική δεν αφορά αν η τεχνητή νοημοσύνη ως ιατρική συμβουλή μπορεί να λειτουργήσει κάποτε, αλλά αν λειτουργεί σήμερα, στα χέρια του μέσου πολίτη. Τα δεδομένα από τους 1.298 συμμετέχοντες στο Ηνωμένο Βασίλειο απαντούν αρνητικά. Η διαφορά μεταξύ ιατρικής γνώσης και ικανότητας καθοδήγησης ασθενών αποδεικνύεται κρίσιμη, και τα τρέχοντα γλωσσικά μοντέλα δεν έχουν ακόμα καλύψει αυτό το χάσμα.

Η τεχνητή νοημοσύνη αποτυγχάνει ως ιατρικός σύμβουλος

Περιεχόμενα Άρθρου

Τα ευρήματα της μελέτης στο Nature Medicine

Γιατί η τεχνητή νοημοσύνη αποτυγχάνει ως ιατρική συμβουλή

Σχετικά άρθρα

Η Google περιόρισε πρόσβαση της Meta στο Gemini AI

Τα Meta έξυπνα γυαλιά στο στόχαστρο της ευρωπαϊκής αρχής

Η τεχνητή νοημοσύνη αναζητά φιλοσόφους στη Silicon Valley