Ρομπότ σκύλος μαθαίνει να περπατά σε μία ώρα

Νέα

Περίληψη: Ένας νέος αλγόριθμος εκμάθησης εκπαιδεύει έναν ρομποτικό σκύλο να περπατά μέσα σε μία ώρα, αναφέρουν ερευνητές.

Μια νεογέννητη καμηλοπάρδαλη πρέπει να μάθει να περπατά στα πόδια της όσο πιο γρήγορα γίνεται για να αποφύγει τα αρπακτικά. Τα ζώα γεννιούνται με δίκτυα μυϊκού συντονισμού που βρίσκονται στο νωτιαίο μυελό τους. Ωστόσο, η εκμάθηση του ακριβούς συντονισμού των μυών των ποδιών και των τενόντων απαιτεί κάποιο χρόνο. Αρχικά, τα μωρά ζώα βασίζονται σε μεγάλο βαθμό στα ενσύρματα αντανακλαστικά του νωτιαίου μυελού.

Αν και είναι κάπως πιο βασικά, τα αυτόματα αντανακλαστικά ελέγχου βοηθούν το ζώο να αποφύγει να πέσει και να τραυματιστεί κατά τις πρώτες του προσπάθειες περπατήματος.

Πρέπει να εξασκηθεί ο παρακάτω, πιο προηγμένος και ακριβής έλεγχος των μυών, έως ότου τελικά το νευρικό σύστημα προσαρμοστεί καλά στους μύες και τους τένοντες των ποδιών του νεαρού ζώου. Τέρμα τα ανεξέλεγκτα παραπάτημα – το νεαρό ζώο μπορεί πλέον να συμβαδίζει με τους ενήλικες.

Ερευνητές στο Ινστιτούτο Μαξ Πλανκ για Ευφυή Συστήματα (MPI-IS) στη Στουτγάρδη διεξήγαγαν μια ερευνητική μελέτη για να ανακαλύψουν πώς τα ζώα μαθαίνουν να περπατούν και μαθαίνουν από το παραπάτημα. Κατασκεύασαν ένα τετράποδο ρομπότ, σε μέγεθος σκύλου, που τους βοήθησε να καταλάβουν τις λεπτομέρειες.

«Ως μηχανικοί και ρομποτικοί, αναζητήσαμε την απάντηση κατασκευάζοντας ένα ρομπότ που έχει αντανακλαστικά όπως ένα ζώο και μαθαίνει από τα λάθη», λέει ο Felix Ruppert, πρώην διδακτορικός φοιτητής στην ερευνητική ομάδα Dynamic Locomotion στο MPI-IS.

«Αν ένα ζώο σκοντάψει, είναι λάθος; Όχι αν συμβεί μια φορά. Αλλά αν σκοντάφτει συχνά, μας δίνει ένα μέτρο για το πόσο καλά περπατάει το ρομπότ».

Ο Felix Ruppert είναι ο πρώτος συγγραφέας του βιβλίου ” Learning Plastic Matching of Robot Dynamics in Closed-Loop Central Pattern Generators “, το οποίο θα δημοσιευτεί στις 18 Ιουλίου 2022 στο έγκριτο περιοδικό Nature Machine Intelligence .

Ο αλγόριθμος εκμάθησης βελτιστοποιεί τον εικονικό νωτιαίο μυελό

Αφού έμαθε να περπατά σε μόλις μία ώρα, το ρομπότ του Ράπερτ κάνει καλή χρήση της πολύπλοκης μηχανικής των ποδιών του. Ένας Μπεϋζιανός αλγόριθμος βελτιστοποίησης καθοδηγεί τη μάθηση: οι μετρημένες πληροφορίες του αισθητήρα ποδιού αντιστοιχίζονται με δεδομένα στόχου από τον μοντελοποιημένο εικονικό νωτιαίο μυελό που εκτελείται ως πρόγραμμα στον υπολογιστή του ρομπότ.

Το ρομπότ μαθαίνει να περπατά συγκρίνοντας συνεχώς αποσταλμένες και αναμενόμενες πληροφορίες αισθητήρα, τρέχοντας αντανακλαστικούς βρόχους και προσαρμόζοντας τα μοτίβα ελέγχου του κινητήρα του.

Ο αλγόριθμος εκμάθησης προσαρμόζει τις παραμέτρους ελέγχου μιας κεντρικής γεννήτριας προτύπων (CPG). Σε ανθρώπους και ζώα, αυτές οι κεντρικές γεννήτριες προτύπων είναι δίκτυα νευρώνων στο νωτιαίο μυελό που παράγουν περιοδικές μυϊκές συσπάσεις χωρίς είσοδο από τον εγκέφαλο.

Τα δίκτυα γεννήτριας κεντρικών μοτίβων βοηθούν στη δημιουργία ρυθμικών εργασιών όπως το περπάτημα, το κλείσιμο των ματιών ή η πέψη. Επιπλέον, τα αντανακλαστικά είναι ακούσιες κινητικές ενέργειες ελέγχου που προκαλούνται από σκληρά κωδικοποιημένες νευρικές οδούς που συνδέουν αισθητήρες στο πόδι με τον νωτιαίο μυελό.

Εφόσον το νεαρό ζώο περπατά σε μια τέλεια επίπεδη επιφάνεια, τα CPG μπορούν να επαρκούν για τον έλεγχο των σημάτων κίνησης από το νωτιαίο μυελό. Ένα μικρό χτύπημα στο έδαφος, όμως, αλλάζει τη βόλτα. Τα αντανακλαστικά μπαίνουν και προσαρμόζουν τα μοτίβα κίνησης για να μην πέσει το ζώο.

Αυτές οι στιγμιαίες αλλαγές στα σήματα κίνησης είναι αναστρέψιμες ή «ελαστικές» και τα μοτίβα κίνησης επιστρέφουν στην αρχική τους διαμόρφωση μετά τη διαταραχή. Αλλά αν το ζώο δεν σταματήσει να σκοντάφτει μετά από πολλούς κύκλους κίνησης – παρά τα ενεργά αντανακλαστικά – τότε τα μοτίβα κίνησης πρέπει να ξαναμάθουν και να γίνουν «πλαστικά», δηλαδή μη αναστρέψιμα. Στο νεογέννητο ζώο, τα CPG αρχικά δεν έχουν ακόμη προσαρμοστεί αρκετά καλά και το ζώο σκοντάφτει, τόσο σε ομοιόμορφο όσο και σε ανώμαλο έδαφος. Αλλά το ζώο μαθαίνει γρήγορα πώς τα CPG και τα αντανακλαστικά του ελέγχουν τους μύες και τους τένοντες των ποδιών.

Το ίδιο ισχύει και για το ρομπότ-σκύλο μεγέθους Λαμπραντόρ που ονομάζεται «Morti». Ακόμη περισσότερο, το ρομπότ βελτιστοποιεί τα μοτίβα κινήσεών του πιο γρήγορα από ένα ζώο, σε περίπου μία ώρα. Το CPG του Morti προσομοιώνεται σε έναν μικρό και ελαφρύ υπολογιστή που ελέγχει την κίνηση των ποδιών του ρομπότ.

Αυτός ο εικονικός νωτιαίος μυελός τοποθετείται στην πλάτη του τετράποδου ρομπότ εκεί που θα ήταν το κεφάλι. Κατά τη διάρκεια της ώρας που χρειάζεται για το ρομπότ να περπατήσει ομαλά, τα δεδομένα αισθητήρων από τα πόδια του ρομπότ συγκρίνονται συνεχώς με την αναμενόμενη πτώση που προβλέπεται από το CPG του ρομπότ. Εάν το ρομπότ σκοντάφτει, ο αλγόριθμος εκμάθησης αλλάζει πόσο μακριά αιωρούνται τα πόδια εμπρός και πίσω, πόσο γρήγορα αιωρούνται τα πόδια και πόσο μήκος είναι ένα πόδι στο έδαφος.

Η προσαρμοσμένη κίνηση επηρεάζει επίσης το πόσο καλά το ρομπότ μπορεί να χρησιμοποιήσει τους συμβατούς μηχανισμούς ποδιών του. Κατά τη διάρκεια της μαθησιακής διαδικασίας, το CPG στέλνει προσαρμοσμένα σήματα κινητήρα, έτσι ώστε το ρομπότ πλέον να σκοντάφτει λιγότερο και να βελτιστοποιήσει το περπάτημά του.

Σε αυτό το πλαίσιο, ο εικονικός νωτιαίος μυελός δεν έχει ρητή γνώση σχετικά με τον σχεδιασμό των ποδιών του ρομπότ, τους κινητήρες και τα ελατήρια του. Μη γνωρίζοντας τίποτα για τη φυσική του μηχανήματος, του λείπει ένα «μοντέλο» ρομπότ.

«Το ρομπότ μας πρακτικά «γεννιέται» χωρίς να γνωρίζει τίποτα για την ανατομία των ποδιών του ή για το πώς λειτουργούν», εξηγεί ο Ράπερτ.

«Το CPG μοιάζει με μια ενσωματωμένη αυτόματη ευφυΐα περπατήματος που παρέχει η φύση και που έχουμε μεταφέρει στο ρομπότ. Ο υπολογιστής παράγει σήματα που ελέγχουν τους κινητήρες των ποδιών και το ρομπότ αρχικά περπατά και σκοντάφτει.

Μόρτι, ο σκύλος ρομπότ. 

«Τα δεδομένα επιστρέφουν από τους αισθητήρες στον εικονικό νωτιαίο μυελό όπου συγκρίνονται τα δεδομένα αισθητήρα και CPG. Εάν τα δεδομένα του αισθητήρα δεν ταιριάζουν με τα αναμενόμενα δεδομένα, ο αλγόριθμος εκμάθησης αλλάζει τη συμπεριφορά βάδισης μέχρι το ρομπότ να περπατήσει καλά και χωρίς να σκοντάψει. Η αλλαγή της εξόδου CPG διατηρώντας τα αντανακλαστικά ενεργά και η παρακολούθηση του ρομπότ που σκοντάφτει είναι ένα βασικό μέρος της μαθησιακής διαδικασίας.»

Έλεγχος σκύλων ρομπότ αποδοτικής ενέργειας

Ο υπολογιστής του Morti αντλεί μόνο πέντε watt ισχύος κατά τη διαδικασία του περπατήματος. Τα βιομηχανικά τετράποδα ρομπότ από εξέχοντες κατασκευαστές, τα οποία έχουν μάθει να τρέχουν με τη βοήθεια πολύπλοκων ελεγκτών, είναι πολύ πιο πεινασμένα για ενέργεια. Οι ελεγκτές τους κωδικοποιούνται με γνώση της ακριβούς γεωμετρίας μάζας και σώματος του ρομπότ – χρησιμοποιώντας ένα μοντέλο του ρομπότ. Τυπικά αντλούν ισχύ αρκετές δεκάδες, έως και αρκετές εκατοντάδες watt.

Και οι δύο τύποι ρομπότ λειτουργούν δυναμικά και αποτελεσματικά, αλλά η υπολογιστική κατανάλωση ενέργειας είναι πολύ χαμηλότερη στο μοντέλο της Στουτγάρδης. Παρέχει επίσης σημαντικές πληροφορίες για την ανατομία των ζώων.

«Δεν μπορούμε εύκολα να ερευνήσουμε το νωτιαίο μυελό ενός ζωντανού ζώου. Αλλά μπορούμε να μοντελοποιήσουμε ένα στο ρομπότ», λέει ο Alexander Badri-Spröwitz, ο οποίος συνέγραψε τη δημοσίευση με τον Ruppert και είναι επικεφαλής της Ομάδας Έρευνας Dynamic Locomotion.

«Γνωρίζουμε ότι αυτά τα CPG υπάρχουν σε πολλά ζώα. Γνωρίζουμε ότι τα αντανακλαστικά είναι ενσωματωμένα. αλλά πώς μπορούμε να τα συνδυάσουμε και τα δύο ώστε τα ζώα να μάθουν κινήσεις με αντανακλαστικά και CPG; Αυτή είναι η θεμελιώδης έρευνα στο σημείο τομής μεταξύ ρομποτικής και βιολογίας. Το ρομποτικό μοντέλο μας δίνει απαντήσεις σε ερωτήματα που η βιολογία από μόνη της δεν μπορεί να απαντήσει».

Πηγή: neurosciencenews.com. Αναδημοσίευση από το Max Planck Institute

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *