Η Μόνα Λίζα κοίταξε: Η μηχανική μάθηση φέρνει στη ζωή τους παλιές ζωγραφιές και φωτογραφίες

Η Μόνα Λίζα κοίταξε: Η μηχανική μάθηση φέρνει στη ζωή τους παλιές ζωγραφιές και φωτογραφίες


Οι ερευνητές μηχανικής μάθησης έχουν δημιουργήσει ένα σύστημα που μπορεί να αναδημιουργήσει μια ζωντανή κίνηση από ένα μόνο πλαίσιο του προσώπου του προσώπου, ανοίγοντας έτσι τη δυνατότητα να μην κινούνται μόνο οι φωτογραφίες αλλά και οι πίνακες ζωγραφικής. Δεν είναι τέλειο, αλλά όταν δουλεύει, είναι – όπως πολλοί AI εργάζονται αυτές τις μέρες – απόκοσμες και συναρπαστικές

Το μοντέλο τεκμηριώνεται σε ένα έγγραφο που δημοσιεύτηκε από το Samsung AI Centre, το οποίο μπορείτε να διαβάσετε εδώ στο Arxiv . Είναι μια νέα μέθοδος εφαρμογής ορόσημων προσώπου σε πρόσωπο πηγαίου κώδικα – οποιοδήποτε κεφάλι ομιλίας θα κάνει – στα δεδομένα του προσώπου ενός προσώπου στόχου, καθιστώντας το πρόσωπο στόχο να κάνει αυτό που κάνει η πηγή

Αυτό από μόνο του δεν είναι καινούργιο – (19459006) είχαμε μια ενδιαφέρουσα συζήτηση για αυτό πρόσφατα στο συμβάν της Robotics + AI στο Berkeley ). Μπορούμε ήδη να φτιάξουμε ένα πρόσωπο σε ένα βίντεο να αντανακλά το πρόσωπο σε ένα άλλο από την άποψη του τι λέει ο άνθρωπος ή από πού κοιτάζουν. Αλλά τα περισσότερα από αυτά τα μοντέλα απαιτούν ένα σημαντικό όγκο δεδομένων, για παράδειγμα ένα λεπτό ή δύο βίντεο που θα αναλυθούν.

Το νέο έγγραφο των ερευνητών με έδρα τη Μόσχα της Samsung, ωστόσο, δείχνει ότι χρησιμοποιώντας μόνο μία εικόνα ενός Το πρόσωπο αυτό μπορεί να δημιουργήσει ένα βίντεο που στρέφει, μιλάει και κάνει συνηθισμένες εκφράσεις – με πειστική αλλά όχι άψογη πιστότητα

Το κάνει αυτό με την προεπεξεργασία της διαδικασίας αναγνώρισης ορόσημων του προσώπου με τεράστιο όγκο δεδομένων, κάνοντας το μοντέλο είναι πολύ αποδοτικό στην εύρεση των τμημάτων του προσώπου στόχου που αντιστοιχούν στην πηγή. Όσο περισσότερα δεδομένα διαθέτει, τόσο το καλύτερο, αλλά μπορεί να το κάνει με μια εικόνα – που ονομάζεται μάθηση με ένα μόνο πλάνο – και να ξεφύγουμε από αυτό. Αυτό είναι που επιτρέπει να τραβήξετε μια φωτογραφία του Einstein ή της Marilyn Monroe, ή ακόμα και της Mona Lisa, και να την μετακινήσετε και να μιλήσετε σαν ένα πραγματικό πρόσωπο

Σε αυτό το παράδειγμα, η Mona Lisa ζωντανεύει χρησιμοποιώντας τρία διαφορετικά βίντεο πηγής, τα οποία όπως βλέπετε παράγουν πολύ διαφορετικά αποτελέσματα, τόσο στη δομή του προσώπου όσο και στη συμπεριφορά.

Χρησιμοποιεί επίσης αυτό που ονομάζεται Generative Adversarial Network , το οποίο ουσιαστικά σαρώνει τα δύο μοντέλα το ένα από το άλλο, το ένα που προσπαθεί να ξεγελάσει το άλλο για να σκεφτεί τι δημιουργεί είναι «πραγματικό». Με αυτά τα μέσα τα αποτελέσματα πληρούν ένα ορισμένο επίπεδο ρεαλισμού που θέτουν οι δημιουργοί – το μοντέλο «διακρίσεων» , δηλαδή το 90% σίγουρο ότι αυτό είναι ένα ανθρώπινο πρόσωπο για να συνεχιστεί η διαδικασία.

Στα άλλα παραδείγματα που παρέχουν οι ερευνητές, η ποιότητα και η προφανότητα του ψεύτικου κεφαλιού μιλούν ποικίλες. Κάποιοι, οι οποίοι επιχειρούν να αναπαράγουν ένα πρόσωπο του οποίου η εικόνα είχε ληφθεί από καλωδιακά νέα, αναδημιουργούν επίσης τον τίτλο ειδήσεων που εμφανίζεται στο κάτω μέρος της εικόνας, γεμίζοντας το με τρελό. Και οι συνηθισμένες κηλίδες και τα περίεργα αντικείμενα είναι πανταχού παρόντα, αν ξέρετε τι να αναζητήσετε.

Τούτου λεχθέντος, είναι αξιοσημείωτο ότι λειτουργεί τόσο καλά όσο κάνει. Σημειώστε, ωστόσο, ότι αυτό λειτουργεί μόνο στο πρόσωπο και στον άνω κορμό – δεν θα μπορούσατε να κάνετε τη Mona Lisa να χτυπήσει τα δάχτυλά της ή να χορέψει. Όχι ακόμα, ούτως ή άλλως.

>Μεταφρασμένο από την Google <
Source link

Αφήστε ένα σχόλιο

Αυτός ο ιστότοπος χρησιμοποιεί το Akismet για να μειώσει τα ανεπιθύμητα σχόλια. Μάθετε πώς υφίστανται επεξεργασία τα δεδομένα των σχολίων σας.