Η Microsoft επέλεξε την παγκοσμίως γνωστή εικόνα της Μόνα Λίζα του Λεονάρντο ντα Βίντσι για να δείξει τις δυνατότητες του VASA-1, το νέο της εργαλείο τεχνητής νοημοσύνης. Το εργαλείο αυτό έχει την ικανότητα να συνδυάζει μια φωτογραφία προσώπου με ηχητικό υλικό από άλλο άτομο, δημιουργώντας ένα βίντεο όπου το πρόσωπο στην εικόνα φαίνεται να τραγουδάει ρεαλιστικά.
Για τη δημιουργία ενός τέτοιου βίντεο με τη Μόνα Λίζα, οι ερευνητές της Microsoft χρησιμοποίησαν τη φωνή της Άνν Χάθαγουεϊ που ερμήνευε το τραγούδι Paparazzi με έναν χιουμοριστικό τρόπο. Το VASA-1 έχει σχεδιαστεί για να αναλύει διάφορες κινήσεις του προσώπου, όπως τα χείλη, τις εκφράσεις, το βλέμμα και το άνοιγμα και κλείσιμο των ματιών.
Γενικότερα, παρατηρούμε μια αγάπη στη Μόνα Λίζα ειδικά όταν πρόκειται να την “πειράξουν” με την τεχνητή νοημοσύνη. Δεν είναι αυτή η πρώτη φορά που δοκιμάζουν την τεχνολογία στην ξακουστή Τζοκόντα!
Παρόλο που το εργαλείο αυτό έγινε γνωστό, η Microsoft δεν προγραμματίζει να το κυκλοφορήσει ακόμα στο ευρύ κοινό.
Microsoft just dropped VASA-1.
This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba
10 wild examples:
1. Mona Lisa rapping Paparazzi pic.twitter.com/LSGF3mMVnD
— Min Choi (@minchoi) April 18, 2024
Γεια σου φίλη! Είμαι η Μάρθα Κατσαρού με τάση να εκφράζομαι μέσα από τη μαγεία της γραφής. Το ακαδημαϊκό μου ταξίδι με πήγε από τον κόσμο της Διοίκησης Επιχειρήσεων στη Σχολή Επικοινωνίας και ΜΜΕ του ΕΚΠΑ, όπου απέκτησα το μεταπτυχιακό μου στη Δημοσιογραφία. Από τα πρώτα μου χρόνια, ανακάλυψα ότι η αληθινή μου φωνή αντηχεί πιο εύγλωττα στον γραπτό λόγο παρά στον προφορικό. Γι’ αυτό και από τους αριθμούς βρέθηκα να «μπλέκομαι» με τα γράμματα, για να επικεντρωθώ στο πάθος μου για το lifestyle. Μόδα, ομορφιά, διακόσμηση ήταν τα θέματα που πάντα με γοήτευαν ως αναγνώστρια. Πλέον, οπλισμένη με όρεξη, ταξιδεύω με τις δικές μου ιδέες και σκέψεις που μοιράζομαι μαζί σου. Θα γίνεις συνταξιδιώτης μου;