slashCAM
Administrator
Administrator
Beiträge: 11264

Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von slashCAM »


Eine Forschungsgruppe bei Microsoft hat ein neues KI-Framework namens VASA-1 vorgestellt, das die Generierung lebensechter, sprechender Gesichter mit auffällig ansprechen...
Bild
Hier geht es zur Newsmeldung auf den slashCAM Magazin-Seiten:
Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei



Frank Glencairn
Beiträge: 23718

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Mit Ton:

Sapere aude - de omnibus dubitandum



7River
Beiträge: 3817

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Schon beeindruckend. Könnte man so etwas nicht in der Kriminaltechnik einsetzen? Gerade in den USA sind die was Genetik und Aussehen von Menschen angeht viel weiter. Hier fällt das unter Datenschutz.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



Frank Glencairn
Beiträge: 23718

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

Was schwebt dir da vor? Sprechende Steckbriefe?
Sapere aude - de omnibus dubitandum



Tscheckoff
Beiträge: 1283

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Tscheckoff »

Genau. Ein rappender Steckbrief ala ^^:
https://x.com/froggyups/status/1780865913627283767
Falls sich wer für zu lange Technik-Videos interessiert ^^: https://www.youtube.com/user/AustrianGeek
Zur Info: Mit (*) markierte bzw. "amzn.to"-Links sind Affiliate- bzw. Werbelinks (!)



7River
Beiträge: 3817

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



MK
Beiträge: 4361

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von MK »

7River hat geschrieben: Do 18 Apr, 2024 17:15 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.

Klar, wenn der Täter ein Passbild am Tatort hinterlässt... in der Überschrift des Artikels fehlt folgendes:


Das Framework benötigt als Input lediglich ein statisches Bild und einen Sprach-Audioclip als Eingabe.



Frank Glencairn
Beiträge: 23718

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von Frank Glencairn »

7River hat geschrieben: Do 18 Apr, 2024 20:08 Gesichtsrekonstruktion, Phantombilder oder Forensic DNA Phenotyping.
Was hat all das mit sprechenden Passbildern zu tun?
Die Gesichter werden ja nicht erzeugt, sondern nur per Audio Aufzeichnung animiert.

Und was DNA Phenotyping betrifft:
Besides pigmentation traits, no molecular prediction tests are currently available for any other EVCs due to limited knowledge on genes and predictive DNA markers.
Sapere aude - de omnibus dubitandum



7River
Beiträge: 3817

Re: Microsoft VASA-1 generiert realistische Video-Portraits aus einer Audiodatei

Beitrag von 7River »

Entschuldigung für meinen unqualifizierten Kommentar. Ich bin da weit abgeschweift.
„Wissen Sie, Ryback, aussehen tut's köstlich. Aber riechen tut's wie Schweinefraß. Ich hab' Ihren Scheiß lang genug geduldet. Nur weil der Captain die Art liebt, wie Sie kochen. Aber dieses eine Mal ist er nicht hier und wird Ihnen nicht helfen können.“



 Aktuelle Beiträge [alle Foren]
 
» Was schaust Du gerade?
von klusterdegenerierung - Sa 22:31
» Lumix S FF Kameras und der APS-C Modus is amazing and magic ;)
von soulbrother - Sa 22:31
» Sony A7S III erste Erfahrungen, Bugs, Problemlösungen,...
von Axel - Sa 21:42
» Achtung vor dem Totalausfall: SanDisk Extreme Portable SSDs löschen manchmal Daten
von nicecam - Sa 21:22
» Was hast Du zuletzt gekauft?
von klusterdegenerierung - Sa 18:26
» Neues Kabel oder 2. Kopfhörer?
von klusterdegenerierung - Sa 18:25
» CinePI RAW-Cine Kamera auf Raspberry Pi Basis mit hoher Dynamik
von medienonkel - Sa 16:03
» Werbung - es geht auch gut ;) Sammelthread
von MK - Sa 15:52
» SmallRig stellt Heavy-Duty Carbon Fiber Stativ-Kit AD-120 vor
von freezer - Sa 15:51
» Auftragslage weiter Rückläufig?
von iasi - Sa 13:43
» Prores Codec doch Käse?
von acrossthewire - Sa 13:08
» De-Ageing und Face-Swapping für Hollywood-Filme jetzt in Echtzeit mit KI?
von slashCAM - Sa 11:27
» **Suchanfrage: 35mm-Filmaufnahmen von Autowerbungen vor 1990 gesucht**
von Frank Glencairn - Sa 8:52
» Neue Canon EOS R1 Gerüchte - Schneller Rolling Shutter und 15 Blenden Dynamik
von iasi - Sa 8:15
» Lumix G9M2
von Darth Schneider - Fr 23:10
» -SONY FX- Erfahrungsaustausch
von klusterdegenerierung - Fr 21:00
» Discount auf die Cinema 6K
von iasi - Fr 15:39
» Bringt Canon eine neu Cinema Box Kamera? (05. Juni 2024)
von iasi - Fr 14:01
» Adobe Premiere Pro v24.4.1 erschienen mit neuen Audio-Workflows
von MK - Fr 10:28
» Canon EOS R5 Mark II: Erste Spezifikationen aufgetaucht?
von pillepalle - Fr 7:30
» Möchte ich Outdoor-Kameramann werden?!
von Alex - Fr 7:28
» Rot ist eigentlich nicht meine Farbe
von klusterdegenerierung - Fr 0:13
» Was hörst Du gerade?
von klusterdegenerierung - Fr 0:08
» Guten Abend, ich wollte fragen ob jemand weiß ob die DJI Osmo Action 3 oder 4 mit dem Feiyu Tech WG2X gimbal kompatibel
von -paleface- - Do 22:01
» i can't do this on youtube anymore
von klusterdegenerierung - Do 21:45
» DJI Osmo Action 3/4 kompatibel mit dem Feiyu Tech WG2X gimbal?
von xswiftiii - Do 20:49
» DJI Osmo Action 3/4 kompatibel mit dem Feiyu Tech WG2X gimbal?
von xswiftiii - Do 20:48
» Kostendruck
von rob - Do 19:24
» Canon Legria GX10
von Herbie - Do 16:18
» Neues Catalyst Browse update!
von klusterdegenerierung - Do 15:55
» MANIFEST für einen neuen öffentlich-rechtlichen Rundfunk in Deutschland
von Bildlauf - Do 14:49
» Nikon Z6II - Top-Zustand
von soulbrother - Do 11:33
» Inferno Gamut Frage
von Frank Glencairn - Do 11:20
» Kostendruck in Produktionen
von iasi - Do 11:08
» Virtuelle Figuren mit KI - Autodesk übernimmt Macher von Wonder Studio
von macaw - Do 10:40