마이크로소프트는 VISA-1이라는
사진 한장과 음성샘플만 있으면
말하는 영상을 만드는 AI를 발표했는데
현재는 연구팀만 사용 가능하다고 하지만
노래 부르는 것도 가능하고
모나리자같은 그림에도 적용됨
이 모델은 512x512 픽셀이미지를 초당 45프레임으로 만드는 작업에
데스크탑의 엔비디아 RTX 4090 GPU로
2분이 소요되고
온라인(실시간)은 40fps가 생성 가능하다고 함
[54]
야솔직히자발라 | 18:02 | 조회 0 |루리웹
[9]
루리웹-6713817747 | 18:01 | 조회 0 |루리웹
[20]
사신군 | 18:01 | 조회 0 |루리웹
[18]
드워프공룡천마 | 17:59 | 조회 0 |루리웹
[16]
요르밍 | 17:58 | 조회 0 |루리웹
[40]
lskhdwqldhsl | 17:57 | 조회 0 |루리웹
[17]
총맞은것처럼_가슴이너무아파 | 17:56 | 조회 0 |루리웹
[14]
DdoAcH | 17:56 | 조회 0 |루리웹
[23]
김이다 | 17:55 | 조회 0 |루리웹
[52]
| 18:05 | 조회 0 |핫게kr
[7]
지역사회발전 | 18:05 | 조회 0 |핫게kr
[10]
애옹 | 18:05 | 조회 0 |핫게kr
[31]
비앙코임호 | 18:05 | 조회 0 |핫게kr
[19]
토나우도 | 17:54 | 조회 0 |루리웹
[8]
메스가키 소악마 | 17:48 | 조회 0 |루리웹
댓글(2)
다메다메~ 다메요~ 다메 나노요~
겜 같은거 일러 한장으로 다 해먹을 수 있단거네