마이크로소프트는 VISA-1이라는
사진 한장과 음성샘플만 있으면
말하는 영상을 만드는 AI를 발표했는데
현재는 연구팀만 사용 가능하다고 하지만
노래 부르는 것도 가능하고
모나리자같은 그림에도 적용됨
이 모델은 512x512 픽셀이미지를 초당 45프레임으로 만드는 작업에
데스크탑의 엔비디아 RTX 4090 GPU로
2분이 소요되고
온라인(실시간)은 40fps가 생성 가능하다고 함
[7]
다나의 슬픔 | 15:08 | 조회 0 |루리웹
[5]
고구마버블티 | 15:08 | 조회 0 |루리웹
[8]
웃긴것만 올림 | 15:05 | 조회 0 |루리웹
[28]
밍먕밀먕밍먕먕 | 15:02 | 조회 0 |루리웹
[48]
Fanatic_ | 14:59 | 조회 0 |루리웹
[12]
제이드나 | 14:58 | 조회 0 |루리웹
[8]
루리웹-7159661996 | 14:55 | 조회 0 |루리웹
[28]
루리웹-9933504257 | 14:47 | 조회 0 |루리웹
[11]
나만정상인 | 14:57 | 조회 0 |루리웹
[13]
사쿠라치요. | 14:56 | 조회 0 |루리웹
[3]
루리웹-381579425 | 14:55 | 조회 0 |루리웹
[12]
잭 그릴리쉬 | 14:53 | 조회 0 |루리웹
[36]
제로음료냉장고 | 14:52 | 조회 0 |루리웹
[21]
리틀리리컬보육원장 | 14:51 | 조회 0 |루리웹
[18]
탕수육에소스부엉 | 14:51 | 조회 0 |루리웹
댓글(2)
다메다메~ 다메요~ 다메 나노요~
겜 같은거 일러 한장으로 다 해먹을 수 있단거네