본문 바로가기
반응형
반응형

ML | DL/딥러닝 논문4

반응형
PBNS(Physically Based Neural Simulation for Unsupervised Outfit Pose Space Deformation) 논문 리뷰 introduce 이번에 소개할 PBNS은 제가 회사에서 의류 3D 관련 프로젝트를 하면서 읽게된 논문 입니다. SMPL의 다양한 자세에서 의류가 신체에 맞춰질 수 있도록 학습하는 모델입니다. 기본적으로 3D mesh에 대한 이해도가 있어야 읽을 수 있기 때문에 미리 공부하시고 읽으시면 좋습니다. Abstract 본 논문은 딥러닝을 활용하여 PSD(Pose Space Deformation)를 통한 의류 시뮬레이션의 새로운 방법론을 제시합니다. 고전적인 PBS(Physically Based Simulations) 방식은 우수한 결과를 제공하지만 장면 수정 시에 계산 비용이 많이 드는 단점이 있습니다. 이에 반해, 본 논문에서 제안하는 LBS(Linear Blend Skinning)을 사용한 PSD 방식은 .. 2024. 4. 11.
CLIP(Contrastive Language-Image Pre-Training) 논문 리뷰 introduce 이번에 소개할 CLIP 모델은 OpenAI가 개발한 인공지능 기술로, "Contrastive Language–Image Pre-training"의 약자입니다. 이 모델은 대량의 이미지와 텍스트 데이터를 함께 학습함으로써, 이미지를 설명하는 텍스트를 이해하고, 반대로 텍스트로부터 이미지 내용을 예측할 수 있는 있으며, 강력한 zero-shot 능력을 가지고 있습니다. Abstract 기존의 최신 기술(SOTA) 컴퓨터 비전 태스크들은 지정된 클래스 카테고리에서만 훈련이 가능했습니다. 이러한 방식은 각각의 비전 태스크마다 새로운 레이블 데이터를 추가해야 했기 때문에, 일반화와 유용성에 제한을 받았습니다. 이미지에 대한 텍스트를 직접 학습하는 것은 더 많은 훈련 자원 을 활용할 수 있게 하므.. 2024. 4. 11.
BlazePose: On-device Real-time Body Pose tracking 리뷰 pose estimation 프로젝트를 진행하다 mediapipe라는 프레임워크를 알게되었다. 나같은 경우에는 여러 사람을 multi tracking 하는게 아닌 한 사람만 감지하는 single tracking 이 필요했고 mediapipe blazepose는 나의 프로젝트에 딱 맞는 모델이였다. 또한 대중적인 모델인 posenet보다 더욱 뛰어난 성능을 보여 인상적인 모델이여서 논문을 찾아보게 되었다.. Abstract 구글에서 인간 포즈 추정의 lightweight convolutional neural network architecture blazepose를 제시하였다. 모바일 디바이스에 대한 실시간 inference를 위해 제작된 모델이며 한 사람에 대한 33개의 keypoint를 추정한다. 해당 .. 2022. 3. 18.
Few-Shot Adversarial Learning of Realistic Neural Talking Head Models 간단해석 * 해당 코드를 참고하면서 논문을 읽으면 이해하는데 도움이 됨 github.com/vincent-thevenin/Realistic-Neural-Talking-Head-Models vincent-thevenin/Realistic-Neural-Talking-Head-Models My implementation of Few-Shot Adversarial Learning of Realistic Neural Talking Head Models (Egor Zakharov et al.). - vincent-thevenin/Realistic-Neural-Talking-Head-Models github.com 1. Introduction 2019년 5월에 모스크바의 Samsung AI Centor 에서 발표한 논문이다... 2021. 3. 25.
반응형