논문리뷰 5

Sign Language Transformer

Sign Language Transformers: Joint End-to-end Sign Language Recognition and Translation 수어 번역 KCI를 위해 진행할 연구에서 Baseline으로 사용할 예정인 모델. Sign Language Transformer Abstract gloss 표현을 잘 사용하는 것이 번역 성능을 향상시킨다는 연구에 기반. end-to-end train이 가능하며 CTC손실을 통해 인식(SLR)과 번역(SLT) 문제를 단일 통합 아키텍쳐로 묶음. GT의 수화 동작의 시작 및 끝 타이밍에 대한 정보가 없이도 인식, 번역을 동시에 해결할 수 있어 더 효율적인 학습이 가능함. 이런 공동 접근 방식은 PHOENIX2014T 데이터셋에 대해 21.8의 BLEU4 ..

논문리뷰 2024.02.15

Progressive GAN (PGGAN)

Abstract 기존의 GAN 모델에서 generator, discriminator를 점진적으로 학습시키는 방법론을 제안했다고 한다. 이 방법은 저화질의 데이터에서 고화질의 데이터로 해상도를 점진적으로 늘렸다고 한다. 이렇게 됨으로서 generator와 discriminator 사이의 unhealthy한 경쟁을 줄임으로서 학습이 잘 되게 만들고, GAN으로 생성된 이미지가 더 좋은 화질의 결과를 만들 수 있게 했다고 한다. Introduction Introduction에서는 기존 생성 모델에 대한 한계점을 나열했다. Autoregressive model -PixelCNN의 경우 선명한 이미지를 생성하지만 지나치게 이 과정이 느리고, VAE의 경우 학습이 쉽지만 모델에 있는 제약 때문에 blur가 많은 이..

Generative Adversarial Nets (GAN)

생성모델의 시초인 GAN. 생성 모델을 공부하기 위해서는 꼭 알아야 할 개념이기에 가장 기본적인 GAN에 대한 정리 Abstract Generative model G와 discriminative model D를 사용해 두 가지 모델을 동시에 학습하는 generative model을 추정한다. G : 입력 정보를 바탕으로 가상의 결과물을 만듦 (도둑) D : G가 아닌 훈련 데이터에서 샘플이 나왔을 확률을 추정한다. (경찰) G는 임의의 노이즈를 통해 훈련 데이터와 같은 분포의 가상 데이터를 생성하며 D는 해당 이미지가 생성된 이미지인지 훈련 데이터의 이미지인지 판단할 확률이 1/2가 될때까지 학습한다. (구별할 수 없음) Introduction Generative model G 는 위조 지폐를 걸리지 않..

논문리뷰 2023.04.22